Tag: wget的

强制wget使用实际文件名

在脚本中使用wget从Google文档下载某些文件时,不会保留该文件的名称。 例如: wget ‘http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls’ 将文件保存为pub?key=pyj6tScZqmEfbZyl0qjbiRQ而不是indicatorhivestimatedprevalence15-49.xls ,如果我点击浏览器中的链接,这就是我得到的。 有没有办法在wget强制执行这种“类似浏览器”的行为?

如何让WGET下载与浏览器完全相同的网页html

使用Web浏览器(IE或Chrome),我可以使用Ctl-S保存网页(.html),使用任何文本编辑器进行检查,并以表格格式查看数据。 我要提取的其中一个数字,但对于许多很多网页来说,手动操作太多了。 所以我想使用WGET一个接一个地获取这些网页,并编写另一个程序来解析.html并检索我想要的数字。 但是当使用与浏览器相同的URL时,WGET保存的.html文件不包含数据表。 为什么不? 就好像服务器检测到请求来自WGET而不是来自Web浏览器,并提供缺少数据表的框架网页。 如何使用WGET获得完全相同的网页? – 谢谢! 更多信息: 我正在尝试获取的URL的示例是: http ://performance.morningstar.com/fund/performance-return.action?t=ICENX&region=usa&culture=en-US其中字符串ICENX是共同基金股票代码符号,我将改为任何一个不同的股票代码。 这会在浏览器中查看时下载数据表,但如果使用WGET获取,则会丢失数据表。

使用Wget获取“权限被拒绝错误”

我在我的Ubuntu 11.04(Natty Narwhal)上安装了LAMP堆栈 sudo apt-get install lamp-server^ 现在我导航到/var/www并使用 wget http://ftp.drupal.org/files/projects/drupal-7.x-dev.tar.gz 我收到以下错误。 –2011-08-03 13:59:00– http://ftp.drupal.org/files/projects/drupal-7.x-dev.tar.gz Resolving ftp.drupal.org… 64.50.233.100, 64.50.236.52 Connecting to ftp.drupal.org|64.50.233.100|:80… connected. HTTP request sent, awaiting response… 200 OK Length: 2757101 (2.6M) [application/x-gzip] drupal-7.x-dev.tar.gz: Permission denied Cannot write to `drupal-7.x-dev.tar.gz’ (Permission denied). 我该如何解决这个错误? 我试图在下载文件夹中下载相同的文件,它继续没有问题。 所以它似乎是一些许可错误,但我不确定或如何解决它。

从列表中下载文件

如何使用wget或其他一些自动方式下载文件(文本文件中列出的文件)? 示例文件列表: www.example.com/1.pdf www.example.com/2.pdf www.example.com/3.pdf

如何为wget提供用户名和密码?

我试图通过wget连接到服务器: wget http://:@serveradress 但是wget响应:无效的端口 我知道服务器接受端口80的传入流量。如何解决此问题?