python爬虫前奏

在浏览器中发送一个http请求的过程:

1.当用户在浏览器的地址栏中输入一个URL并按回车键之后,浏览器会向HTTP服务器发送HTTP请求。HTTP请求主要分为”Get”和”Post”两种方法。

2.当我们在浏览器输入URL htp://www baidu .com的时候,浏览器发送-个Request请求去获取htp:/www baidu com的html文件,服务器把Response文件对象发送回给浏览器。

3.浏览器分析Response中的HTML,发现其中引用了很多其他文件,比如Images文件,CSS文件, JS文件。浏览器会自动再次发送Request去获取图片,CSS文件,或者JS文件。

4.当所有的文件都下载成功后,网页会根据HTML语法结构,完整的显示出来了。


[……]

继续阅读

[Python]”no encoding declared 错误”解决方法

在使用Python编译的时候出现如下错误:

SyntaxError: Non-ASCII character ‘\xe5’ in file Test1.py on line 8, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

解决方法
python的默认编码文件是用的ASCII码,将文件存成了UTF-8,编译就可以通过。或在在py文件开头(必须是第一行)加入
————————————————

[……]

继续阅读

python下载网易热歌榜MP3脚本

首先找到要下载的歌曲排行榜的链接,这里用的是:https://music.163.com/discover/toplist?id=3778678,然后更改你要保存的目录,目录要先建立好文件夹,例如我的是保存在D盘-360下载-网易云热歌榜文件夹内,就可以完成下载。如果文件夹没有提前建好,会报错[Errno 2] No such file or directory。[……]

继续阅读

windows下python环境安装beautifulsoup包

下载beautifulsoup包,到官方网站https://www.crummy.com/software/BeautifulSoup/bs4/doc/

下载后解压

然后打开windows CMD命令行进入解压的beautifulsoup文件目录下执行setup.py build

执行setup.py install安装

最后输入python,进入python模块

输入from bs4 import BeautifulSoup检测是否成功。

[……]

继续阅读