教材配套资源

QQ表情包图片

使用Requests库下载多张表情包图片到本地磁盘指定目录中。要求采用函数形式进行代码封装,调用代码和通用方法分离。

手机号码归属地查询

使用浏览器开发者工具分析手机号码归属地请求地址,使用Requests库发送查询请求,打印输出手机号码归属地的查询结果。

中国大学排名

爬取“高三网”中国大学排名一览表,爬取数据包括学校名称、总分、全国排名、星级排名、办学层级。爬取后的数据保存在csv文件中。

百度新闻

爬取百度新闻首页中的热点要闻,爬取数据包括新闻标题以及新闻详情页连接。爬取后的数据保存在csv文件中。

酷狗华语新歌榜

爬取酷狗音乐华语新歌榜中所有的榜单歌曲,要求使用lxml库进行数据解析。爬取数据包括歌曲名、歌手、歌曲播放地址。爬取后的数据保存在csv文件中。

起点中文网原创风云榜

爬取起点中文网原创风云榜所有的榜单小说,要求使用lxml库进行数据解析。爬取数据包括小说名称、作者、摘要、更新日期时间。爬取后的数据保存在csv文件中。

豆瓣图书

爬取豆瓣网新书速递的图书信息,数据保存在MySQL数据库中,表结构读者可自行定义。爬取数据包括书名、评分、作者、出版社、出版时间、图书介绍。

安居客二手房

爬取重庆地区安居客二手房信息,数据保存在MySQL数据库中。爬取数据包括卖点、楼盘、地址、房屋户型、建筑面积、所在楼层、建造年代、每平米单价。

新浪博客

使用逆向分析法分析博客文章的请求地址,爬取新浪博客教育频道下的所有文章,爬取数据包括博客标题、作者、文章摘要等。

重庆名医榜

重庆名医榜案例爬取的是医事通预约挂号平台的医生信息。爬取数据包括医生姓名、职称、简介、擅长领域、就职医院以及医院等级,数据保存在MySQL数据库中。

贝壳网房源

爬取贝壳网中重庆市挂牌出售的全部楼盘信息。爬取数据包括楼盘名称、地址、每平米均价、总房价。

古诗文网唐诗三百首

使用Scrapy框架编写爬虫程序,爬取古诗文网中三百首唐诗,数据保存为CSV文件。爬取数据包括诗词名称、作者、诗词正文等。

豆瓣网电影排行榜

爬取豆瓣网各类电影排行榜(包括剧情、喜剧、动作、爱情等)。爬取数据包括排名、电影名称、类型、演员、发行年份、发行国家、评分、评价人数等。

古诗文网全站爬取

爬取古诗文网站唐诗、宋词、文言、诗经4个频道的全部古诗词。爬取数据包括类型、诗词名称、作者、诗词正文、诗词正文URL地址。