蜘蛛侠

QQ表情包图片

使用Requests库下载多张表情包图片到本地磁盘指定目录中。要求采用函数形式进行代码封装，调用代码和通用方法分离。

表情党静态网页爬取 Requests

手机号码归属地查询

使用浏览器开发者工具分析手机号码归属地请求地址，使用Requests库发送查询请求，打印输出手机号码归属地的查询结果。

IP138查询网静态网页爬取 Requests

中国大学排名

爬取“高三网”中国大学排名一览表，爬取数据包括学校名称、总分、全国排名、星级排名、办学层级。爬取后的数据保存在csv文件中。

高三网网页解析 Beautiful Soup

百度新闻

爬取百度新闻首页中的热点要闻，爬取数据包括新闻标题以及新闻详情页连接。爬取后的数据保存在csv文件中。

百度新闻网页解析 Beautiful Soup

酷狗华语新歌榜

爬取酷狗音乐华语新歌榜中所有的榜单歌曲，要求使用lxml库进行数据解析。爬取数据包括歌曲名、歌手、歌曲播放地址。爬取后的数据保存在csv文件中。

酷狗音乐网页解析 lxml

起点中文网原创风云榜

爬取起点中文网原创风云榜所有的榜单小说，要求使用lxml库进行数据解析。爬取数据包括小说名称、作者、摘要、更新日期时间。爬取后的数据保存在csv文件中。

起点中文网网页解析 lxml

豆瓣图书

爬取豆瓣网新书速递的图书信息，数据保存在MySQL数据库中，表结构读者可自行定义。爬取数据包括书名、评分、作者、出版社、出版时间、图书介绍。

豆瓣图书数据存储 PyMySQL

安居客二手房

爬取重庆地区安居客二手房信息，数据保存在MySQL数据库中。爬取数据包括卖点、楼盘、地址、房屋户型、建筑面积、所在楼层、建造年代、每平米单价。

安居客数据存储 PyMySQL

新浪博客

使用逆向分析法分析博客文章的请求地址，爬取新浪博客教育频道下的所有文章，爬取数据包括博客标题、作者、文章摘要等。

新浪博客动态网页爬取逆向分析

重庆名医榜

重庆名医榜案例爬取的是医事通预约挂号平台的医生信息。爬取数据包括医生姓名、职称、简介、擅长领域、就职医院以及医院等级，数据保存在MySQL数据库中。

医事通动态网页爬取逆向分析 MySQL

贝壳网房源

爬取贝壳网中重庆市挂牌出售的全部楼盘信息。爬取数据包括楼盘名称、地址、每平米均价、总房价。

贝壳爬虫框架 Scrapy

古诗文网唐诗三百首

使用Scrapy框架编写爬虫程序，爬取古诗文网中三百首唐诗，数据保存为CSV文件。爬取数据包括诗词名称、作者、诗词正文等。

古诗文网爬虫框架 Scrapy

豆瓣网电影排行榜

爬取豆瓣网各类电影排行榜（包括剧情、喜剧、动作、爱情等）。爬取数据包括排名、电影名称、类型、演员、发行年份、发行国家、评分、评价人数等。

豆瓣电影爬虫框架 Scrapy

古诗文网全站爬取

爬取古诗文网站唐诗、宋词、文言、诗经4个频道的全部古诗词。爬取数据包括类型、诗词名称、作者、诗词正文、诗词正文URL地址。