电影天堂上的Python爬虫
电影瓣瓣V2(不使用豆瓣): 只在电影天堂爬,不使用豆瓣,爬再多不会担心封ip,可以限制爬取的数量,使用index_t.html作为网页模板,最终结果会生成一个index.html网页
电影瓣瓣v1.1整合版(电影天天x豆瓣): v1的整合版,把代码粘一个函数里了,运行效率高。 结果输出到xlsx文件 注意:爬豆瓣信息过多的话,有被封ip的风险。
电影瓣瓣v1-分函数版(电影天天x豆瓣): 爬虫的各个过程分成函数编写适合复制粘贴到其他代码 结果输出到xlsx文件 注意:爬豆瓣信息过多的话,有被封ip的风险。