标签: 爬虫

2 篇文章

爬取猫眼电影Top100最新版
爬取猫眼电影网站Top100电影的详细信息并保存到excel表格内。 关于爬取猫眼电影网站的Top100的数据遇到了很多坑。首先就是获取源码时可能获取到的数据并不是你想要,其次就是多次爬取后发现获取不到正确的数据。对于这些问题或者说坑吧,下面写了一套最新的代码来避过这些坑。 本次主要用到的pytho…
NodeJs爬取网站图片
NodeJS爬取网站主要针对于静态页面(右键鼠标源码可以看到资源内容的)。同时需要用到http、https、fs、cheerio模块。当然cheerio需要安装后引入。 当然,关于cheerio 更多的内容,你可以看npmjs官方文档 // 安装cheerio npm install cheerio…