登录 | 注册

Python 爬虫

Scrapy抓取当当网全部图书信息并存入mongo

虽然网上有好多现成的例子,今天自己亲自动手来抓取当当图书信息。通过当当网分类页作为入口,按照一级二级分类依次去抓取分类下图书数据,已达到抓取全部图书数据的目的,保存形式采用mongodb。

Robin 2017-08-30 152次浏览

蛋壳公寓北京地区房源分析

又是一年毕业季,太多的毕业生涌向了帝都,找房子也成了费劲的事。。。虽然我不是毕业生,但我也在换房找房的行列,今天无聊试试抓蛋壳公寓的北京房源,然后做个数据分析,练手啦。

Robin 2017-06-30 115次浏览