【吾爱动画大赛2019参赛作品】- NodeJS爬虫抓京东内衣销售记录,分析妹纸们的真实Size
本帖最后由 Lost_Rivers 于 2019-9-15 21:38 编辑通过NodeJS爬虫分析某东内衣销售记录,带你们了解妹纸们的真实Size
0x00 序言
参赛之前看了很多,觉得大家的技术都挺高大上的,一点点入门级的爬虫技术,总觉得有点太简单,有点关公面前耍大刀的感觉。{:301_973:}
从前两天开始准备,到今天最后这几分钟,总算编辑出来了。作品没经过细致的剪辑,中间讲解的时候,也出现了几处口误,以及着急产生的各种失误,希望大家理解。(借用一句话,理解万岁){:1_907:}
作品灵感来源于马粑粑2017年的网商大会(没记错的话是),想想自己为何不能有一些数据的统计呢。
大家可以放心观看,所有的可能涉及到敏感内容的图片,我都已经通过修改hosts的方式,屏蔽掉了。
0x01 大纲
1. 介绍HTTP请求,包括url和请求头以及响应内容
2. DOM分析,介绍浏览器端的AJAX技术,对某东商品列表,商品详情,评论逻辑的分析
3. NodeJS爬虫的基本逻辑(包括三方库的安装)
4. 代码分析,项目启动,爬取数据的分析
5. 可以配合nodejs一些工具,画出一些相关图表。
0x02 作品截图
0x03 分析结果
处理了好几次,在压缩大小,同时保证能看清代码的情况下,最终压缩到了1.24G,如果看不清的话,反应的人多,我再抽空转一下高清的吧。
最后是教程和源码的下载地址:
链接:https://pan.baidu.com/s/1IJbnK83YzLgMOA4GWD818g密码:8n9a
解压密码: www.52pojie.cn 吾爱的人才越来越多了 之前在github上看到一个类似的Python爬虫,爬的是天猫的数据。
分享给想学数据分析的小伙伴~
https://github.com/chenjiandongx/cup-size 最近正在学习爬虫,感谢楼主分享 感谢分享! 好东西啊,学习学习 强大👍感谢分享 建議上傳到B站更方便看 意思是销量最多的是B?我一直以为是A来的 学习中,谢谢楼主分享 T121581 发表于 2019-9-16 08:14
建議上傳到B站更方便看
好的我看看怎么上传 没用过b站 逝去的流梦 发表于 2019-9-16 08:28
意思是销量最多的是B?我一直以为是A来的
还真的是B