吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 12780|回复: 109
收起左侧

[学习记录] Python自学笔记(六)----------附黑马教程

    [复制链接]
l2430478 发表于 2021-1-3 16:08
本帖最后由 l2430478 于 2021-1-3 16:49 编辑

学习python一段时间了,进入了瓶颈,浅显的基础了解不少,但深层的东西没人指导,自学如同无头苍蝇,到处碰壁,好难!坚持着,坚持着,找到了这个详细的爬虫视频,真正从小白做起,感觉如同手把手教学,无需PyCharm 、Code、Anaconda,安装一个python就行,教程开始


1、给新人发python3.8.1汉化版。
链接: https://pan.baidu.com/s/1bbtGBOgZywaTI3p0UMJWPQ 提取码: byrs
2、教程本来是压缩包,看起来不方便,为了大家,我下载解压后,逐个上传,并同时分享在百度  天翼了。
百度链接: https://pan.baidu.com/s/17pVkzug-MtZE3Z2BCn1_Bg 提取码: gdia   
天翼链接https://cloud.189.cn/t/VB3eiyIv6jAv(访问码:se8b)

快照16.jpg
#爬虫概念、工真和HTTP
### 1.什么爬虫

爬虫就是'模似客户端(浏览器)发送网络请求',获取晌应,按照规则提取数据的程序

'模拟客户端 (浏览器)发送网络请求':照着浏览器发送一模一样的请求 ,获取和浏览器一横一样的数据

### 2,爬虫的敗据去哪了
-呈现出来:展示在网页上,或者是展示在app上
-进行分析:从数据中寻找一些规律

### 3.需要的软件和环境
-python3
-黑马python基础班15天视屏
-基础语法(字符串,列表,字典,判断和循环)
-函数(函数的创建和调用)
-面向对象(如何创建一个类,如何使用这个类)

-pycharm -python编辑器
-chrome浏览器 -分析网络请求用的

### 4.浏览器的请求
-url
-在chrome中点击检童,点到network,
-url =谓求的协议+网站的域名+资源的路径+参数

-浏览器谓求url地址

-当前url对应的晌应+js+css+图片—》elements中的内容
-爬虫谓求url地址
-当前url对应的晌应
- elements的内容和爬虫获取到的url地址的晌应不同,爬虫中需要以当 前url地址对应的响应为准提取数据

-当前url地址对应的晌应在哪里

-从network中找到当前的url地址,点击response
-在页面上右键显示网页源码




### 5.认识HTTP、HTTPS
-HTTP:超文本传输协议
-以明文的形式传输 效率更高,但是不安全
-HTTPS:HTTP + SSL (安全套接字层)
-传输之前数据先加密,之后解密获取内容
-效率较低,但是安全

-get请求和post请求的区别
-get请求没有请求体,post有,get请求把数据放到url地址中 -post请求常用于登录注册,
-post请求携带的数据量比get请求大,多,常用于传输大文本的时候

-HTTP协议之请求
-1.请求行
-2.请求头

-User-Agent:用户代{过}{滤}理:对方服务器能够通过user_agent知道当 前请求对方资源的是什么浏览器
-如果我们需要模拟手机版的浏览器发送请求,对应的,就需要 把use r_agent改成手机版
-Cookie:用来存储用户信息的,每次请求会被携带上发送给对方的 浏览器

-要获取登录后才能访问的页面
-对方的服务器会通过cookie来判断是我们是一个爬虫

-3.请求体
-携带数据
-get请求没有请求体
- post请求有请求体



免费评分

参与人数 39吾爱币 +33 热心值 +32 收起 理由
kochiyasanae + 1 热心回复!
jakein + 1 谢谢@Thanks!
salvamad + 1 + 1 用心讨论,共获提升!
131020222 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
用户名:用户名 + 1 + 1 谢谢@Thanks!
字数补丁 + 1 + 1 谢谢@Thanks!
redcats2 + 1 + 1 用心讨论,共获提升!
飞鸿戏游龙 + 1 + 1 谢谢@Thanks!
1ssue + 1 我很赞同!
hebiao0307 + 1 我很赞同!
Stardustamy + 1 用心讨论,共获提升!
拎壺沖 + 1 + 1 自学的怎么样了楼主?我正按照你的步骤刚刚开始。
yqzlove030621 + 1 + 1 感谢分享也准备学习中
汤姆和托尼 + 1 我很赞同!
乔峰518518 + 1 + 1 谢谢老师分享
利见大人 + 1 感谢您的宝贵建议,我们会努力争取做得更好!
shijy1986 + 1 + 1 谢谢@Thanks!
EricAngkor + 1 谢谢@Thanks!
bevirus + 1 + 1 谢谢@Thanks!
容景 + 1 + 1 谢谢@Thanks!
five-yang + 1 加油
Colarier + 1 + 1 谢谢@Thanks!
无垠苍茫然若失 + 1 + 1 用心讨论,共获提升!
chen.cc + 1 谢谢@Thanks!
Dz6668 + 1 + 1 谢谢@Thanks!
heymon0n + 1 + 1 谢谢@Thanks!
Jack马 + 1 + 1 我很赞同!
painstaking1 + 1 + 1 谢谢@Thanks!
沪华快乐屋 + 1 谢谢@Thanks!
马克斌 + 1 + 1 用心讨论,共获提升!
ysplovewzj + 1 + 1 用心讨论,共获提升!
zihao974 + 1 热心回复!
南风招摇令 + 1 用心讨论,共获提升!
loveme521 + 1 + 1 热心回复!
glocksheep + 1 + 1 用心讨论,共获提升!
小涛哥 + 1 + 1 今年都36了,学什么都犯困呢
wuboxun + 1 + 1 谢谢@Thanks!
久住飞鸟 + 1 + 1 为何你能够如此优秀
LINfan0104 + 1 + 1 教程有用,但是...毒盘太可恶了啊......

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

lengbingling 发表于 2021-1-3 16:15
坚持,坚持压倒一切
miqi1314 发表于 2021-1-3 16:16
我懂 发表于 2021-1-3 16:25
VIP007 发表于 2021-1-3 16:29
好,感谢楼主
ChiefTang38956 发表于 2021-1-3 16:41
我也在自学python,听视频课好多都听睡着了。。目前还在看到用户管理chomd的数字表示,先过一遍视频再说,B站的黑马视频,有500多。。。估计后面更难。。楼主整理的东西我现在吃不透,先mark了,谢谢啦。
mm0805 发表于 2021-1-3 17:01
为了计算机二级 刚开篇
GoalGao 发表于 2021-1-3 17:03
感觉到处都是瓶颈,坚持了两个月,再坚持两个月吧
dxlxh20150521 发表于 2021-1-3 17:16

谢谢楼主的分享
2366702 发表于 2021-1-3 17:33
谢谢楼主分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 18:19

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表