吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1922|回复: 18
收起左侧

[学习记录] pyhon爬虫学习笔记vtor-01

[复制链接]
vtor 发表于 2021-11-16 11:07
视频地址:https://www.bilibili.com/video/BV1i54y1h75W
【0】说明与安装pyhon,自行安装即可,记得在安装界面选上pip与path
pip用于安装pyhon第三方库,path用于简便使用命令行调用python程序
【1】python基础
101-熟悉基本输入
input(),output()
因为我有c/c++基础,所以基本使用可以很快掠过

【2】基本网络操作
201-知道urllib获取百度首页
202-requests操作百度翻译sug获得json(重要)
pip install requests
203-搜狗查询周杰伦,学会设置ua

【3】正则表达式
在线正则测试网站
https://tool.oschina.net/regex
重要知识点:.除了换行符的所有字符
        [0123a-z]其中的任意一个字符
        *任意多个
        {n,m}最少n个,最多m个,都可以省略
        .*?惰性匹配
import re:导入re(正则)模块

list = re.findall,返回list,一般不使用
it = re.finditer,返回迭代器,可以用group()获取具体成员
re2 = re.compile(r"\d+"),预加载正则,以后的参数只需要字符串
data = re2.finditer("我的电话是213421,qq是3243");

r"<span.*?>(?P<name>.*?)</span>",re.S
(?P<分组名字>正则),print(it.group("name"))从正则中提取需要的字符串
re.S,让.可以匹配任意字符(包括换行符)
双引号含双引号:r"正则\"表达\"式",需要转义
单引号含双引号:r'正则"表达"式',不需要转义

【20211116】日【110609】秒
先到这里,以后再添加,如有错误,请指出,也欢迎一起讨论~

免费评分

参与人数 3吾爱币 +3 热心值 +3 收起 理由
xcllyu + 1 + 1 我很赞同!
天阳团队 + 1 + 1 用心讨论,共获提升!
Gary123 + 1 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

jupiterarrow 发表于 2021-11-16 13:27
一起学习
小林影视 发表于 2021-11-16 13:57
w123321 发表于 2021-11-16 14:09
Behold 发表于 2021-11-16 14:22
一起一起啊
hezhigang 发表于 2021-11-16 14:59

一起一起啊
iuv99 发表于 2021-11-16 15:36
利用工作之余学习一下
jasony0 发表于 2021-11-16 15:47
一起学习
cy2931 发表于 2021-11-16 21:18
加油,加油
 楼主| vtor 发表于 2021-11-19 23:16
访问百度
[Python] 纯文本查看 复制代码
# 导入url库
from urllib.request import urlopen

url = "http://www.baidu.com"
resp = urlopen(url)
# 打印信息到控制台
#print(resp.read())
# 也可以保存到文件
with open("baidu.html",mode = "w") as f:
	f.write(resp.read().decode("utf-8"))
# 获取用户输入,阻塞界面消失
input("按回车键结束")
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 18:48

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表