import re
txt=""
pat=r"http://www.52pojie.cn/.*?.html"
r=re.findall(patter=pat,stings=txt)
for i in rang(len(r)):
print(r) 本帖最后由 红尘旧梦i 于 2020-5-15 22:19 编辑
.版本 2
.子程序 正则_匹配批量, 整数型, , 本子程序采用【精易编程助手】生成。成功返回匹配的数量,失败返回0。
.参数 源文本, 文本型, , 欲被匹配的文本
.局部变量 局_正则, 正则表达式类, , , 此类为精易模块里面的正则类,精易模块下载地址:http://ec.125.la/
.局部变量 局_匹配数, 整数型
.局部变量 局_计次, 整数型
.如果真 (局_正则.创建 (“http://www.52pojie.cn/(.*?).html”, 源文本, 假, 假, 真,真) = 假)
信息框 (“正则创建失败,请检查正则表达式语句是否有误!”, #错误图标, )
返回 (0)
.如果真结束
局_匹配数 = 局_正则.取匹配数量 ()
.如果真 (局_匹配数 = 0)
信息框 (“匹配失败,请检检查正则语句是否有误,数量:0”, #错误图标, )
返回 (0)
.如果真结束
.计次循环首 (局_匹配数, 局_计次)
输出调试文本 (“匹配文本 ” + 到文本 (局_计次) + “ 中的子匹配文本 1:” + 局_正则.取匹配文本 (局_计次, 1))
.计次循环尾 ()
返回 (局_匹配数)
‘注意添加精易模块 本帖最后由 wyd66 于 2020-5-15 23:00 编辑
1.以换行符 分割文本()
2.以“http”和 html批量取文本中间() 你给出的文本没看到换行符啊?
页:
[1]