大佬们，我如何从requests打印出来的源码，获取一下字符

qianaonan 发表于 2023-2-20 17:43

本帖最后由 qianaonan 于 2023-2-22 11:20 编辑

就是图中的红色框框的字符，他的xpath：//*[@id="weaver"]/table/tbody/tr/td/table/tbody/tr/td/table/tbody/tr/td/script/text()

阿政0506 发表于 2023-2-20 17:47

def get_mid_string(html, start_str, end):
"""
取出中间文本
:param html: 源文本
:param start_str: 前面文本
:param end: 后面文本
:return: 返回第一个符合结果的字符串
"""
try:
   start = html.find(start_str)
   if start >= 0:
         start += len(start_str)
         end = html.find(end, start)
         if end >= 0:
            return html.strip()
except:
   return None

阿政0506 发表于 2023-2-20 17:49

result = get_mid_string(resp.text, "tablestringkey_='", "'")
print(result)

戒酒的李白 发表于 2023-2-20 18:36

用正则匹配获取

MyModHeaven 发表于 2023-2-20 19:00

要不用正则，要不就用字符串的一些方法，如split

tuoluo348 发表于 2023-2-20 19:18

学习真认真{:1_932:}

YuanFang0w0 发表于 2023-2-20 19:23

建议正则比较简单

surepj 发表于 2023-2-20 19:27

import re
html = "__tableStringKey__='17B4D71E2EAOE01C9A133D779D47D8E4F';"
res = re.findall("__tableStringKey__='(.*?)';", html)
print(res)

老M 发表于 2023-2-20 19:38

阿政0506 发表于 2023-2-20 17:49
result = get_mid_string(resp.text, "tablestringkey_='", "'")
print(result) ...

这思路不错!!!!!!!!

qianaonan 发表于 2023-2-20 20:28

阿政0506 发表于 2023-2-20 17:47
def get_mid_string(html, start_str, end):
"""
取出中间文本

感谢大佬帮忙{:1_893:}

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

大佬们，我如何从requests打印出来的源码，获取一下字符