大佬们,我如何从requests打印出来的源码,获取一下字符
本帖最后由 qianaonan 于 2023-2-22 11:20 编辑就是图中的红色框框的字符,他的xpath://*[@id="weaver"]/table/tbody/tr/td/table/tbody/tr/td/table/tbody/tr/td/script/text() def get_mid_string(html, start_str, end):
"""
取出中间文本
:param html: 源文本
:param start_str: 前面文本
:param end: 后面文本
:return: 返回第一个符合结果的字符串
"""
try:
start = html.find(start_str)
if start >= 0:
start += len(start_str)
end = html.find(end, start)
if end >= 0:
return html.strip()
except:
return None result = get_mid_string(resp.text, "tablestringkey_='", "'")
print(result) 用正则匹配获取 要不用正则,要不就用字符串的一些方法,如split 学习真认真{:1_932:} 建议正则比较简单 import re
html = "__tableStringKey__='17B4D71E2EAOE01C9A133D779D47D8E4F';"
res = re.findall("__tableStringKey__='(.*?)';", html)
print(res) 阿政0506 发表于 2023-2-20 17:49
result = get_mid_string(resp.text, "tablestringkey_='", "'")
print(result) ...
这思路不错!!!!!!!! 阿政0506 发表于 2023-2-20 17:47
def get_mid_string(html, start_str, end):
"""
取出中间文本
感谢大佬帮忙{:1_893:}
页:
[1]
2