qianaonan 发表于 2023-2-20 17:43

大佬们,我如何从requests打印出来的源码,获取一下字符

本帖最后由 qianaonan 于 2023-2-22 11:20 编辑

就是图中的红色框框的字符,他的xpath://*[@id="weaver"]/table/tbody/tr/td/table/tbody/tr/td/table/tbody/tr/td/script/text()

阿政0506 发表于 2023-2-20 17:47

def get_mid_string(html, start_str, end):
    """
    取出中间文本
    :param html: 源文本
    :param start_str: 前面文本
    :param end: 后面文本
    :return: 返回第一个符合结果的字符串
    """
    try:
      start = html.find(start_str)
      if start >= 0:
            start += len(start_str)
            end = html.find(end, start)
            if end >= 0:
                return html.strip()
    except:
      return None

阿政0506 发表于 2023-2-20 17:49

result = get_mid_string(resp.text, "tablestringkey_='", "'")
print(result)

戒酒的李白 发表于 2023-2-20 18:36

用正则匹配获取

MyModHeaven 发表于 2023-2-20 19:00

要不用正则,要不就用字符串的一些方法,如split

tuoluo348 发表于 2023-2-20 19:18

学习真认真{:1_932:}

YuanFang0w0 发表于 2023-2-20 19:23

建议正则比较简单

surepj 发表于 2023-2-20 19:27

import re
html = "__tableStringKey__='17B4D71E2EAOE01C9A133D779D47D8E4F';"
res = re.findall("__tableStringKey__='(.*?)';", html)
print(res)

老M 发表于 2023-2-20 19:38

阿政0506 发表于 2023-2-20 17:49
result = get_mid_string(resp.text, "tablestringkey_='", "'")
print(result) ...

这思路不错!!!!!!!!

qianaonan 发表于 2023-2-20 20:28

阿政0506 发表于 2023-2-20 17:47
def get_mid_string(html, start_str, end):
    """
    取出中间文本


感谢大佬帮忙{:1_893:}
页: [1] 2
查看完整版本: 大佬们,我如何从requests打印出来的源码,获取一下字符