wanpojie 发表于 2021-8-20 10:00

如何获取真实的html超链接 正则表达式

http://47.105.108.5/index/articles/54097124786a4992a59d4c8796e748cf

<li><a href="/index/article/dbf33b15d172404f96437266226666c5"><span>工程造价信息-2020.6-总第175期</span> <span>11-20</span></a></li>




如何可以通过正则表达式获取到红颜色的真实地址,不用通过构造URL字符,或者css选择器   xpath也可以

南岸 发表于 2021-8-20 10:11

我寻思拼接一下不就行了?

wu2_cgj 发表于 2021-8-20 10:19

最简单的方式就是拼接字符串

hikaruyin 发表于 2021-8-20 10:22

行踪落落 发表于 2021-8-20 10:08
感谢楼主分享

拉出去槍斃,分享什麼鬼?

wanpojie 发表于 2021-8-20 10:23

wu2_cgj 发表于 2021-8-20 10:19
最简单的方式就是拼接字符串

有的会出现属性里面是汉字,实际连接地址是字符

libook7 发表于 2021-8-20 10:24

这是Web技术上的一个通用规则:
1. 写全了就是写全了,比如,那么就会将这个地址作为完整地址直接用;
2. 斜杠开头代表从根路径开始,浏览器知道你当前正在看的页面的网址是什么,所以浏览器可以做到直接拼在当前页面的域名和端口号后面,比如当前页面的地址是“https://baidu.com/a”,属性是href="/b/c",那么就去掉当前页面域名和端口号后面的内容,直接拼href的内容,则为“https://baidu.com/b/c”;
3. 点斜杠开头代表从当前页面的路径开始,同样浏览器知道你当前正在看的页面的网址是什么,所以浏览器可以做到直接拼接到当前页面地址后面,比如当前页面的地址是“https://baidu.com/a”,属性是href="./b/c",直接拼接就是“https://baidu.com/a/b/c”。

如果操作DOM的话,可以直接从A标签DOM对象的href属性拿到浏览器帮你解析好的地址,比如aElement=document.querySelector('a'); url=aElement.href;

weliong 发表于 2021-8-20 10:29

hikaruyin 发表于 2021-8-20 10:22
拉出去槍斃,分享什麼鬼?

就是 经常看到这种水货。。。连标题都不看,就感谢分享{:301_1008:}

wanpojie 发表于 2021-8-20 10:34

libook7 发表于 2021-8-20 10:24
这是Web技术上的一个通用规则:
1. 写全了就是写全了,比如,那么就会将这个地址作为完整地址直接用;
2. ...

感谢老哥

tencentma 发表于 2021-8-20 11:33

这个正则不错,可以收藏一下了,谢

我家有条大大狗 发表于 2021-8-20 11:48

用js获取a标签,拿它的href属性就是你要的了
也可以用location对象的origin属性进行拼接
页: [1] 2
查看完整版本: 如何获取真实的html超链接 正则表达式