吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5372|回复: 19
收起左侧

[其他原创] rust写个简单爬虫

[复制链接]
fz12 发表于 2022-3-16 15:58
新人,随便发个贴看看
目前还是半成品,还没用到多线程


[Asm] 纯文本查看 复制代码
[dependencies]
scraper = "0.12.0"
reqwest = { version = "0.11.10", features = ["blocking", "json"] }
surf = "2.3.2"
tokio = { version = "1.17.0", features = ["full"] }
futures = "0.3.21"


主要逻辑
[Asm] 纯文本查看 复制代码
use futures::future::join_all;
use std::env;
use scraper::{Html, Selector};

async fn fetch_path(path:String) -> surf::Result<String>{
    let mut back_string = String::new();
    match surf::get(&path).await {
        Ok(mut response) => {
            match response.body_string().await{
                Ok(text) =>{
                    back_string = format!("{}",text)
                }
                Err(_) => {
                    println!("Read response text Error!")
                }
            };
        }
        Err(_) => {
            println!("reqwest get Error!")
        }
    }
    Ok(back_string)
}


#[tokio::main]
async fn main() -> surf::Result<()>{
    let stdin = env::args().nth(1).take().unwrap();
    let paths = vec![stdin.to_string(),];
    let result_list = join_all(paths.into_iter().map(|path|{
        fetch_path(path)
    })).await;

    let mut list_string:Vec<String> = vec![];
    for ele in result_list.into_iter(){
        if ele.is_ok(){
            list_string.push(ele.unwrap())
        }else {
            return Err(ele.unwrap_err())
        }
    }
    let v = list_string.get(0).take().unwrap();
   //  println!("{}",v);
    let fragment = Html::parse_fragment(v);
    let ul_selector = Selector::parse("script").unwrap();

    for element in fragment.select(&ul_selector) {
        println!("{}",element.inner_html());
    }   
    // println!("请求输出:{:?}",list_string);
    Ok(())
}


运行
[Asm] 纯文本查看 复制代码
 cargo run -- https://www.baidu.com/

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| fz12 发表于 2022-5-5 18:38
huanglaoshi 发表于 2022-5-5 18:08
楼主我有一个软件 RUST 语言编写的  想更换logo   包含打开软件之后的LOGO  名称,全替换,请大神帮忙愿意 ...

软件发个看看
 楼主| fz12 发表于 2022-5-7 10:29
huanglaoshi 发表于 2022-5-6 11:34
链接:https://pan.baidu.com/s/1K4-TZ8wScf8WH2KqgIjWOA
提取码:8888
感谢楼主热心帮忙

只能改外面的图片,里面改不了,你有源码可以重新编译一下
yuechaomax 发表于 2022-3-16 16:54
sgct 发表于 2022-3-16 17:51
我感觉还是Warp更好用(可能是因为我用惯了)
 楼主| fz12 发表于 2022-3-16 18:28
yuechaomax 发表于 2022-3-16 16:54
向新人学习,比我强多了。惭愧

还好,我也才学几个星期
plots 发表于 2022-3-16 18:34
感谢分享,学习
virmade 发表于 2022-4-2 12:44
3M多,有点大了,编译了很久,运行速度嗖嗖。。
huanglaoshi 发表于 2022-5-5 18:08
楼主我有一个软件 RUST 语言编写的  想更换logo   包含打开软件之后的LOGO  名称,全替换,请大神帮忙愿意奉上所有CB
huanglaoshi 发表于 2022-5-6 11:34

链接:https://pan.baidu.com/s/1K4-TZ8wScf8WH2KqgIjWOA
提取码:8888
感谢楼主热心帮忙
qiujw 发表于 2022-5-6 11:39
LOOK LOOK
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 18:51

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表