吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3255|回复: 9
收起左侧

[其他转载] C#实现小说抓取并写入TXT

[复制链接]
TZ糖纸 发表于 2022-3-4 15:55
本帖最后由 TZ糖纸 于 2022-3-5 10:28 编辑

[C#] 纯文本查看 复制代码
 public class Program
    {
        private static string baseUrl = System.AppDomain.CurrentDomain.SetupInformation.ApplicationBase;

        private static void Main(string[] args)
        {
            string baseReUrl = "https://www.biduoxs.com/";
            var client = new RestClient("https://www.biduoxs.com/biquge/17_17005/");
            var request = new RestRequest();
            Task<RestResponse> response = client.ExecuteAsync(request);
            //Console.WriteLine(response.Result.Content);
            var html = response.Result.Content;
            HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
            htmlDoc.LoadHtml(html);
            var list = htmlDoc.DocumentNode.SelectNodes("//*[@id=\"list\"]/dl/dd/a");
            foreach (var item in list)
            {
                Console.WriteLine(item.InnerText);
                //Console.WriteLine(item.Attributes["href"].Value);
                System.IO.File.AppendAllText(baseUrl + "xs.txt", item.InnerText + "\n\r");

                client = new RestClient(baseReUrl + item.Attributes["href"].Value);
                response = client.ExecuteAsync(request);
                var html2 = response.Result.Content;
                HtmlAgilityPack.HtmlDocument htmlDoc2 = new HtmlAgilityPack.HtmlDocument();
                htmlDoc2.LoadHtml(html2);
                var content = htmlDoc2.GetElementbyId("content").InnerHtml.Replace("<br>", "\n\r").Replace(" ", " ");
                System.IO.File.AppendAllText(baseUrl + "xs.txt", content);
            }
        }
    }


Nuget 包
RestSharp
HtmlAgilityPack

image.png
这里填写小说的目录链接

txt保存在程序的根目录自行查看

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
我来白嫖 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

骑狗的猴子 发表于 2022-3-4 20:25
最近在学习C#   发现C# 是比较适合大众的 win下的环境  wen  桌面都可以

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
xiaovssha + 1 + 1 我很赞同!

查看全部评分

 楼主| TZ糖纸 发表于 2022-3-4 15:56
很多小说的结构都差不多  稍微修改一下 其他网站也能用
闷骚小贱男 发表于 2022-3-4 17:29
hackgsl 发表于 2022-3-4 21:32
闷骚小贱男 发表于 2022-3-4 17:29
楼主标题是不是少写了一个  说
小说抓取

哈哈,我以为小抓一下,后面还有大抓
longxing 发表于 2022-3-5 09:09
小抓是啥
 楼主| TZ糖纸 发表于 2022-3-5 10:28
闷骚小贱男 发表于 2022-3-4 17:29
楼主标题是不是少写了一个  说
小说抓取

哈哈,手误
ehcapa 发表于 2022-3-15 22:37
C# 的通用性还是不错的,上手也快
pppz123 发表于 2022-3-26 17:23
那这样晋江的能提取出来吗
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 07:28

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表