本帖最后由 lxwx 于 2020-11-11 18:25 编辑
首先,新人报道。
这是一个我之前给kindle上用的lua小说爬虫,用到了一些简陋的linux'指令,功能也不是很完善,今天进站发出来,算是给各位献个丑了。
function init()
page1 = "https://m.sfacg.com/c/[first chapter]/"
--引号内替换为对应小说sfacg手机网页版第一章页面地址
link = page1
end
function getpage()
os.execute("rm index.html\n")
os.execute("wget -O index.html "..link.."\n")
end
function main()
getpage()
text = io.input("index.html")
text = io.read("*a")
i,txts=string.find(text,"返回<")
txte=string.find(text,">上一章")
links,linke=string.find(text,"/c/[0-9]+\">下一章")
if linke then
linke=linke-11
link="https://m.sfacg.com"..string.sub(text,links,linke)
end
maintxt=string.sub(text,txts+13,txte)
maintxt=string.gsub(maintxt,"<p>","\n")
maintxt=string.gsub(maintxt,"</p>","")
maintxt=string.gsub(maintxt,"<br>","")
maintxt=string.gsub(maintxt,"</div>","")
maintxt=string.gsub(maintxt,"</li><li></li></ul>","")
maintxt=string.gsub(maintxt,"<div class=\"yuedu_menu\"><a href=\"/c/[0-9]+\">","")
maintxt=string.gsub(maintxt,"<div .+\">","")
end
init()
links=0
io.output("xxx.txt") --这里把"xxx"换成小说的标题
while links ~= nil do
main()
io.write(maintxt.."\n")
end
io.close()
print("下载完成")
|