吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3803|回复: 23
收起左侧

[Java 转载] Java 图片爬虫

  [复制链接]
jb937158168 发表于 2020-6-28 10:59
本帖最后由 jb937158168 于 2020-6-28 11:32 编辑

前言

自学java目前正在找工作,在此期间写个java的爬虫

框架

后端

mybatis、springboot、springcloud、webmagic

前端

vue+Bootstrap

用到的技术

redis做缓存、mysql做用户数据库、Elasticsearch+IK分词器

思路

webmagic做爬虫引擎,抓到的数据存到Elasticsearch数据库里。
前端搜索后端返回json到前端。(因为爬虫爬取的数据量大所以用搜索的时候用mysql的话太慢了,es全文搜索特别快)。
如果前端发送的请求在数据库中没有查到,将会启动一个线程去自动爬取前端发出的关键字。
爬取的图片,用户可以添加喜欢或者收藏(用mysql存入图片id),用户点击过的图片会加入浏览记录(redis缓存图片id)。
因为我想做个分布式我想做个单点登录(redis记录用户登录状态),然后用到前后端分离就不能用session,可以用cookie每次登录的时候返回一个特征码(列如uuid到前端)前端存入cookie,之后每次请求都会携带用户特征码,后端在redis去比较。

目前进度

图片爬取控制展示已经做完

正在做用户登录单点登录

ps:代码太多我就不贴了 我直接上github项目地址。此项目完全开源!!

地址:https://github.com/jb2113286/xjj



W34QJQ2[5YM@]EF)C3FI[O7.png

免费评分

参与人数 4吾爱币 +3 热心值 +4 收起 理由
kaiye666 + 1 我很赞同!
s_qiu + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
卖菜小贩邪魅 + 1 + 1 用心讨论,共获提升!
安德鲁儿 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| jb937158168 发表于 2020-7-26 17:10
xianquanyun 发表于 2020-7-22 19:43
单点登录是用的什么技术?我这段时间用别人做的单点登录系统,是cas,感觉一般。

技术啊 我手写的 就是将用户登录的一个状态记录在redis里 其他服务调用的时候 先过一遍拦截器去看有没有登录
 楼主| jb937158168 发表于 2020-6-28 11:41
如果我是DJ? 发表于 2020-6-28 11:38
大佬 为什么要做单点登录啊,是为了加深下单点登录的技术 还是真有作用,求科普一波,

就是想把学到的东西用到加深一下技术,实际项目中单点登录可以实现跨域免登录
xccxvb 发表于 2020-6-28 11:01
 楼主| jb937158168 发表于 2020-6-28 11:02
xccxvb 发表于 2020-6-28 11:01
太强了!不过,你的图是不是没发上来?

哎哟! 忘了 桥豆麻袋。我去截图
楼主你好萌 发表于 2020-6-28 11:06
桥豆麻袋
如果我是DJ? 发表于 2020-6-28 11:38
大佬 为什么要做单点登录啊,是为了加深下单点登录的技术 还是真有作用,求科普一波,
Asy_少洋 发表于 2020-6-28 11:59
有成品吗,大佬
凌翰梓 发表于 2020-6-28 12:17
看哭了,看起来是随便写点东西,里面包含了差不多的这十种东西……
 楼主| jb937158168 发表于 2020-6-28 13:55

目前还在写 每天写的东西会同步到github上
头像被屏蔽
dongse 发表于 2020-6-28 14:05
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 01:26

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表