吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1146|回复: 4
收起左侧

[求助] 怎么在虚拟机的环境中进行数据清洗

[复制链接]
linhai778 发表于 2022-5-13 10:29
已经有伪分布式环境了,但是不会进行数据清洗,大佬们怎么弄? 113A37D6-DDC3-4b72-A21B-0FE2902A720D.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

plauger 发表于 2022-5-13 11:16
所谓的“数据清洗”,一般指的剔除错误的、无效的数据,怎么剔除/筛选是与业务逻辑紧密相关的,笼统的提问没人能跟你答案的。
 楼主| linhai778 发表于 2022-5-13 14:24
学校的实训任务,抓取网站并清洗数据,然后可视化输出,现在数据也抓到了,清洗数据不会弄了,可视化数据也会....
wtq1314 发表于 2022-5-15 00:59
linhai778 发表于 2022-5-13 14:24
学校的实训任务,抓取网站并清洗数据,然后可视化输出,现在数据也抓到了,清洗数据不会弄了,可视化数据也 ...

要安装Java环境,进行编码设计,对数据进行处理,你可以找找网上有没有相关的源码
shaonianyou 发表于 2022-5-19 13:55
直接在b站搜离线数仓,筛选时间>60min  看最多播放,直接2倍速过一下,就啥都有了,
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 14:23

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表