本帖最后由 奥怪 于 2022-8-1 17:18 编辑
QQtoExcel
Github开源项目地址
https://github.com/aoguai/QQtoExcel
前言
由于QQ未提供聊天记录导出成Excel表格的功能,同时,QQ自带的消息管理功能BUG频出无人修复。
导致无法合理利用个人的聊天记录数据实现一些有意思的功能,特此开发此项目。
功能
- QQ聊天记录备份
- 利用导出的QQ聊天记录进行数据分析与统计、构建简单用户画像、数据可视化处理
- 利用导出的QQ聊天记录生成语料库进行NLP或者聊天机器人模型训练
- 高效整理与搜索QQ聊天记录
特点
- 支持 CIL
- 支持好友/群聊转换导出
- 支持选择导出内容
- 最完善的正则表达式匹配功能,避免非法字符等原因导致的导出崩溃或者数据不准确问题
注意事项
规定名称 |
解释 |
消息分组 |
您的QQ好友分组或QQ群聊分组名称 |
消息对象 |
您的QQ好友或QQ群组 |
当前版本下你可以选择导出项有以下:
可选择项 |
解释 |
时间 |
每个消息对象中每条消息的对应时间,格式为:yyyy-mm-dd hh:mm:ss |
昵称 |
每个消息对象中每条消息的对应备注,若无备注着可能为空、QQ号、QQ昵称 |
uid |
每个消息对象中每条消息的联系方式,可能为QQ号或邮箱。该项在好友消息中可能为空 |
内容 |
每个消息对象中每条消息的内容 |
以上 可选项 将作为标题均可自定义
同时你还可以选择 Excel表格导出文件方式
可选择项 |
解释 |
按联系人导出 |
所有联系人将单独导出到一个文件夹中,当前版本默认导出文件名为:"分组_昵称.xls" |
按分组导出 |
联系人将按分组导出到对应的分组文件夹中,当前版本默认导出目录规则为:"分组/昵称.xls" |
同时,由于QQ聊天记录中字符复杂,为了避免导出错误程序将对分组名、昵称、内容等涉及到导出Excel的数据进行 本地 预处理。
例如,如检测到您的分组或者昵称存在非法字符将会把非法字符替换为"()",避免windows系统下文件名规定导致的保存失败。
开发规划
规划
- [x] 支持好友/群聊/全部聊天记录 转换导出
- [x] 支持可选项 选择导出
- [x] 增加 消息分组 可选项,可按分组导出
- [ ] 支持 多工作表 导出
- [ ] 支持 自定义导出文件名规则
- [ ] 支持 聊天记录清洗,去除无效聊天记录
更新日志
- 2022/8/1 QQtoExcelV1.5.0版本更新
- 新增 消息分组 可选项,可按分组导出
- 修复 打包程序在 windows7 不可用的情况
- 更新后支持 CIL
- 优化 代码结构
- 2022/7/31 更新README
- 2022/7/19 QQtoExcelV1.1.0版本更新
下载与使用
GUI 与 可执行文件说明
如果您是windows用户,没有浏览项目代码需求
可以前往下载页面下载 解压后得到
- releases.exe :普通用户使用,不支持 CLI ,有简单 CMD 界面与引导
- QQtoExcel.exe :一般开发者使用,仅支持 CLI
同时你可以前往 QQtoExcel_GUI 下载GUI版本
另,提供百度云下载链接
链接:https://pan.baidu.com/s/195qKzjbVkUp2iQNQmZCJ3Q?pwd=xasi
提取码:xasi
蓝奏云下载链接
https://aoguai.lanzouw.com/b00pz2cmh
密码:gfcl
如果您需要浏览项目代码
项目运行流程
-
clone本项目到本地
-
手动从QQ消息管理器中导出需要转换的消息,注意改为UTF-8-BOM
-
运行 CIL 相关命令即可
示例:
QQtoExcel 全部消息记录.txt
CIL 用法
你可以通过 QQtoExcel -h 来获取相关 CIL 参数信息与帮助
同时您可以直接在 issues 中提出您的问题或通过 提交PR 贡献您的代码
|