吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 855|回复: 8
收起左侧

[已解决] Python 如何获取举例的数据结构?

[复制链接]
zh648990 发表于 2022-6-21 11:54
本帖最后由 zh648990 于 2022-6-25 09:08 编辑

[Python] 纯文本查看 复制代码
data = [
    '/一级目录/1二级目录/三级目录1/四级目录1',
    '/一级目录/1二级目录/三级目录1/四级目录2',
    '/一级目录/1二级目录/三级目录2',
    '/一级目录/1二级目录/三级目录3',
    '/一级目录/2二级目录/三级目录1',
    '/一级目录/2二级目录/三级目录2/四级目录1',
    '/一级目录/3二级目录'
]

# 最终我想获取
data1 = ['1二级目录', '2二级目录', '3二级目录']
data2 = [['三级目录1', '三级目录2', '三级目录3'], ['三级目录1', '三级目录2'], ['']]


data1 我已解决了
data2 如何获取 跪谢

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

cdsgg 发表于 2022-6-21 12:00
用split('/')分割不就完了
 楼主| zh648990 发表于 2022-6-21 12:04
cdsgg 发表于 2022-6-21 12:06
[Python] 纯文本查看 复制代码
data = [
    '/一级目录/1二级目录/三级目录1/四级目录1',
    '/一级目录/1二级目录/三级目录1/四级目录2',
    '/一级目录/1二级目录/三级目录2',
    '/一级目录/1二级目录/三级目录3',
    '/一级目录/2二级目录/三级目录1',
    '/一级目录/2二级目录/三级目录2/四级目录1',
    '/一级目录/3二级目录'
]

# 最终我想获取
data1 = ['1二级目录', '2二级目录', '3二级目录']
data2 = [['三级目录1', '三级目录2', '三级目录3'], ['三级目录1', '三级目录2'], ['']]

print([x.split('/') for x in data if x != ''])


[['', '一级目录', '1二级目录', '三级目录1', '四级目录1'], ['', '一级目录', '1二级目录', '三级目录1', '四级目录2'], ['', '一级目录', '1二级目录', '三级目录2'], ['', '一级目录', '1二级目录', '三级目录3'], ['', '一级目录', '2二级目录', '三级目录1'], ['', '一级目录', '2二级目录', '三级目录2', '四级目录1'], ['', '一级目录', '3二级目录']]
cdsgg 发表于 2022-6-21 12:07
举一反三呗
 楼主| zh648990 发表于 2022-6-21 12:09
cdsgg 发表于 2022-6-21 12:06
[mw_shl_code=python,true]data = [
    '/一级目录/1二级目录/三级目录1/四级目录1',
    '/一级目录/1 ...

谢谢大佬的回复,但是答案是错的
data2 的数据 对应data1的且忽略四级目录
cqfcy 发表于 2022-6-21 12:55
[Python] 纯文本查看 复制代码
import pandas as pd
df = pd.DataFrame([[value  for value in item.split('/')] for item in data ], columns=['0', '1', '2', '3', '4']).fillna('')
# 0                  1                  2                   3                   4
# 0                一级目录        1二级目录        三级目录1        四级目录1
# 1                一级目录        1二级目录        三级目录1        四级目录2
# 2                一级目录        1二级目录        三级目录2        
# 3                一级目录        1二级目录        三级目录3        
# 4                一级目录        2二级目录        三级目录1        
# 5                一级目录        2二级目录        三级目录2        四级目录1
# 6                一级目录        3二级目录                
list3 = df.groupby('2')['3'].agg(set).to_list()
# [{'三级目录1', '三级目录2', '三级目录3'}, {'三级目录1', '三级目录2'}, {''}]
list3 = [sorted(item) for item in list3]
# [['三级目录1', '三级目录2', '三级目录3'], ['三级目录1', '三级目录2'], ['']]
print(list3)

借助一下pandas实现,两行代码解决,不烧脑
cdsgg 发表于 2022-6-21 13:04
正则也可以的 我觉得
 楼主| zh648990 发表于 2022-6-21 13:06
cqfcy 发表于 2022-6-21 12:55
[mw_shl_code=python,true]import pandas as pd
df = pd.DataFrame([[value  for value in item.split('/' ...

666666 思路一下子打开了 感谢感谢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-12 22:54

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表