吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3082|回复: 8
收起左侧

[Python 转载] 数据分析学习记录贴(持续更新。。。)2019/8/2

[复制链接]
袅袅系秋风 发表于 2019-8-2 13:54
本帖最后由 袅袅系秋风 于 2019-8-2 14:45 编辑

使用工具:anaconda
2019.8.2

[Python] 纯文本查看 复制代码
#去除重复数据
df1=DataFrame({'age':[26,35,18,35,35],'name':['Ben','John','Jerry','John','John']})
print(df1)
df1.duplicated()
df1.duplicated('name')
df1.duplicated('age')
df1.drop_duplicates()

1.png
[Python] 纯文本查看 复制代码
#缺失值处理
from pandas import read_excel
df=read_excel(r'C:\Users\fyz\Desktop\0814171成绩统计表.xlsx',skiprows=[1])
print(df)df.isnull()#判断是否缺失值
df.dropna()#删除值为空的行
df.fillna('?')#使用?填充缺失值
df.fillna(method='pad')#用前一个数据值替代NaN
df.fillna(method='bfill')#用后一个数据值替代NaN
df.fillna(df.mean())#使用均值填补数据
df.fillna(df.mean()['认知实习':'大学计算机基础'])#使用列的均值为某列空值填补数据
df.fillna({'认知实习':100,'大学计算机基础':99})#为不同的列填补不同的数据
df1['name'].str.strip()#清楚字符型数据左右指定字符
df1['name'].str.strip('n')
df1['name'].str.rstrip('n')#删除右边字符


#数据抽取
1、字段抽取
[Python] 纯文本查看 复制代码
df=read_excel('E:\Python\《基于Python的大数据分析基础及实战》064992【配套资源】\数据及相关的资料\i_nuc.xls',sheetname='Sheet4')
df['电话']=df['电话'].astype(str)#转化类型
df['电话']

电话.png
[Python] 纯文本查看 复制代码
bands=df['电话'].str.slice(0,3)抽取手机号码前3位,判断号码运营商
bands

bands.png
[Python] 纯文本查看 复制代码
areas=df['电话'].str.slice(3,7)抽取手机号码中间四位,判断号码区域
areas

areas.png
[Python] 纯文本查看 复制代码
tell=df['电话'].str.slice(7,11)#抽取手机号码后四位
tell

tell.png
2、字段拆分


[Python] 纯文本查看 复制代码
df=read_excel('E:\Python\《基于Python的大数据分析基础及实战》064992【配套资源】\数据及相关的资料\i_nuc.xls',sheetname='Sheet4')
df['IP'].str.strip()#ip先转为str,再删除首位空格
newDF=df['IP'].str.split('.',1,True)#按第一个.分成两列,1表示新增的列数
newDF
newDF.columns=['IP1','IP2-4']#给第1、2列增加列名称
newDF


3、重置索引

[Python] 纯文本查看 复制代码
from pandas import Series
from pandas import DataFrame
df=DataFrame({'age':[26,85,64,85,85],'name':['Ben','John','Jerry','John','John']})
df1=df.set_index('name')#以name列为新的索引
df1
df1.ix['John']#使用ix函数对John用户信息进行提取


4、记录抽取















发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

头像被屏蔽
养乐多 发表于 2019-8-2 15:00
提示: 作者被禁止或删除 内容自动屏蔽
我傻瓜1991 发表于 2019-8-2 15:11
diyikuai 发表于 2019-8-2 23:41
楼主买的书跟我一样,我也正在学习这一本书。这本书入门还不错,楼主继续更新。
 楼主| 袅袅系秋风 发表于 2019-8-3 18:55
diyikuai 发表于 2019-8-2 23:41
楼主买的书跟我一样,我也正在学习这一本书。这本书入门还不错,楼主继续更新。

买不起,图书馆借的
diyikuai 发表于 2019-8-4 00:25
好吧!我只能自己买
niebaohua 发表于 2019-8-4 07:06
这本书怎么样
 楼主| 袅袅系秋风 发表于 2019-8-5 12:09

还行吧,很详细
nanhai31 发表于 2020-7-22 17:05
厉害,学习学习
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 03:30

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表