python pandas多列apply的问题。
以下代码apply部分实现的是新增一列,并根据['商户']的内容来对新列进行赋值(判断商户包含的区域名称)。但由于有时数据并不完整,我希望改为通过'范围'、'地址'、'商户'三列来判断区域(而不是仅判断“商户”一列),代码要怎么改?请指教,谢谢。
import numpy as np
import pandas as pd
regions = ['高州', '茂南', '信宜', '化州']
symbol = ['BABA', 'JD', 'APPLE', 'MS', 'GS', 'WMT']
data = {'行业': ['电商', '电商', '科技', '金融', '金融', '零售'],
'价格': ,
'交易量': ,
'雇员': ,
'范围': ['高州及镇隆周边', '公馆', '高山周边', '城区范围', '', '时代新城'],
'地址': ['高州市公园路1号', '茂南大道东', '', '花园广场3楼', '', '信宜市世贸中心'],
'商户': ['高州市金山建文电讯手机经营部W', '茂名市茂南区大众电脑维修部', '茂名市通汇电信器材有限公司(茂名通汇直营)W',
'信宜市镇隆镇亚芳手机店W', '中移铁通有限公司化州运营中心W', '信宜市盛汇通讯器材商行W']}
df = pd.DataFrame(data, index=symbol)
df.name = '美股'
df.index.name = '代号'
df['区域'] = df['商户'].apply(lambda x: ''.join())
print(df)
本帖最后由 choolyee 于 2020-12-6 01:27 编辑
import numpy as np
import pandas as pd
regions = ['高州', '茂南', '信宜', '化州']
symbol = ['BABA', 'JD', 'APPLE', 'MS', 'GS', 'WMT']
data = {'行业': ['电商', '电商', '科技', '金融', '金融', '零售'],
'价格': ,
'交易量': ,
'雇员': ,
'范围': ['高州及镇隆周边', '公馆', '高山周边', '城区范围', '', '时代新城'],
'地址': ['高州市公园路1号', '茂南大道东', '', '花园广场3楼', '', '信宜市世贸中心'],
'商户': ['高州市金山建文电讯手机经营部W', '茂名市茂南区大众电脑维修部', '茂名市通汇电信器材有限公司(茂名通汇直营)W',
'信宜市镇隆镇亚芳手机店W', '中移铁通有限公司化州运营中心W', '信宜市盛汇通讯器材商行W']}
df = pd.DataFrame(data, index=symbol)
df.name = '美股'
df.index.name = '代号'
df['临时'] = df['范围']+df['地址']+df['商户']
df['区域'] = df['临时'].apply(lambda x: ''.join())
df = df.drop(columns=['临时'])
print(df)
曲线救国也是可以的嘛:lol 学习了,谢谢 学习一下,谢谢楼主分享 choolyee 发表于 2020-12-6 01:06
import numpy as np
import pandas as pd
大佬,能解释下这段代码
for y in regions:
if x.find(y) >=0:
return y
else:
return ''
为什么能写成这样 y if x.find(y) >= 0 else '' for y in regions 吗?
或者哪里能搜到相关的知识点。
谢谢
学习了,感谢分享 choolyee 发表于 2020-12-6 01:06
import numpy as np
import pandas as pd
有点曲,但可以接受。
但我发现一个问题,如果'范围'、'地址'、'商户'三列均不为空时,这样是可以的。
但如果其中有一列为空,则拼接出来的结果也是空的,这个怎么解决? cqwcns 发表于 2020-12-6 09:58
有点曲,但可以接受。
但我发现一个问题,如果'范围'、'地址'、'商户'三列均不为空时,这样是可以的。 ...
我测试的时候完全没发现你说的这个问题。。 至于APPLE那个为什么为空,你的范围 地址 商户里面 都没有对应的region的关键词。。这能不为空吗 神枪泡泡丶 发表于 2020-12-6 11:39
我测试的时候完全没发现你说的这个问题。。 至于APPLE那个为什么为空,你的范围 地址 商户里面 都没有对 ...
解决了,加了一个.map(str)就可以了
['装维组/用户班'].map(str) 本帖最后由 ol416 于 2020-12-6 12:23 编辑
@wanderrr
status = True
0 if status else 1你运行之后就知道了
页:
[1]
2