cqwcns 发表于 2020-12-6 00:08

python pandas多列apply的问题。

以下代码apply部分实现的是新增一列,并根据['商户']的内容来对新列进行赋值(判断商户包含的区域名称)。
但由于有时数据并不完整,我希望改为通过'范围'、'地址'、'商户'三列来判断区域(而不是仅判断“商户”一列),代码要怎么改?请指教,谢谢。

import numpy as np
import pandas as pd
regions = ['高州', '茂南', '信宜', '化州']

symbol = ['BABA', 'JD', 'APPLE', 'MS', 'GS', 'WMT']
data = {'行业': ['电商', '电商', '科技', '金融', '金融', '零售'],
      '价格': ,
      '交易量': ,
      '雇员': ,
      '范围': ['高州及镇隆周边', '公馆', '高山周边', '城区范围', '', '时代新城'],
      '地址': ['高州市公园路1号', '茂南大道东', '', '花园广场3楼', '', '信宜市世贸中心'],
      '商户': ['高州市金山建文电讯手机经营部W', '茂名市茂南区大众电脑维修部', '茂名市通汇电信器材有限公司(茂名通汇直营)W',
               '信宜市镇隆镇亚芳手机店W', '中移铁通有限公司化州运营中心W', '信宜市盛汇通讯器材商行W']}
df = pd.DataFrame(data, index=symbol)
df.name = '美股'
df.index.name = '代号'

df['区域'] = df['商户'].apply(lambda x: ''.join())

print(df)

choolyee 发表于 2020-12-6 01:06

本帖最后由 choolyee 于 2020-12-6 01:27 编辑

import numpy as np
import pandas as pd

regions = ['高州', '茂南', '信宜', '化州']

symbol = ['BABA', 'JD', 'APPLE', 'MS', 'GS', 'WMT']
data = {'行业': ['电商', '电商', '科技', '金融', '金融', '零售'],
      '价格': ,
      '交易量': ,
      '雇员': ,
      '范围': ['高州及镇隆周边', '公馆', '高山周边', '城区范围', '', '时代新城'],
      '地址': ['高州市公园路1号', '茂南大道东', '', '花园广场3楼', '', '信宜市世贸中心'],
      '商户': ['高州市金山建文电讯手机经营部W', '茂名市茂南区大众电脑维修部', '茂名市通汇电信器材有限公司(茂名通汇直营)W',
               '信宜市镇隆镇亚芳手机店W', '中移铁通有限公司化州运营中心W', '信宜市盛汇通讯器材商行W']}
df = pd.DataFrame(data, index=symbol)
df.name = '美股'
df.index.name = '代号'
df['临时'] = df['范围']+df['地址']+df['商户']
df['区域'] = df['临时'].apply(lambda x: ''.join())
df = df.drop(columns=['临时'])
print(df)
曲线救国也是可以的嘛:lol

bing90740 发表于 2020-12-6 07:55

学习了,谢谢

chunfengyidu 发表于 2020-12-6 08:07

学习一下,谢谢楼主分享

wanderrr 发表于 2020-12-6 09:17

choolyee 发表于 2020-12-6 01:06
import numpy as np
import pandas as pd



大佬,能解释下这段代码
for y in regions:
    if x.find(y) >=0:
      return y
    else:
      return ''
为什么能写成这样 y if x.find(y) >= 0 else '' for y in regions 吗?
或者哪里能搜到相关的知识点。
谢谢

jixiangyh 发表于 2020-12-6 09:51

学习了,感谢分享

cqwcns 发表于 2020-12-6 09:58

choolyee 发表于 2020-12-6 01:06
import numpy as np
import pandas as pd



有点曲,但可以接受。

但我发现一个问题,如果'范围'、'地址'、'商户'三列均不为空时,这样是可以的。
但如果其中有一列为空,则拼接出来的结果也是空的,这个怎么解决?

神枪泡泡丶 发表于 2020-12-6 11:39

cqwcns 发表于 2020-12-6 09:58
有点曲,但可以接受。

但我发现一个问题,如果'范围'、'地址'、'商户'三列均不为空时,这样是可以的。 ...

我测试的时候完全没发现你说的这个问题。。 至于APPLE那个为什么为空,你的范围 地址 商户里面 都没有对应的region的关键词。。这能不为空吗

cqwcns 发表于 2020-12-6 11:44

神枪泡泡丶 发表于 2020-12-6 11:39
我测试的时候完全没发现你说的这个问题。。 至于APPLE那个为什么为空,你的范围 地址 商户里面 都没有对 ...

解决了,加了一个.map(str)就可以了

['装维组/用户班'].map(str)

ol416 发表于 2020-12-6 12:18

本帖最后由 ol416 于 2020-12-6 12:23 编辑

@wanderrr

status = True
0 if status else 1你运行之后就知道了
页: [1] 2
查看完整版本: python pandas多列apply的问题。