cqwcns 发表于 2020-12-6 12:24

分享python pandas apply代码

以下apply代码实现的是新增一列,并根据“商户”的内容,来对新增列进行赋值(具体是判断商户包含regions 来确认区域),功能已实现。

另外,交流一下,我希望更复杂的判断,规则是:
先判断“范围”列,如果没有匹配结果,再判断“地址”列,如果还是没有匹配结果,再判断“商户”列,最后还是匹配结果的话就=“无匹配结果”。
不知道代码应该怎么写?会的指教一下,谢谢。

import numpy as np
import pandas as pd
regions = ['高州', '茂南', '信宜', '化州']

symbol = ['BABA', 'JD', 'APPLE', 'MS', 'GS', 'WMT']
data = {'行业': ['电商', '电商', '科技', '金融', '金融', '零售'],
      '价格': ,
      '交易量': ,
      '雇员': ,
      '范围': ['高州及镇隆周边', '公馆', '高山周边', '城区范围', '', '时代新城'],
      '地址': ['高州市公园路1号', '茂南大道东', '', '花园广场3楼', '', '信宜市世贸中心'],
      '商户': ['高州市金山建文电讯手机经营部W', '茂名市茂南区大众电脑维修部', '茂名市通汇电信器材有限公司(茂名通汇直营)W',
               '信宜市镇隆镇亚芳手机店W', '中移铁通有限公司化州运营中心W', '信宜市盛汇通讯器材商行W']}
df = pd.DataFrame(data, index=symbol)

df['区域'] = df['商户'].apply(lambda x: ''.join())

print(df)

四块五的妞 发表于 2020-12-6 12:48

刚到if前来围观

hydai520 发表于 2020-12-6 13:51

学习学习

cqwcns 发表于 2020-12-7 09:18

已解决

# 声明变量
listRegions = ['茂南', '电白', '高州', '化州', '信宜']


# 获得区域函数
def getRegion(x):
    for strRegion in range(len(listRegions)):
      if str(x.装维组用户班).find(listRegions) >= 0:
            return listRegions

    for strRegion in range(len(listRegions)):
      if str(x.五级地址名称).find(listRegions) >= 0:
            return listRegions

    for strRegion in range(len(listRegions)):
      if str(x.二级地址名称).find(listRegions) >= 0:
            return listRegions


...
# 调用
sheetOnTheWay['区域'] = sheetOnTheWay.apply(lambda x: getRegion(x), axis=1)

...
页: [1]
查看完整版本: 分享python pandas apply代码