python中的去重函数 python去重复函数

Python 去重，统计，lambda函数

df.drop_duplicates('item_name')

公司主营业务：成都网站制作、做网站、移动网站开发等业务。帮助企业客户真正实现互联网宣传，提高企业的竞争能力。创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化，感谢他们对我们的高要求，感谢他们从不同领域给我们带来的挑战，让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联推出峰峰矿免费做网站回馈大家。

方法一：

df.drop_duplicates('item_name').count()

方法二：

df['item_name'].nunique()

结果：50

附：nunique()和unique()的区别：

unique()是以数组形式（numpy.ndarray）返回列的所有唯一值（特征的所有唯一值）

nunique()即返回的是唯一值的个数

比如：df['item_name'].unique()

要求：将下表中经验列将按周统计的转换为经验不限，保留学历

df1['经验'] = df1['经验'].apply(lambda x: '经验不限'+ x[-2:] if '周' in x else x)

#解释：将‘5天/周6个月’变成‘经验不限’，然后保留学历‘本科’

方法二：定义函数

def dataInterval(ss):

if '周' in ss:

return '经验不限'+ ss[-2:]

return ss

df1['经验'] = df1['经验'].apply(dataInterval)

Python常用的几种去重方法

case1:用集合的特性set()，去重后顺序会改变

case1.1：可以通过列表中索引（index）的方法保证去重后的顺序不变

case2:使用循环查找的方式，不改变顺序

case3:通过删除索引

case4:itertools.groupby

case5:fromkeys

case6:reduce方法

python 数组去重的方法

如：arr =['a','d','e','a']

用： arr= sorted(set(arr), key=arr.index)

同： arr = list(set(arr))

arr.sort(key=arr.index)

⚠️直接set(arr)也可以去除重复元素，只是新数组的顺序就不是原来的顺序了。

如：arr=[{'text':wuyuan,'value':1},{'text':默认,'value':2},{'text':默认,'value':2},

{'text':wyy,'value':4}]

用： f = lambda x,y:x if y in x else x + [y]

arr = reduce(f, [[], ] + arr)

⚠️这里去除的字典里面的键值对必须是完全一样的。

python删除重复数据

利用集合的不重复属性，可以先转换至集合，再用list()函数转换回来即可。

比如，a是一个列表，a=list(set(a))，即可完成列表去重。

本文题目：python中的去重函数 python去重复函数
文章来源：http://chengdu.cdxwcx.cn/article/doiogio.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

python中的去重函数 python去重复函数

Python 去重，统计，lambda函数

Python常用的几种去重方法

python 数组去重的方法

python删除重复数据

其他资讯

Android应用程序组件Activity的"singleTask"(12)

超级浏览器和vps哪个更安全？（不用备案的云vps购买怎么配置）

网站ICP备案怎么填写？(网站lcp备案查询)

怎么编辑软件?（怎么编辑软件名字)

Oracle数据库：全局索引的ONLINE重建要影响执行速度

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

python中的去重函数 python去重复函数

Python 去重，统计，lambda函数

Python常用的几种去重方法

python 数组去重的方法

python删除重复数据

其他资讯

Android应用程序组件Activity的"singleTask"(12)

超级浏览器和vps哪个更安全？（不用备案的云vps购买怎么配置）

网站ICP备案怎么填写？(网站lcp备案查询)

怎么编辑软件?（怎么编辑软件名字)

Oracle数据库：全局索引的ONLINE重建要影响执行速度

成都网站建设设计将想法与焦点和您一起共享