本文记录数据处理过程中用到的各种Pandas小技巧. ( ´▽` )ノ
长期更新!
统计某列元素类别
1 | a = list(set(df['feature'])) |
统计某列各类元素数量
1 | a = df['feature'].value_counts() |
更进一步,如果我们想查看该列元素的分布,首先根据该列的索引排序
1 | a = df['feature'].value_counts().sort_index() |
若要获取index列表:
1 | a.index |
最终可以画出柱状图统计
1 | plt.bar(a.index, a) |
删除指定行
实际上是通过获取满足条件的索引列表,然后按索引删除.
假设要删除length
一列小于0的项.
1 | df = df.drop(df[df['length'] < 0].index) |
替换特定值
1 | df['feature'].replace(<original>, <replaced>, inplace=True) |
按索引删除某一列
1 | if 'feature' in df.columns.values: |