Pandas小技巧

本文记录数据处理过程中用到的各种Pandas小技巧. ( ´▽` )ノ

长期更新!

统计某列元素类别

1
a = list(set(df['feature']))

统计某列各类元素数量

1
a = df['feature'].value_counts()

更进一步,如果我们想查看该列元素的分布,首先根据该列的索引排序

1
a = df['feature'].value_counts().sort_index()

若要获取index列表:

1
a.index

最终可以画出柱状图统计

1
plt.bar(a.index, a)

删除指定行

实际上是通过获取满足条件的索引列表,然后按索引删除.

假设要删除length一列小于0的项.

1
df = df.drop(df[df['length'] < 0].index)

替换特定值

1
df['feature'].replace(<original>, <replaced>, inplace=True)

按索引删除某一列

1
2
if 'feature' in df.columns.values:
train.drop('feature', axis=1, inplace=True)