Pandas2.2 Series
Computations descriptive stats
方法 | 描述 |
---|---|
Series.align(other[, join, axis, level, …]) | 用于将两个 Series 对齐,使其具有相同的索引 |
Series.case_when(caselist) | 用于根据条件列表对 Series 中的元素进行条件判断并返回相应的值 |
Series.drop([labels, axis, index, columns, …]) | 用于从 Series 中删除指定的行或列(对于 Series 来说,通常是删除行) |
Series.droplevel(level[, axis]) | 用于从多层索引(MultiIndex)的 Series 中删除指定的索引层级 |
Series.drop_duplicates(*[, keep, inplace, …]) | 用于从 Series 中删除重复的值 |
Series.duplicated([keep] ) | 用于检测 Series 中的重复值 |
Series.equals(other) | 用于比较两个 Series 对象是否完全相等的方法 |
Series.first(offset) | 用于根据日期偏移量(offset )选择 Series 中时间序列数据的初始部分 |
Series.head([n] ) | 用于返回 Series 的前 n 个元素 |
Series.idxmax([axis, skipna]) | 用于返回 Series 中最大值的索引 |
Series.idxmin([axis, skipna]) | 用于返回 Series 中最小值的索引 |
Series.isin(values) | 用于检查 Series 中的每个元素是否存在于给定的值集合 values 中 |
Series.last(offset) | 用于根据日期偏移量(offset )选择 Series 中时间序列数据的末尾部分 |
Series.reindex([index, axis, method, copy, …]) | 用于重新索引 Series 对象的方法 |
Series.reindex_like(other[, method, copy, …]) | 用于将 Series 对象重新索引以匹配另一个 Series 或 DataFrame 的索引的方法 |
Series.rename([index, axis, copy, inplace, …]) | 用于重命名 Series 对象的索引或轴标签的方法 |
Series.rename_axis([mapper, index, axis, …]) | 用于为 Series 的索引轴(index )或列轴(columns ,对于 Series 通常不适用)设置名称 |
Series.reset_index([level, drop, name, …]) | 用于将 Series 的索引重置为默认整数索引的方法 |
Series.sample([n, frac, replace, weights, …]) | 用于从 Series 中随机抽取样本的方法 |
Series.set_axis(labels, *[, axis, copy]) | 用于设置 Series 对象的索引标签的方法。 |
Series.take(indices[, axis]) | 用于根据指定的位置索引(indices )从 Series 中提取元素 |
Series.tail([n] ) | 用于返回 Series 的最后 n 行数据 |
Series.truncate([before, after, axis, copy]) | 用于截断 Series 或 DataFrame 的数据 |
Series.where(cond[, other, inplace, axis, level]) | 用于条件过滤和替换的函数 |
Series.mask(cond[, other, inplace, axis, level]) | 用于条件过滤和替换的函数 |
Series.add_prefix(prefix[, axis]) | 用于为 Series 的索引或列(对于 DataFrame)添加前缀 |
Series.add_suffix(suffix[, axis]) | 用于为 Series 的索引标签添加后缀 |
Series.filter([items, like, regex, axis]) | 用于筛选 Series 中元素的方法 |
pandas.Series.filter
pandas.Series.filter([items, like, regex, axis])
是用于筛选 Series
中元素的方法,它可以根据标签(索引)进行过滤。以下是各个参数的详细说明:
- items:列表形式,指定要保留的索引标签。
- like:字符串形式,保留包含该字符串的索引标签。
- regex:字符串形式,表示正则表达式,保留匹配该正则表达式的索引标签。
- axis:{0或‘index’},默认为0,表示沿哪个轴进行过滤。对于
Series
来说,这个参数通常不需要设置,因为Series
只有一个轴。
示例及结果
示例1:使用 items
参数
import pandas as pd# 创建一个简单的 Series
s = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])
print("原始 Series:")
print(s)# 使用 filter 方法筛选出指定的索引
filtered_s = s.filter(items=['a', 'c'])
print("\n筛选后的 Series (使用 items):")
print(filtered_s)
输出结果:
原始 Series:
a 10
b 20
c 30
d 40
dtype: int64筛选后的 Series (使用 items):
a 10
c 30
dtype: int64
示例2:使用 like
参数
# 创建一个带有特定模式的索引的 Series
s_like = pd.Series([1, 2, 3, 4], index=['one', 'two', 'three', 'four'])
print("原始 Series:")
print(s_like)# 使用 filter 方法筛选出包含 't' 的索引
filtered_s_like = s_like.filter(like='t')
print("\n筛选后的 Series (使用 like):")
print(filtered_s_like)
输出结果:
原始 Series:
one 1
two 2
three 3
four 4
dtype: int64筛选后的 Series (使用 like):
two 2
three 3
dtype: int64
示例3:使用 regex
参数
# 创建一个带有特定模式的索引的 Series
s_regex = pd.Series([100, 200, 300, 400], index=['apple', 'banana', 'cherry', 'date'])
print("原始 Series:")
print(s_regex)# 使用 filter 方法筛选出以 'a' 开头的索引
filtered_s_regex = s_regex.filter(regex='^a')
print("\n筛选后的 Series (使用 regex):")
print(filtered_s_regex)
输出结果:
原始 Series:
apple 100
banana 200
cherry 300
date 400
dtype: int64筛选后的 Series (使用 regex):
apple 100
dtype: int64
通过这些示例,可以看到 filter
方法在不同参数下的使用方式及其效果。