在Python模块Pandas中,concat
函数是一个常用的函数,用于将多个pandas对象(如Series、DataFrame)沿着一条轴进行连接,下面是对Pandas concat
函数的详细解释以及代码示例。
Pandas concat函数详解
concat
函数的基本语法如下:
pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False)
参数解释:
objs
: 需要连接的pandas对象(Series或DataFrame)的序列或映射;axis
: 连接的轴,默认为0,即按行连接;如果为1,则按列连接;join
: 连接方式,默认为'outer',表示外连接;'inner'表示内连接;ignore_index
: 是否重置索引,默认为False;keys
: 可选参数,用于在连接时添加层次化索引中的键;levels
: 用于构建多层索引的参数;names
: 用于结果中索引的名称;verify_integrity
: 检查是否有重复项,默认为False;sort
: 对列标签进行排序,默认为False。
代码示例
示例1:按行连接两个DataFrame
import pandas as pd # 创建两个DataFrame
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']},
index=[0, 1, 2, 3]) df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
'B': ['B4', 'B5', 'B6', 'B7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D': ['D4', 'D5', 'D6', 'D7']},
index=[4, 5, 6, 7]) # 使用concat函数按行连接两个DataFrame
result = pd.concat([df1, df2])
print(result)
示例2:按列连接两个DataFrame
# 假设我们有两个具有相同索引的DataFrame
df3 = pd.DataFrame({'E': ['E0', 'E1', 'E2', 'E3'],
'F': ['F0', 'F1', 'F2', 'F3']},
index=[0, 1, 2, 3])# 使用concat函数按列连接两个DataFrame
result_col = pd.concat([df1, df3], axis=1)
print(result_col)
示例3:使用keys参数
# 使用keys参数添加层次化索引
result_keys = pd.concat([df1, df2], keys=['df1', 'df2'])
print(result_keys)
注意事项
- 当连接DataFrame时,如果列名不完全相同,则结果DataFrame将包含所有唯一的列名,并且缺失的列将填充为NaN。
- 如果在连接时遇到索引冲突(例如,两个DataFrame具有相同的索引),则可以通过设置
ignore_index=True
来重置索引。 - 使用
keys
参数时,结果DataFrame将具有一个额外的索引级别,该级别由keys
参数中的值组成。