pandas merge 时列名冲突但不想加后缀 _x/_y 的写法

舞夢輝影 2026-01-19 00:00:00 次阅读

用 suffixes=('', '') 可避免 merge 时添加 _x/_y 后缀，但要求冲突列内容逐行完全一致，否则结果取左表值且不报错；更稳妥的方式是提前删列、重命名或用 combine_first/update。

直接用 suffixes=('', '') 即可让 pandas 在 merge 时不加 _x/_y 后缀，但前提是冲突列（即左右 DataFrame 中同名但非合并键的列）必须**内容完全一致**，否则会报错或产生意外结果。

如果左右表中某列同名但值不同，又不想加后缀，最稳妥的方式是提前删掉其中一方的该列：

删右表的列（保留左表的）：
df_right_dropped = df_right.drop(columns=['col_name'])
result = pd.merge(df_left, df_right_dropped, on='key')
删左表的列（保留右表的）：
df_left_dropped = df_left.drop(columns=['col_name'])
result = pd.merge(df_left_dropped, df_right, on='key')

仅当确认同名列在左右表中**逐行完全相等**时可用，否则 merge 会成功但可能掩盖数据不一致问题：

当右表是“更新源”，希望用右表值覆盖左表对应 key 的同名列时：

先设索引对齐：left_idx = df_left.set_index('id')，right_idx = df_right.set_index('id')
用 combine_first（右表优先填充缺失，冲突时左表保留）：
result = right_idx.combine_first(left_idx).reset_index()
或用 update（原地用右表更新左表，只改已有 key 的行）：
left_idx.update(right_idx)，再 reset_index()