遇到Git仓库迁移因历史大文件导致推送失败?虽然删除了文件,但它们仍藏在Git历史中。本文教你使用BFG工具彻底清理历史大文件,成功完成迁移并优化仓库!
背景
最近接到一个需求,要把一个 Git 仓库的代码完整迁移到另一个仓库。听起来很简单,对吧?理想情况应该是:
Done!🎉
但现实情况往往没那么顺利…… 😅
当我 push 到新仓库时,报错了。服务器拒绝了提交,原因是这个仓库存在大文件。
问题出在哪?
其实当我们手动删除大文件只是从最新代码里移除了它们,但实际上,它们仍然藏在 Git 的历史记录里。只要有人仔细翻看 commit 历史,还是能找到被删掉的大文件(甚至是敏感数据)。
这就像:
📂 工作目录(最新代码)→ 干干净净
📜 Git 历史(隐藏记录)→ 仍然藏着之前的文件
为了解决这个问题, 就需要彻底清理 Git 历史中的大文件,让仓库瘦身,成功 push 到新服务器!
准备示例
下面我们在Gitee上新建一个远程仓库来完整重现这个问题的场景。
首先在Gitee 删新建一个远程仓库:
拉取远程仓库
接下来我们在目录下添加一个大文件视频,并提交本地仓库, 然后删除大文件。
此时推送代码时, 推送失败。原因是当前文件为284.988MB超过最大100M。
BFG 删除历史文件
在操作之前, 使用--mirror
对仓库进行备份,拷贝一份新仓库
目前我们代码还没有提交所以我们使用本地路径克隆本地仓库
下载BFG Repo-Cleaner
,BFG
是一个jar
文件, 要求Java8 或更高版本的 Java 运行环境
https://repo1.maven.org/maven2/com/madgag/bfg/1.14.0/bfg-1.14.0.jar
将下载的jar 文件放在项目目录下, 使用--delete-filtes
删除文件
删除大文件后即可提交成功