文章目录
- 一、论文速览
- 1.1 确定baseline
- 1.2 DepthMaster: Taming Diffusion Models for Monocular Depth Estimation
- 二、数据环境搭建
- 2.1 环境搭建
- 2.2 数据权重
- 三、推理debug
- 3.1 单图推理
- 3.2 数据集验证
- 四、模型训练
- 4.1 数据读取
- 4.2 训练流程
- 五、作业
一、论文速览
1.1 确定baseline
方法1:catalyzex
首先就是谷歌学术、搜索关键词、确定搜索年份
方法2:paperwithcode
1.2 DepthMaster: Taming Diffusion Models for Monocular Depth Estimation
https://indu1ge.github.io/DepthMaster_page
二、数据环境搭建
2.1 环境搭建
复杂项目尽量使用独立环境
3DGS、Mamba等需要编译CUDA算子时务必对齐cuda版本
2.2 数据权重
1.注意论文是否有额外的预处理步骤,如数据格式转换。
2.根据论文的要求或代码放置数据
3.注意训练、验证、测试集的划分
三、推理debug
3.1 单图推理
3.2 数据集验证
与论文验证一直
四、模型训练
4.1 数据读取
4.2 训练流程
五、作业
一、基于本课内容,复现DepthMaster,尝试使用accelerator库进行训练。
二、根据自身方向选择一个Baseline进行复现