AI绘画

Depth-Anything

Depth Anything 是一种高度实用的解决方案,通过在150万张标记图像和超过6200万张未标记图像的组合上进行训练,可以实现稳健的单目深度估计。

标签:

Depth Anything 是一种高度实用的解决方案,通过在150万张标记图像和超过6200万张未标记图像的组合上进行训练,可以实现稳健的单目深度估计。

Depth-Anything

Depth Anything 的主要功能

相对深度估计:

我们在此列出的基础模型可以为任何给定的图像提供稳健的相对深度估计。详情请参阅此处。

度量深度估计

我们使用来自NYUv2或KITTI的度量深度信息对我们的Depth Anything模型进行微调。它具有在域内和零样本情况下进行强大的度量深度估计能力。详情请参阅此处。

更好的深度条件控制网络

我们重新训练了一个基于Depth Anything的更好的深度条件控制网络。它比之前基于MiDaS 的ControlNet 提供了更精确的合成效果。详情请参阅此处。您还可以在ControlNet WebUI 或ComfyUI's ControlNet中使用基于Depth Anything 的新ControlNet。

下游高级场景理解

Depth Anything编码器可以被微调用于下游高级感知任务,例如语义分割,在Cityscapes上达到86.2 mIoU,在ADE20K上达到59.4 mIoU 。详情请参阅此处。

Depth Anything 相关视频



数据统计

相关导航