AI工具箱AI开源项目

Zero123-单视图输入生成 3D

一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。

标签:

Zero123简介

Zero123是一项革命性的技术,它致力于从单一图像出发,生成与其在3D空间中保持一致的多个视图。这项技术让一个静态的2D快照能够扩展至更为丰富的三维视角体验。近期,我们推出了Zero123的稳定版,它有力地提升了视图相关图像生成的质量并且有显著的进步与提升。

Zero123-单视图输入生成 3D

这一跃升得益于三项关键性的创新:

1. 训练数据集的改进: 我们在Objaverse数据库中进行精选,仅保留了高品质的3D对象数据,并以更现实的方式进行渲染。

2. 摄像机角度的估计引导: 在模型的训练与推理过程中,估算摄像机视角被用来引导模型,从而保证生成的内容具有更高的质量和准确性。

3. 数据集与数据加载器性能提升: 预先计算的数据集和改进的数据加载器,允许处理更大的批量尺寸。结合第一点的数据集改进,使训练效率相比Zero123-XL提升达40倍。

Zero123的特性:

– 生成新颖视图的能力:Zero123能从不同角度渲染出3D对象的外观,显示出从各个角度对物体外观的深刻理解。

– 基于Stable Diffusion 1.5:这一模型基于Stable Diffusion 1.5构建,意味着生成一个新视图需要与SD1.5相同的VRAM资源。

– 三维对象生成:使用Zero123在3D对象生成上,因其复杂度,建议使用至少有24GB VRAM的环境。

研究与实用性:

– 开放性:我们改进了Threestudio的开源代码,以支援Zero123及其稳定版的研究。

– 技术发展:技术上,我们采用分数蒸馏采样(SDS),利用稳定的Zero123优化NeRF,从而生成具有纹理的三维模型。

– 使用案例:该技术可适用于“文本到3D”的生成过程,先通过SDXL创建单一图像,再利用Zero123生成3D对象。

资源链接:

– 项目链接: https://github.com/cvlab-columbia/zero123
– 试用平台: https://huggingface.co/spaces/cvlab/zero123-live
– 研究论文: https://arxiv.org/abs/2303.11328

数据评估

Zero123-单视图输入生成 3D浏览人数已经达到64,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:Zero123-单视图输入生成 3D的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找Zero123-单视图输入生成 3D的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于Zero123-单视图输入生成 3D特别声明

本站小芊时光提供的Zero123-单视图输入生成 3D都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由小芊时光实际控制,在2024年4月18日 下午1:36收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,小芊时光不承担任何责任。

相关导航

暂无评论

暂无评论...