用于生成 3D 角色动画的 HY-Motion 模型。
HY-Motion 1.0是一系列基于扩散变换器 (DiT) 和流匹配的文本到 3D 人体动作生成模型。它允许开发者根据简单的文本提示生成基于骨骼的 3D 角色动画,并可直接集成到各种 3D 动画流程中。该模型系列首次将基于 DiT 的文本到动作模型扩展到十亿参数级别,与现有的开源模型相比,在指令执行能力和动作质量方面均实现了显著提升。
-
卓越的性能:在指令执行能力和运动生成质量方面均达到卓越的性能。
-
十亿级模型:我们率先成功将基于 DiT 的模型扩展到十亿参数级别,用于文本到动作的生成。这使得模型拥有卓越的指令理解和执行能力,优于同类开源模型。
-
高级三阶段训练:我们的模型采用全面的三阶段流程进行训练:
-
大规模预训练:使用超过 3,000 小时的各种运动数据进行训练,以学习广泛的运动先验知识。
-
高质量微调:基于 400 小时精心挑选的高质量 3D 运动数据进行微调,以增强运动细节和流畅度。
-
强化学习:利用人类反馈和奖励模型中的强化学习来进一步改进指令遵循和动作自然性。
-