VBench 是由上海人工智能实验室(上海AI实验室)、南洋理工大学S-Lab、香港中文大学、南京大学等联合开发的综合性视频生成模型评测框架,旨在为 AI 视频生成领域提供标准化、多维度、可扩展的评估工具。
它通过分层评测维度、与人类感知对齐的评估方法,帮助用户快速了解不同模型的性能特点,并为技术改进提供方向

产品功能
- 多维评测体系
- 包含 16 个独立评测维度,涵盖视频质量(如时序一致性、动态程度、美学质量)、语义对齐(如物体类别、空间关系)等核心指标。
- 支持 8 大场景类别(如“人类动作”“交通工具”),针对性分析模型在不同场景下的表现29。
- 模型覆盖广泛
- 评测对象包括 开源模型(如 VideoCrafter、Show-1)和 闭源模型(如 Gen-2、Pika),目前已支持 40+ 视频生成模型(如 Gen-3、Kling)。
- 兼容 文本生成视频(T2V) 和 图像生成视频(I2V) 任务,并提供适配不同分辨率的评测方案。
- 自定义评测
- 支持用户上传自定义视频或提示词(Prompt),灵活评估模型在特定场景下的表现
视频大模型排行榜VBench Leaderboard
通过VBench评测后得出了一份视频大模型排行榜,让你快速了解哪个视频生成模型更好!!
VBench排行榜地址:https://huggingface.co/spaces/Vchitect/VBench_Leaderboard

数据统计
相关导航
暂无评论...