通义万相是阿里云推出的多模态生成式AI平台,涵盖图像与视频两大领域的创作能力。
它隶属于阿里云“通义”大模型家族,自2023年7月上线以来不断迭代,2025年1月发布的Wan2.1版本大模模型在视频生成领域表现尤为突出,登上权威评测集VBench榜首,成为全球领先的视频生成模型之一

视频生成大模型Wan 2.1
2025年02月25日 ,视频生成大模型Wan 2.1正式开源,包括14B和1.3B两个版本的,1.3B的这个小模型,支持在消费级显卡进行部署。
目前通义万相(Wan2.1)已经在GitHub、Hugging Face、魔搭社区等平台开源,支持多种主流框架,可以在以上平台进行一键部署,快速体验。
当然普通用户也可以直接在万相的官网直接在线体验。生成一条视频大约需要三至五分钟。

产品功能
通义万相的功能分为图像创作与视频生成两大模块:
- 图像创作
- 文生图/图生图:通过文本描述或参考图生成高质量图像,支持中式元素(如苏绣、水墨画)的风格化处理。
- 虚拟模特:上传商品图片,自动生成虚拟模特穿戴效果,助力电商营销。
- 涂鸦作画:手绘草稿结合文本描述生成完整画作,适合艺术创作。
- 个人写真:上传2-4张照片,生成风格化写真大片。
- 艺术字:将文字转化为动态或静态艺术字体,支持粒子特效等视觉效果。
- 视频生成
- 文生视频/图生视频:输入文本或图片生成最长5秒(可扩展至无限时长)的1080P视频,支持中英文文字特效与复杂场景(如花样滑冰、水墨晕染)的物理模拟。
- 多对象生成:同时处理多个对象的运动与空间关系,确保画面协调。
- 影视级特效:生成电影分镜、舞台背景(如春晚的毛毡画、花灯效果)等专业级内容
价格
- 个人用户:基础功能(如图像生成、短视频生成)目前在官网是完全免费的,但每次生成需要灵感值,灵感值可以通过签到,创作投稿等多个渠道获取。图片生成每次消耗1点,视频消耗5点。

- 企业用户:API调用需通过阿里云百炼平台按需计费,具体定价需联系官方
数据统计
相关导航
暂无评论...