体验谷歌 Gemini 2.0 Flash (lmage Generation) 多模态大模型,对话式图像编辑,再也不用PS了

Gemini 2.0 Flash (Image Generation) Experimental 是谷歌推出的一款实验性多模态 AI 模型,它是 Gemini 2.0 大模型的系列之一,它主要的功能是将文本生成与图像生成能力整合到一个统一的框架中,为开发者提供更强大的创作工具。
Gemini 2.0 Flash (Image Generation) 特别强化了原生图像生成功能,能够通过自然语言提示生成图像,并支持多轮对话式图像编辑。
与传统的图像生成模型不同,Gemini 2.0 Flash 将图像生成功能内置于模型中,无需依赖外部扩散模型。这使得它在理解提示和生成图像之间更加无缝
1,你可以他通过自然语言描述直接让它生成图片,无需复杂的提示词。
2,它支持对话式编辑,用户可以通过自然语言逐步调整图像,如下图我让它给图片中的人物换一身衣服,换一个姿势,换一个背景等等!整个过程,人物的始终保持一致性。
体验谷歌 Gemini 2.0 Flash (lmage Generation) 多模态大模型,对话式图像编辑,再也不用PS了 体验谷歌 Gemini 2.0 Flash (lmage Generation) 多模态大模型,对话式图像编辑,再也不用PS了
3,再来看一个比较实用的,我最近想给厨房加个置物板。直接扔给Gemini 2.0 Flash (Image Generation) ,通过简单描述他就能帮你生成逼真效果图。
那么我们是不是可以在装修/买家具的时候,直接拍照让它为你生成效果图呢?
体验谷歌 Gemini 2.0 Flash (lmage Generation) 多模态大模型,对话式图像编辑,再也不用PS了
4,另外它还特别适合生成带有图像的叙事内容,

比如,你可以输入“讲述一个关于小乌龟冒险的五幕故事,每幕配一张 3D 卡通风格的图像”,它会生成连贯的故事文本并配上相应的图像,角色和场景风格保持一致。这种能力非常适合创建互动故事、漫画或教育内容。
体验谷歌 Gemini 2.0 Flash (lmage Generation) 多模态大模型,对话式图像编辑,再也不用PS了
5,你甚至还可以用它做一个小红书美女号,先用AI生成一张你满意的美女照片。然后通过Gemini 2.0 Flash为你生成不同场景、不同姿势的照片。如果想制作视频,还可以使用可灵AI将图片生成动态视频。

使用方法

目前Gemini 2.0 Flash (Image Generation) Experimental模型官网还没有上线,仅能在 Google AI Studio上可以免费体验:
网站地址:https://aistudio.google.com/  (需要特殊网络)
© 版权声明

相关文章

暂无评论

暂无评论...