欢迎来到自轻自贱网

自轻自贱网

当前位置:

Gemini 2

时间:2026-01-04 18:15:22 出处:探索阅读(143)

Gemini 2.0说话可以一键P图功能爆炸,玩不了的大家都贪哭!

比如一辆小车:

输入指令“将车改装成敞篷车”,即可立即将文字指令与图片结合,完成一键P图。

让我们找茬,发现除了车变成敞篷车,其他元素都变了,很好保持一致性

不仅于此,Gemini 2.0还有一点“多模态版o1”的味道。

继续输入指令:想象一下,这辆车里装满了海滩用品。然后,将车身的颜色改为一种与夏季相关的颜色,并在变化过程中进行解释。

然后Gemini 2.0开始图文并茂一步一步推理生成先把车变成亮黄色,然后车里装满了遮阳伞等海滩用品

这就是Gemini 原生图像输出能力2.0系列。

在评论区下,一水儿都在寻找具体的上线时间:

OpenAI大将Logan被谷歌挖走 Kilpatrick回应,大家不用担心,明年年初会更广泛的推出。

各种P图都是一句话的事

除了上面显示的简单P图,你甚至可以与此同时,P图片中的多个元素,还能把一个物体变成另一个物体

例如,把蓬松的夹克变成一个小枕头,把毯子拿出来:

这还没完,P结合不同的图片也行。

猫与枕头的结合,得到了一个非常有质感的猫枕头:

将猫和滑板结合起来,得到猫代言滑板。

遵守文字指令,Gemini 2.0成功地将猫变成了插图贴纸。

除此之外,Gemini 2.0 P图时还能更有想象力

例如,当一个盒子打开时,它变成了酱阿姨:

开头展示的车也可以变成“飞车”:

另外,还有一种玩法。

在图像中圈出需要P的区域,只需“Open this”,Gemini 2.0可以直接结合文字指令理解图像,知道“this”的指代:

不得不说,那些有内测资格的玩家,可算是大伙儿贪得无厌。

参考链接:https://x.com/OfficialLoganK/status/1868364831948251419

来源:量子位

分享到:

温馨提示:以上内容和图片整理于网络,仅供参考,希望对您有帮助!如有侵权行为请联系删除!

友情链接: