当前位置：

Gemini 2

时间:2026-01-04 18:15:22 出处:探索阅读（143）

Gemini 2.0说话可以一键P图功能爆炸，玩不了的大家都贪哭！

比如一辆小车：

输入指令“将车改装成敞篷车”，即可立即将文字指令与图片结合，完成一键P图。

让我们找茬，发现除了车变成敞篷车，其他元素都变了，很好保持一致性。

不仅于此，Gemini 2.0还有一点“多模态版o1”的味道。

继续输入指令：想象一下，这辆车里装满了海滩用品。然后，将车身的颜色改为一种与夏季相关的颜色，并在变化过程中进行解释。

然后Gemini 2.0开始图文并茂一步一步推理生成先把车变成亮黄色，然后车里装满了遮阳伞等海滩用品

这就是Gemini 原生图像输出能力2.0系列。

在评论区下，一水儿都在寻找具体的上线时间：

OpenAI大将Logan被谷歌挖走 Kilpatrick回应，大家不用担心，明年年初会更广泛的推出。

各种P图都是一句话的事

除了上面显示的简单P图，你甚至可以与此同时，P图片中的多个元素，还能把一个物体变成另一个物体。

例如，把蓬松的夹克变成一个小枕头，把毯子拿出来：

这还没完，P结合不同的图片也行。

猫与枕头的结合，得到了一个非常有质感的猫枕头：

将猫和滑板结合起来，得到猫代言滑板。

遵守文字指令，Gemini 2.0成功地将猫变成了插图贴纸。

除此之外，Gemini 2.0 P图时还能更有想象力。

例如，当一个盒子打开时，它变成了酱阿姨：

开头展示的车也可以变成“飞车”：

另外，还有一种玩法。

在图像中圈出需要P的区域，只需“Open this”，Gemini 2.0可以直接结合文字指令理解图像，知道“this”的指代：

不得不说，那些有内测资格的玩家，可算是大伙儿贪得无厌。

参考链接：https://x.com/OfficialLoganK/status/1868364831948251419

来源：量子位

分享到：

上一篇： 跨境网络IP无疑是全球互联网地图的重要力量

下一篇： 一加 13外观爆料：设计酷似波板糖

温馨提示：以上内容和图片整理于网络，仅供参考，希望对您有帮助！如有侵权行为请联系删除！

自轻自贱网