西风 转载整理自 知乎量子位 | 公众号 QbitAIGPT Image 2的发布给整个AI圈带来了亿点点震撼。但很多人可能没注意到幕后最会玩梗的居然是他——主力训练者陈博远。他和奥特曼同台主持悄悄修好了中文渲染给模型起代号“布基胶带”还拿香蕉艺术品玩梗为了秀模型的文字能力设计了米粒刻字、漫画套娃、视觉证明题这些“彩蛋级”测试。这篇分享里他把官网展示图片的幕后花絮全抖了出来又好笑又细节控狂喜。本文经授权转载以下为原文我在OpenAI修中文大家好我是GPT Image团队的研究科学家陈博远。上周发布的GPT生图模型就是我主力训练的这次终于轮到我和奥特曼一起主持发布会。很高兴这次修好了模型的中文渲染如果大家有什么反馈可以直接回复我哦。图1中是我在发布会上的直播不过多语言能力是直播后半节国内媒体好像并没有发现只有我才是国人QwQ。这次特意用图片生成了整个官网blog背后有很多花絮很好玩。△陈博远左二在OpenAI GPT Image 2发布会上和山姆奥特曼演示文字渲染能力我们的模型在发布前用duct-tape的代号在LMArena上进行了双盲测试。这个代号也是我起的意思是布基胶带也就是下面这个东西△duct tape翻译过来叫布基胶带不过国内不常见至于为啥起名叫布基胶带嘛..当然是因为你可以用布基胶带把香蕉贴在墙上啦△那幅世界闻名的艺术品就是用布基胶带把香蕉贴在墙上当然结果也是在双盲测试中断崖领先了代号为小香蕉的第二名。除此之外我花时间做了好多我们官网上的图片。整个Blog都是用图片生成的完全没有文本。下面这些图都是我亲手做的每张图的背后都有很多思考这里也像艺术家一样和大家展示下。然后是我们的中文彩蛋。当时特别想做一个很搞笑的漫画于是想到了接住梗和香蕉梗。当然为了秀一下文字能力我特意让他用多国语言加了很多文字并且家乡海报的右下角让他生成特别特别小的中文来测试到底能多细节。我为了让模型做一些只有我们才做得到的事情特意让它生成的图要看起来像是一张对着一本真的漫画书拍的照片。这整张图包括画中画和画中画中画都是一次性生成的。我设计完以后担心大家觉得这是张拼接图于是特地在图底加了备注。思来想去这样的文字渲染其实还是不够惊艳。在队友的提示下我做了一张4K图为了节省大家的流量压缩了一点点。内容是一堆米粒但是其中的一颗上面刻着字。你能找到吗这张日语漫画也是我做的。当时想做一个和GPT图片生成相关的漫画。当时做了一张和香蕉有关的巨搞笑的漫画但是感觉放在官网上不太合适。于是最后还是用了另一种方式把漫画和GPT生图联系在一起。我构思了羽毛笔这个主题剩下的只有很简单的提示词告诉他构思“戏剧化”的漫画。更多杂志页这张是和同事一起做的。思路是让生图模型用一些真实的物体结合艺术的布局。这样既可以体现模型的对真实世界的还原又不失设计感。做下面这张图的时候我在想到底有什么东西能突出我们模型在思考能力上的进步。如果让他解普通数学题方程啥的似乎就太简单了。Nano Banana似乎通过思考模式文字渲染的方式也能做。于是我想到了我非常喜欢的一个视觉证明来真正考验GPT Image 2独特的视觉推理效果。图里提示词说的是在黑板上用视觉而不是代数证明从1开始的奇数之和是一个平方。普通的模型其实很容易推理出代数解但是图形解只有视觉模型才能做了。最后这张图展示的是搜索能力要去我们官网的商店里找内容做一个海报。直播里我们还展示了Thinking mode自动生成二维码放进图片里其实背后有个彩蛋当时展示的二维码扫进去的前若干个人可以获得一个免费小奖品。最后的最后还是要感谢团队的齐心协力每个人都做了很多很多的事情。在发布前的尾声我除了在修一些小东西就是和市场部门的同事还有做艺术的同事一起准备发布会和这个网站他们真的是我见过的最强大的合作者了也让我们最后才有了这么漂亮的网站。希望这回稳稳地接住了大家《我在OpenAI修中文》https://zhuanlan.zhihu.com/p/2033191141806437343—欢迎AI产品从业者共建—「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。一键关注 点亮星标