Sora向左,阿里向右:全能演技派模型登场千问APP
鹭羽 发自 凹非寺量子位 | 公众号 QbitAI一个APP就能搞定爆款视频这届AI玩家也太猛了。能捏脸、能控色、会排版、全模态、戏感强还保真……划重点几乎只有你想不到的就没有它做不到的。不卖关子了——这款全能创作搭子就是阿里最新上线千问APP的Wan2.7好玩程度直接硬控我一整天。不妨先来段视频感受一下be likePrompt生成一段视频一个男人非常吃惊地看向镜头镜头拉远一群人都很吃惊镜头翻转原来是他们看到了Wan2.7的广告牌。人物表情生动自然镜头衔接流畅都相当符合Prompt要求尤其是群像塑造上真正做到了“千人千面”。同时还自动生成了匹配的人声音效就这成片给到一个夯难度升级再来一个图生视频试试比如喂给AI一张图片以及一段音频Prompt根据图片和音频生成一段萨克斯表演。nice光影变幻间即刻上演一场精彩的单人萨克斯演出再加点料在原视频基础上补充一张尾帧图让演奏者丝滑切换Prompt根据图片续写该视频让女性演奏家加入表演。效果是酱紫的而这些通通都是我在千问APP上完成的操作非常简单只需在“AI视频”中上传刚刚生成的第一段视频以及尾帧图片即可。这一次不止视频生成得到史诗级增强图片能力也直接next level。无论是8色HEX精准控制还是3K tokens超长文本支持AI创作这件事都在千问APP中变得so easy话不多说直接深度开测。这届AI来了位实力演技派交互页面倒是没有比较大的改动要么创作面板要么chat对话。总之以前千问APP怎么用的现在就还怎么用。主要是新增了视频编辑、视频续写、动作模仿能力加上模型能力Pro下面我们以具体的创作过程一一道来。先看图像生成。这次Wan2.7-Image的亮点是“千人千面”比如在人物脸部上用户可以自定义五官细节包括骨相、眼神、皮肤纹理等。这里我们尝试用Wan2.7-Image复刻《哈利波特》原著中的斯内普教授形象一个大约35岁的男人面色蜡黄油腻的及肩黑发显眼的鹰钩鼻冷漠空洞、像黑色隧道一样的双眼。身穿一件高领黑色长袍背景为霍格沃茨昏暗潮湿的地窖。u1s1说这是真人定妆照也不为过。眼神复杂幽深连毛孔皱纹都清晰可见。同样的我们把提示词交给Gemini和ChatGPT。△左Gemini右ChatGPT。显而易见Gemini直接照搬电影版选角ChatGPT在鹰钩鼻的塑造上并不贴合。但都比电视剧版好太多……dogeWan2.7-Image还具有调色盘能力比如这个实用性的场景设计一张赛博朋克风格的深夜街道照片细雨蒙蒙画面主色调选择蓝色RGB(070255)。镜头焦点是一个发光的霓虹灯招牌上方写着大而清晰的汉字“未来之城”下方写着手写体英文“Neo Metropolis”。将图片导入PS可以直观看到画面主色调精准落在蓝色系中色差控制在合理的误差范围之内。另外中英双语的文字渲染也没有出现乱码的情况。据官方介绍Wan2.7-Image还能支持最高3K token的超长文字输入可以写满足足一整页A4纸。这次Wan2.7的视频生成能力也有惊喜。比如让千问APP帮忙手搓一个旅游Vlog咱也来赶赶时髦。根据六宫格参考图生成一个巴西旅游Vlog。好好好也是在地球另一端感受到了桑巴热情。要是对视频细节不满意还可以进行局部编辑比如原视频是这样的只需输入提示词上传参考图就能将胶片一键替换成盘子。将视频中的胶片替换为图片中的盘子。且看盘子上的反光细节好评修改静态主体还不够我还能直接用千问APP的视频模仿功能无痛学习新动作比如我觉得这个小哥的动作很丰富尝试套到另一个角色身上让图片中的人物模仿视频中的人的手势动作保持双手配合和手势变化过程清晰可见。最后来玩个有意思的拍好莱坞大片看不够那就用视频续写延长战斗无奖竞猜男人为何如此惊恐总之实测下来Wan2.7给我最大的感受是——妙不仅仅可玩性大大提升而且用起来还特别方便。以前要创作一个视频需要经过反复多次的修改剪辑现在千问APP里就能一站式续写和参考重塑迅速提炼出爆款视频的流量密码。而且不只是日常的创意表达专业的平面设计或者影视制作也能大用特用就比如最近大热的AI演员、AI短剧Wan2.7就能分得一杯羹。而且演技还不输专业演员够真实、够好用。口说无凭例如在人类偏好盲测评分中Wan2.7-Image就位列国内生成模型第一超过GPT Image 1.5逼近Nano Banana Pro。实力能打人人可用那么这里就引出一个核心问题——Wan2.7的发布究竟代表着什么触手可及的创作让人人都能生产爆款显然这并非一句“千问团队实现技术突破”就能简单带过的。当我们将目光放大至整个行业就会发现一个愈加明显的趋势清晰可见AI内容生成正在加速进入中国时间。先看硅谷这边曾经的AI生成龙头Sora悄然退场以OpenAI为首的科技巨头纷纷从全面开花转向Agent和底层推理的战略性单点收缩。而例如视频生成这类高投入、慢回报的支线任务则被率先抛弃。但与之形成对比的是国内市场陆续迸发出多款高性能且全面的视频/图像生成模型。归根结底一方面是因为国内拥有更完善的C端场景如短视频、电商更适配AI内容生成的商业化落地。另一方面中国厂商也更注重培养模型的工程应用能力尝试以更行之有效的迭代速度和更低的成本加快AI融入创作者的工作流。那么如何更高效地打通AI到创作者的“最后一公里”呢依据多年深厚的用户场景积累阿里的答案简单粗暴——直给。也就是直接将最强模型同步装进APP。这源于阿里对市场的精准洞察技术领先只是大模型的入场券技术普惠才是产品真正的护城河。细数阿里千问最近的动作无一不在印证这点——春节期间“千问办事”的能力出圈现在又将Wan2.7下放到移动端就是为了让更多人能够第一时间享受到技术红利。只要用户开始用了就会发现AI创作这件事原来没有想象中那么难即使是对模型一窍不通也能通过最基础的功能按键和一句指令稳定创造出高水准的视频。可以预见的是未来制作爆款视频和精美图像就会变得像点外卖、刷视频一样简单到那一刻才是真正打开了人人AI创作的大门。一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完— 点亮星标 科技前沿进展每日见