北京时间周四深夜 ,AI巨头谷歌麾下的Nano Banana图像生成模型迎来重磅更新——Nano Banana Pro闪亮登场!
作为背景,谷歌于今年8月底发布基于Gemini 2.5 Flash模型的Nano Banana 。由于该模型能够将人物或者动漫照片变成栩栩如生的“3D打印手办”,短时间内形成全球范围内的破圈效应。谷歌CEO皮查伊披露 ,在Nano Banana的推动下,Gemini应用的月活用户数在短短1个季度内,就从4.5亿暴增至6.5亿。
随着本周谷歌发布新一代旗舰大模型 ,谷歌的图像生成模型也迎来了意料之中的飞跃式升级 。
用谷歌的话来讲,Nano Banana Pro能“以空前的控制力 、无瑕的文字呈现和增强的世界知识,将用户的构想变成工作室级的设计 ”。
据谷歌介绍 ,Nano Banana Pro基于本周早些时候发布的Gemini 3 Pro,不仅在细节表现力、图像分辨率和文本渲染准确性方面强于前一代Nano Banana,还能以不同风格、字体和语言生成文本。新一代图像生成模型还新增了编辑功能,并加入互联网搜索能力 。
谷歌强调 ,Nano Banana Pro是在图像中生成正确且清晰可读文字的最佳AI模型,不论是简短的标语还是长段落均可,支持更加丰富的纹理 、字体和书法。同时借助Gemini增强的多语言推理能力 ,用户可以生成多种语言的文本,或者对内容进行翻译和本地化。
(将一张照片转化为电影分镜,以及翻译饮料包装上的文字 ,来源:谷歌)
同时基于互联网知识库,Nano Banana Pro还能将现实世界的信息转化为生动形象的可视化信息,例如如何制作一杯豆蔻茶 。
谷歌透露 ,Nano Banana Pro也非常适合用来做PPT或者信息图表,同时会加入谷歌的办公套件Workspace。
Google Labs和Gemini副总裁Josh Woodward介绍称:“Nano Banana Pro在信息图表方面非常出色,可以用来制作幻灯片。它最多可以处理14张不同的图像 ,或5个不同的角色,并在某种程度上保持角色一致性。”
对于创意产业的工作者而言,Nano Banana Pro也大幅升级了编辑功能,直接将创意的决策权交到使用者手中 。
谷歌介绍称 ,新的编辑功能支持改变相机角度、场景光线、景深 、对焦等,同时可以调整多种纵横比,分辨率也从Nano Banana的1024X1024上升到最高4K。
(调整角度或图片焦点)
谷歌正在各项AI工具中推出Nano Banana Pro ,包括免费用户在内,都能在Gemini等应用中试用这一新功能(但会有配额限制)。Google AI Plus、Pro和Ultra订阅用户会获得更高的配额 。谷歌也表示,该功能随后也将率先在Flow(谷歌的AI电影制作工具)向Ultra订阅用户推出。
东财图解·加点干货正规配资平台网-股票配资公司_正规配资服务_配资服务平台提示:文章来自网络,不代表本站观点。
国务院新闻办公室9日发布《关于中美经贸关系若干问题的中方立场》白皮书,澄清中美经贸关系事实,阐明中方对相关问题的政策立场...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
A股三大指数今日震荡整理,截至收盘,沪指跌0.02%,收报3339.93点;深证成指跌0.26%,收报10003.2...
国海富兰克林基金国富深化价值基金经理刘晓日前发表了对 2025 年市场的展望。刘晓指出,国内经济正处于复苏通道,市场大幅...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...