在一年一度的谷歌I/O开发者大会上,谷歌CEO桑达尔·皮查伊 (Sundar PichAI)表示,正在借助生成式AI迈出下一步。“通过大胆而负责任的方法,我们正在重新构想我们所有的核心产品,包括搜索。”
在这场备受关注的大会上,谷歌反复提到了“AI”,试图向人们证明自己作为“AI-first company”所历七年旅程的成果。于是便有了全新的谷歌AI全家桶,但这些和微软发布过的产品、功能有何不同呢?
新一代大模型,部分测试表现超过GPT-4
“PaLM 2是我们以负责任的方式将AI带给数十亿人的最新一步,建立在两个世界级研究团队Brain Team和DeepMind取得的进展之上。”
谷歌对PaLM 2的重视溢于言表,对标GPT-4的意味显而易见。而其技术报告显示,部分测试表现(如数学)超过了GPT-4。(报告详情:https://ai.Google/static/documents/PaLM2techreport.pdf)
根据官方介绍,PaLM 2的优势包括:
• 多语言性:PaLM 2在多语言文本方面接受了更多训练,涵盖100多种语言,提高多种语言的理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力,甚至通过了“精通”级别的高级语言能力考试。
• 推理:PaLM 2的广泛数据集包括科学论文和包含数学表达式的网页,展示了逻辑、常识推理和数学方面的改进能力。
• 编码:PaLM 2在大量公开可用的源代码数据集上进行了预训练,擅长 Python和JavaScript等流行的编程语言,也可生成Prolog、Fortran、Verilog等语言的专用代码。它不仅能够理解、生成和调试代码,还能解释原因,以便开发者在世界各地进行协作。
而PaLM 2还提供了4种不同尺寸——Gecko(壁虎)、Otter(水獭)、Bison(野牛)、Unicorn(独角兽)。其中,Gecko非常轻巧,即便在离线时也可以在移动设备上快速运行。
会上,谷歌还举了两个微调PaLM 2以在特定领域发挥作用的例子:
• Sec-PaLM:针对安全用例进行微调,可用来更好地检测、解决恶意脚本。
• Med-PaLM 2:针对医学知识进行微调,在医学执照考试式问题上表现出“专家”水平,添加的新功能支持合成来自医学成像的信息。
目前,谷歌旗下超过25种产品和功能由PaLM 2提供支持,并已于3月推出预览版本。而即日起,开发人员可以注册使用PaLM 2模型,客户可以在具有企业级隐私、安全和治理的Vertex AI中使用该模型。
此外,谷歌还透露了最近将谷歌大脑和DeepMind合并成一个团队,即Google DeepMind,并仍在训练下一代基础模型Gemini(双子座)。
Gemini旨在实现多模式、高效的工具和API集成,实现未来的创新,如记忆和规划。经过微调和严格的安全测试后,Gemini同样将提供多种尺寸。
更新包括图像功能、编码功能和应用程序集成
作为对标ChatGPT的AI聊天机器人,Bard更新包括图像功能、编码功能和应用程序集成。其借由全面接入PaLM 2新一代大模型,提升了在数学、推理和编码等方面的能力。
Bard此次更新的亮点集中在其聊天问答支持图像互动。比如询问旅游攻略,能够得到图文并茂的回答;提问中包含小狗照片,Bard能借助Google Lens对照片进行分析,在几秒内检测品种,并起草创造性的说明文字。
但最受人们欢迎的还是Bard在引入编码和导出功能上的表现:
• 来源引用:引用从下周开始更加精确。如果Bard引入了一段代码或引用了其他内容,只需单击注释,Bard会在这些部分下划线并链接到源代码。
• 深色主题:这是开发人员要求的功能,有助于更轻松地与巴德互动。
• “导出”按钮:应广大开发者要求,与Replit合作推出一键导入功能,支持将Bard生成的代码直接导出到Colab,从 Python 开始。
此外,Bard还新增了两个导出操作,可以轻松地将Bard的回复直接转移到Gmail和Docs中。而诸如Drive、地图等谷歌的应用程序和服务功能也都集成到了Bard的体验中。
除了自家应用功能的集成,Bard还将能利用来自整个网络的各种服务,及来自外部合作伙伴的扩展。谷歌透露,在接下来的几个月里,将把Adobe的创意生成AI模型系列Adobe firefly集成到Bard中,帮助用户创意作图,解决版权的后顾之忧,并支持进一步编辑或添加设计到Adobe Express。
值得一提的是,Adobe只是开始,后续还会同Kayak、OpenTable、ZipRecruiter、Instacart、Wolfram、Khan Academy等开展合作,以增加Bard服务的可能性。
此外,即日起,Bard取消了候补名单,向180多个国家和地区开放,并新增了日语和韩语版本,很快将支持40种语言。
使用生成式AI,开启AI对话
随着生成式AI的新突破,谷歌开始重构搜索引擎,解锁全新问题类型,并通过改变信息组织方式来帮助用户整理并理解其中的内容。
更直白来说,对于“对于有 3 岁以下孩子和狗的家庭来说,去布莱斯峡谷还是拱门更好”这样的问题,以前需要用户通过自己把它拆成各种小问题去搜索并整理大量信息,才能找到答案,如今可以借助生成式AI一步到位。
在升级之后的搜索引擎,用户可以看到需要考虑的关键信息的AI驱动快照,以及每一个建议的依据链接。而在快照下方,用户还可以看到继续提出问题的提示,如“与孩子一起在布莱斯峡谷度过多长时间”等,点击即可便捷地打开新的对话。
借助这种能力,搜索中的生成式AI还能够帮助用户在搜索产品时,快速了解需要考虑的因素和符合要求的产品,并将获得产品说明,包括相关的最新评论、评级、价格和产品图片,以做出理性的购物决定。
这种AI购物体验建立在谷歌的Shopping Graph之上,其拥有超过350亿个产品列表,是世界上最全面的不断变化的产品、卖家、品牌、评论和库存数据集,每小时刷新超18亿个列表,为用户提供新鲜、可靠的结果。
值得一提的是,谷歌仍然认为广告是网络运作方式的重要组成部分,因此搜索广告将继续出现在页面的专用广告位中,但会确保与自然搜索结果区分开来。
此外,谷歌还开放了搜索实验室的注册。谷歌称正在搜索实验室中进行一项名为SGE(搜索生成体验)的实验,未来几周内将开放,但暂时只支持美国用户使用。(申请链接:https://labs.google.com/search)
办公软件的AI助手,对标微软Copilot
谷歌将Duet AI定义为“一个永远在线的人工智能协作者”,并在发布会现场展示了其在两种场景中的应用。
1、Workspace(申请链接:https://workspace.google.com/labs-sign-up/)
Workspace是谷歌旗下的实时协作办公平台,嵌入Duet AI后将创造全新的工作方式,其新能力包括:
• 帮助写作:在Gmail中,根据用户输入的提示来起草完整的回复,并补充邮件内容;在Docs中,辅助用户写内容之余,还能提供用于位置和状态等信息的智能芯片,以及自定义的详细信息变量。
• 生成PPT:根据用户输入的提示,直接在Google PPT中从文本创建原始图像,甚至可以将从未存在过的事物形象化为图片素材。
• 生成表格:通过自动数据分类和创建自定义计划,帮助用户更快地分析和处理表格数据。
• 自定义视频通话背景:为用户的视频通话生成独特背景,便于用户在视频通话期间表达自己并加深联系,同时保护周围环境的隐私。
2、谷歌云(申请链接:https://cloud.google.com/ai/earlyaccess/join?hl=en)
Duet AI在谷歌云上能提供的新功能包括:
• 代码辅助:位实时输入时提供代码建议,生成完整的函数和代码块,识别代码中的漏洞和错误,同时提出修复建议。
• 聊天帮助:允许用户使用简单的自然语言来获得有关特定开发或云相关问题的答案,还可以提供架构或编码最佳实践,减少搜索相关文档的需要。
• 适用于App Sheet:允许用户创建智能业务应用程序、连接他们的数据,并通过自然语言将工作流构建到 Google Workspace 中。
此外,谷歌云还在机器学习平台Vertex AI上新了三款大模型:
• 代码生成基础模型Codey:通过代码生成、完成、聊天加速软件开发。
• 文生图基础模型Imagen:生成和定制工作室级图像。
• 先进语音模型Chirp:支持语音控制、字幕和语音辅助等语音任务。
AI对于谷歌来说,一方面是必须和微软重分江山的赛道,一方面也是助力产品升级的跳板。
比如,谷歌在这场大会上海提到了几个利用AI技术改进的产品,包括为了沉浸式地图Immersive View、方便图片编辑的Magic Editor、让安卓手机更加个性化的Magic Compose、Cinematic Wallpapers 和 Generative AI Wallpapers等。
而为了应对AI带来的信息风险,谷歌还将推出两种工具——水印和元数据,以便于未来识别AI生成内容。
谷歌此次爆炸式地推出AI全家桶,让不少支持者重燃了对这位搜索领域老大哥的信心。但也有不少用户认为,都是微软玩剩下的东西。
从目前的产品和功能上来看确实有点走微软老路的意思,不过我们也需要认知到,谷歌在AI一道上追赶微软的时间并不长,就能够做出看起来和微软“差不多”的产品。再者,微软目前用的是OpenAI的技术,而谷歌的技术都来源于自身,这又会不会成为AI大战后期的关键影响因素呢?
在科技日新月异的这几个月里,经历洗礼的所有人都明白了一个共同的道理,这个世界正在发生巨变,搜索引擎的竞争不过是缩影,正如谷歌或许也没想到自己多年的首位竟可能被AI颠覆,未到终局,难下定论。我们所需要做的是,好好利用这些不断涌出的新工具,以抵御未来的科技风暴。