Google I/O 2025 揭示了 Gemini AI 世界模型与通用助手愿景

在2025年谷歌在硅谷举行的I/O大会上,显而易见谷歌正加大其在人工智能领域的投入,旗下品牌“北斗星”涵盖多种模型架构与研究内容,迅速将创新应用到产品中。除了推出新功能外,谷歌还提出了一个大胆的愿景:打造一个以AI为核心的操作系统——不是传统的启动系统,而是一个每个应用都能访问的逻辑层。“世界模型”旨在支撑一个理解物理世界、能推理和为用户行动的通用助手。这个战略或许在众多发布内容中被掩盖,但却是谷歌超越竞争对手的关键所在。 谷歌投入数十亿美元支持这一“登月计划”,面对如何将AI研究快速转化为产品的挑战,力图比在包容性和商业适用性上更擅长的竞争对手更快出产品。它必须在微软的专注策略、OpenAI的硬件雄心以及在AI变革中保护其盈利丰厚的搜索帝国之间巧妙应对。 谷歌的规模庞大: Sundar Pichai透露,每月处理的令牌数达480万亿,是去年的50倍,几乎是微软的五倍。开发者的参与度也在激增,已有超过700万开发者使用“北斗星API”,比上一届I/O增长了五倍,Vertex AI的使用量也增长了40倍。通过如“北斗星2. 5”和“铁木 TPU”等先进模型,效率不断提高。新工具如“AI模式”和“AI概览”也已吸引15亿月度用户,帮助将搜索体验进一步转变为AI优先。 谷歌的中心愿景是“世界模型”,一款深刻理解真实世界动态的AI,支持由谷歌独家驱动的通用助手。这也带来了控制权的矛盾:谷歌是要通过内部整合AI以保护其2000亿美元的搜索业务,还是要向外部开发者开放基础AI——后者已涉及超过2000万开发者的生态系统?谷歌在其搜索中常常保留关键功能,但也逐渐向开发者开放,例如“Mariner项目”,其浏览器自动化功能很快将通过“北斗星API”广泛推广,让Automation Anywhere和UiPath等竞争对手可以在此基础上开发。 该愿景由DeepMind CEO Demis Hassabis阐述,他表示谷歌正在加倍努力实现通用人工智能(AGI)。“北斗星”作为最佳多模态模型,正逐步演变为“世界模型”——模拟世界原理,如因果关系和直观物理,类似人类学习的系统。DeepMind开发的Genie 2模型,可以根据文字或图像提示生成交互式游戏环境,正是这一思路的典型代表。自2024年底起,Hassabis持续扩展“世界模型”和“通用AI助手”的概念,Pichai和“北斗星”负责人Josh Woodward在I/O上反复强调。 “北斗星”应用力求成为个人、主动且强大的通用AI助手,代表向AGI迈出的重要一步。示范作品如“Flow”,利用Veo 3的物理感知视频和音频能力,成为一个电影制作平台,展现了世界模型在创意和机器人领域的应用。Pichai强调“Project Astra”通过整合实时视频理解和屏幕分享,推动“北斗星Live”成为这一“通用助手”发展的一部分。Woodward展示了用户的搜索历史、Gmail和日历等个人背景信息,如何帮助“北斗星”提前预知用户需求——如定制测验或个性化解答——推动“用思维创造未来”的愿景,并借助“北斗星2. 5 Pro”模型实现“思想成真”。 开发者工具方面,包含“北斗星2. 5 Pro”与“Deep Think”——能处理音频和网址链接的高效2. 5版模型,以及预览版“北斗星扩散”,显示谷歌愿意突破纯Transformer架构追求更高效率。AI Studio、Firebase Studio和Vertex AI则成为企业与开发者的主要入口。 在战略布局上,谷歌面临保护搜索收入的压力,同时快速推动AI落地。微软在企业生产力(如Office 365和Copilot)上的领导地位难以超越。谷歌的潜在优势在于打造一个更优越的AI原生界面——成为一种全新的人机交互操作系统。Pichai猜测,未来通过AR眼镜实现对周围环境的感知,可能成为新一轮突破点。 但挑战依然存在:美国司法部的反垄断审查、Chrome可能的剥离、欧洲数字市场法规,或都可能限制谷歌AI的扩展。执行速度至关重要,虽然近期进展显示谷歌正加快步伐。整个行业面临的挑战——如苹果在大规模AI转型中遇到的难题——凸显了这一变革的复杂性。然而,谷歌不断拓展企业AI客户的据点,背后仍具备稳固的执行力。 竞争对手也在同步推进。微软强调企业AI生产力,推出Microsoft 365 Copilot和Azure AI Foundry,并倡导“开放的智能网络”战略,融合多样的AI技术。OpenAI在消费者市场占据领先,ChatGPT月活用户达6亿,而“北斗星”为4亿,且近期推出搜索功能和广告计划,威胁谷歌搜索的垄断地位。OpenAI还大举投入硬件产品,企图复制苹果的移动端突破,但因为AI的开放性不断增强,其先发优势受到制约。与此同时,谷歌管理复杂的开发者工具生态,兼顾多元需求,亚马逊则通过“Bedrock”平台,为企业客户提供多款AI模型,继续扩大优势。 对企业而言,谷歌的“世界模型”愿景潜藏巨大变革潜能,但需要战略布局。抢在变革浪潮到来之前行动,避免未来出现高成本的“补丁”式改造。利用谷歌在多模态和AGI领域的最新进展,可能带来创新突破,但企业还需要准备应对新一代交互范式,整合API和代理式应用。企业应权衡长远愿景与实际短期需求,考虑微软或OpenAI更具实操性的硬件与AI结合方案,采用多平台、多技术的多元策略,顺应日益开放的智能联网格局。 这些关键决策和AI在实际中的应用方案,将成为VentureBeat“Transform 2025”大会的焦点,届时企业领袖和技术先驱将讨论平台选择与AI落地。因座位有限,建议提前注册。 总的来说,谷歌I/O展现了其雄心:通过构建基础性的“世界模型”和通用助手,竞逐AI未来的主导地位,企图重新定义计算模式并保持领先。技术潜力巨大,但实现与时机仍存疑问:谷歌能否比竞争对手更快整合其庞大的技术;能否在应对监管挑战的同时,真正实现搜索和生产力工具的变革?未来几年将是关键。成功有望开启一种以环境感知、个性化智能为特征的人机交互新时代,而失败则可能让谷歌沦为一个“雄心不驻、耗费一切”的巨头,最终被更敏捷、专注的竞争对手超越。
Brief news summary
在2025年Google I/O大会上,Google公布了其以Gemini项目为核心的先进人工智能战略,以及一项突破性的“世界模型”技术,旨在打造具备深度现实理解和交互能力的通用AI助手。这一创新目标是建立一个全新的人机交互操作系统——一种集成于各应用中的智能逻辑层,使Google在竞争中领先于微软、OpenAI等对手。公司CEO桑达尔·皮查伊强调,目前已有超过700万开发者在使用Gemini的API,而DeepMind的Demis Hassabis则强调朝向人工通用智能(AGI)方面的持续进步。展出的创新包括Flow电影制作工具以及展示高级世界模型理解的机器人模型。尽管取得了显著成就,Google在面对日益增多的监管审查时,仍需在开放开发者和控制其市值2000亿美元的搜索业务之间寻求平衡。微软、OpenAI、亚马逊等竞争对手也在快速推进,竞争日益激烈。Google庞大的AI生态系统提供了强大工具,但也增加了用户的复杂性。对于企业而言,Google的AI愿景有望带来变革,但其成功仍依赖于世界模型在应对更快部署的竞争者时的表现。最终,快速执行、无缝集成和灵活应对监管,将决定Google是否能在塑造全球数字交互和计算的关键AI赛道中引领环境智能时代,还是会落后于人。
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

香港启动区块链:欧洲最大银行推出结算服务
汇丰银行推出了香港首个利用区块链技术的结算服务,将普通银行存款转换为数字币。这一创新使企业几乎可以实现即时转账。 据汇丰全球支付解决方案的国内及新兴支付全球负责人孙Lewis表示,与传统系统相比,支付可能变得更快且成本更低。 代币化存款计划 汇丰银行的新型代币化存款计划允许企业在区块链平台上用代币交换标准存款。虽然企业将资金仍保留在银行的资产负债表上,但他们可以像数字货币一样收发资金。 孙强调,这一方法减少了额外的手续费和延迟,同时为每笔支付提供链上追踪,为企业提供实时现金流可视化。 全天候支付 汇丰银行表示,该服务全天候24/7运行,企业客户可以随时在汇丰香港钱包之间转账港币和美元。 这大大超越了传统银行服务,后者的转账通常在夜间或周末停止。实时交易让资金管理者能够迅速应对市场变化或紧急需求。 与蚂蚁国际的试点合作 据汇丰报告,阿里巴巴集团旗下的蚂蚁国际率先试点了该系统,使用蚂蚁的“鲸鱼”平台进行即时资金转账。此次试点于去年五月进行,所获经验已融入目前的正式服务中。 蚂蚁国际的平台技术总经理李凯文将代币化描述为连接传统银行与区块链的桥梁,旨在提高财务管理的透明度和效率。 监管支持与扩展 该项目得到了香港金融管理局(HKMA)分布式账本技术监管孵化器的支持。汇丰等多家银行已在HKMA的代币化试点计划中完成概念验证。 今年八月,HKMA推出了央行数字货币(CBDC)测试框架,并有包括汇丰在内的六家企业参与,用于数字资产交易的代币化试验。 香港拥抱区块链 这一举措推动香港朝着银行间区块链结算迈进。汇丰计划在2025年下半年将此服务扩展到亚洲和欧洲市场。 新系统有望革新大型企业的现金管理方式,消除等待银行营业时间的限制,避免意外费用。即时支付数据也能帮助企业全天获得更清晰的流动性信息。 不过,企业仍需升级后台系统以支持代币交互,区块链平台也必须保持强健的安全措施以防范漏洞和技术问题。 据标普全球市场情报最新的欧洲最大银行50强排名,汇丰目前是欧洲最大的银行。 图片由PYMNTS提供,图表来自TradingView。

谷歌的“人工智能模式”可能对Reddit不利
上周,谷歌宣布推出一项名为“AI模式”的新型AI驱动搜索功能。 这一发展可能会对Reddit造成挑战。 在过去的一年中,Reddit经历了显著增长,很大程度上归功于谷歌在搜索结果中优先显示Reddit链接,以及用户越来越倾向于寻找人性化的观点,因为网络上充斥着越来越多的AI和自动化机器人。 在上周的Google I/O大会上,CEO桑达尔·皮查伊将AI模式描述为“谷歌搜索体验的全面革新”。与传统的链接列表不同,AI模式将为用户提供更具对话性的界面,常常直接呈现来自Reddit的内容,无需用户直接访问网站。 这项变化将主要影响未登录的Reddit访问者,他们通常是没有账户的休闲用户。而登录用户——Reddit的核心用户群——才是真正的平台主力。Reddit近期增长的很大一部分来自通过Google搜索引导的未登录用户。 宣布后,Reddit的股价在星期一下跌了近5%,富国银行预测由于谷歌在搜索中越来越多地使用AI功能,Reddit的访问量将下降。 这并非谷歌搜索算法调整首次对Reddit的股价产生负面影响。去年二月,在CEO史蒂夫·霍夫曼在一次财报电话会议中提到第四季度流量受到“波动”影响后,Reddit股价曾下跌超过15%,原因是谷歌搜索算法进行更新。 虽然搜索算法频繁演变——这对数字新闻机构来说再熟悉不过——富国银行认为,近期Reddit用户活跃度的变化“可能更为持久”,因为用户行为正在适应谷歌的AI增强功能。 尽管如此,Reddit坚持认为,其业务主要由登录用户推动,这些用户通过直接访问网站而不是搜索引擎驱动。 “在Reddit,我们的许多产品开发都专注于扩大和吸引登录用户,因为他们对平台的深度参与构成了我们印象和广告展示的基础,”Reddit首席运营官Jen Wong在三月的摩根士丹利科技、媒体与电信大会上表示。“这对我们来说并非生死攸关——我们的业务仍然非常健康,因为它由登录会员驱动。” 此外,Reddit还推出了自己的AI驱动搜索功能,名为Reddit Answers,该功能通过整合平台上的相关帖子内容,提供自动回答。 归根结底,霍夫曼对Reddit在互联网中的地位保持乐观,他强调人类互动的价值。 “毫无疑问,大型语言模型(LLMs)将改变互联网搜索——我们都看到了,这令人振奋,”他在本月早些时候的一次财报电话会议上说。“有时,人们会希望得到由AI生成的摘要和注释答案,这也是我们正在与Reddit Answers一起开发的。但有时,他们更渴望Reddit能提供的主观性、真实性、繁杂性和多样性视角。” 他补充说:“在过去十年中,Reddit一直是传统社交媒体的替代——那些平台可能过于表演化和策划性——通过提供真实的社区讨论。同样,Reddit的社区和对话也将继续提供一种替代AI生成搜索答案的选择。”

区块链三难题迎刃而解!去中心化、安全性与扩展性不断追求的旅程
截止到2025年5月,区块链三难问题仍然是加密货币和区块链行业的根本挑战。由以太坊联合创始人Vitalik Buterin提出,它描述了同时实现区块链技术的三个关键方面——去中心化、安全性和可扩展性——的困难。这个概念持续影响着区块链的发展,因为人们不断努力在不牺牲任何一方面的情况下平衡这三大支柱。 **什么是区块链三难问题?** 三难问题揭示了开发者在构建区块链网络时面临的取舍。每一个要素都至关重要,但优化其中一个通常会影响到其他两个: - **去中心化**:区块链的核心原则,控制权分散在众多参与者之间,而非由单一实体掌控。它确保抗审查和避免单点故障,但也使共识机制变得复杂,可能拖慢交易速度。 - **安全性**:网络必须防御诸如双重支付或被攻占等攻击。强大的安全协议,如工作量证明(PoW)或权益证明(PoS),至关重要,但可能降低交易吞吐量或增加成本。 - **可扩展性**:能够快速高效地处理大量交易对于大规模应用至关重要。例如,比特币每秒处理约七笔交易,这一数字无法满足全球范围的需求。提升可扩展性通常伴随折中,可能会削弱去中心化或安全性。 三难问题表明,没有任何区块链可以同时最大程度地优化去中心化、安全性和可扩展性。例如,提高可扩展性可能需要将一部分网络功能集中化,从而削弱去中心化。优先考虑安全性则可能导致交易速度变慢,影响可扩展性。 **为什么区块链三难问题重要?** 除了技术限制外,三难问题还成为区块链广泛普及的障碍。为了与或超越传统中心化系统(如银行或支付系统),区块链必须实现去中心化以维护信任,确保安全以防止欺诈,并具备足够的可扩展性以应对全球需求。在这三者未能平衡之前,区块链的潜力仍难以充分发挥。 三难问题影响着区块链的设计选择:比特币优先考虑安全性和去中心化,但在可扩展性方面存在不足;而一些新兴区块链则偏重于可扩展性,可能以牺牲去中心化为代价,更像是集中式系统。 **解决三难问题的现有努力** 截止到2025年,尚未有区块链完全破解三难问题,但通过多种策略已取得显著进展: - **Layer-2协议**:在现有区块链之上运行,提升扩容能力而不改变基础层。例如,比特币的闪电网络(Lightning Network)允许更快的链下交易,同时保持安全性和去中心化。 - **分片(Sharding)**:以太坊向以太坊2

区块链安全公司发布Cetus被攻击事件的事后调查报告
区块链安全公司Dedaub发表了一份关于Cetus去中心化交易所被黑的事后分析报告,明确指出根本原因在于Cetus自动做市商(AMM)的流动性参数被利用漏洞突破,攻破了代码中的“溢出”检查。 报告解释说,攻击者利用了最大比特(MSB)检查中的弱点,使其能够将流动性参数值操控到多个数量级,从而几乎瞬间开出不成比例的巨大仓位。Dedaub的研究人员指出: “这使他们只用一个单位的代币输入,就能增加大量的流动性仓位,随后大量抽取池子中的资产,总计数亿价值的代币。” 这一事件及其分析突显了影响加密和Web3领域的网络安全漏洞问题仍在持续存在。 行业领导者多次警告,企业必须实施强有力的保护措施,确保用户安全,防止在监管机构干预之前就被攻击。 相关报道:两次好运?Cetus在Sui上的恢复计划模仿了Solana的蓝图 Cetus去中心化交易所遭黑事件造成2

Meta首席AI科学家Yann LeCun表示,目前的AI模型缺乏四个关键的人类特质
所有的智慧生命体共有何特质?据Meta的首席AI科学家Yann LeCun所说,主要有四个关键特征。 今年早些时候,在巴黎举行的AI行动峰会期间,政治领袖和AI专家聚集一堂,共同探讨人工智能的发展。在会议上,LeCun向IBM的AI领导者Anthony Annunziata表达了他对“智能”的根本定义。 “每个动物——或者说相对聪明的动物——而且毫无疑问是人类——都具有四个本质特征,”他解释道。“它们理解物理世界、拥有持久的记忆、具备推理能力,以及规划能力,尤其是在通过层级规划实现复杂动作方面。” LeCun指出,人工智能,特别是大型语言模型(LLMs),尚未达到这个水平。要实现这些能力,就需要在训练方式上进行转变。这也解释了为何许多领先的科技公司目前都在为现有模型添加新功能,以在激烈的AI竞争中占据领导地位。 “为了理解物理世界,你可以训练一个单独的视觉系统,然后将其集成到大型语言模型中。至于记忆,你可以用检索增强生成(RAG),加入一些联想记忆,或者简单地扩大模型规模,”他说(RAG是一项由Meta开发的技术,旨在通过引入外部知识源来提升大模型的表现)。 然而,LeCun认为这些努力都只是“技巧”。 他多次谈及一种替代方法,称为基于世界的模型,这些模型以真实世界场景为训练对象,展现出超越单纯模式识别的更高认知能力。在与Annunziata的对话中,他详细阐述了这一概念。 “你从某一时间点T的世界状态出发,设想一个行动,然后世界模型预测这个行动会如何改变世界的状态,”他解释道。 但由于世界在不断变化,充满了无数难以预测的可能性,训练这种模型的唯一可行途径就是抽象化。 Meta已经在探索这一思路,推出的V-JEPA模型于今年二月向公众开放。它被描述为一种非生成式模型,通过预测视频中的缺失或遮挡段落来学习。 “核心思想不是直接在像素层面进行预测,而是训练一个系统对视频的抽象表示进行操作,使其可以在该抽象中做出预测。理想情况下,这个抽象能过滤掉那些无法预料的细节,”LeCun说。 这种方法类似于化学家为物质的基本组成建立的层级体系。 “我们创建了抽象:粒子,粒子之上是原子,然后是分子,最后是材料,”他说。“每一层都能根据任务的需要,从更底层过滤掉许多无关紧要的信息。” 本质上,这意味着我们通过构建层级体系来理解物理世界,而这也是智慧的根本所在。

主要传统金融机构将推动在Solana上的代币化努力
代币化是区块链技术的一个关键应用,受到传统金融(TradFi)行业的高度关注和大量投资。 作者:杰米·克劳利 | 编者:谢尔顿·里巴克 更新时间:2025年5月23日下午4:57 | 原文发布时间:2025年5月22日下午4:12

人工智能专门取代女性的工作
在大众市场人工智能向消费者公开不到三年的时间里,几乎每个行业的企业都纷纷抢先采用这项技术,就像反疫苗者被多层次营销计划吸引一样。 到2024年,拥有超过5000名员工的公司中,有一半以上已经在使用人工智能。对于注重成本的老板来说,人工智能承诺可以提高生产力、降低运营成本——特别是减少传统上支付给人类员工的工资。 然而,随着全球工人对由少数巨头科技公司控制的AI驱动未来感到焦虑,企业积极采用AI的趋势已经开始对就业市场产生明显影响。 由于AI,年轻的大学毕业生进入职场的数量创下历史新低,全职有薪岗位正逐渐变为零工职位,简历夸大事实的现象也变得司空见惯,就业变成了一场令人头疼的噩梦。 虽然像Marc Andreessen这样的富有科技领袖声称技术将神奇地解放我们所有人,但历史告诉我们另一个故事:技术进步往往加剧现有的不平等,而非减轻它。这一模式早在人工智能成为主流之前,像爱因斯坦和霍金这样的思想家就已观察到。 事实上,人工智能已经表现出显著的性别和种族偏见,这是由其训练数据所导致的,专家警告说,将带有偏见的软件与全球大规模推广相结合,正在助长剥削现象。 不出所料,根据联合国国际劳工组织(ILO)更新的报告,人工智能预计将扩大就业中的性别差距。 借助2023年关于AI带来的自动化风险对各类岗位的影响的预测,该报告显示,在美国等高收入国家,女性在“高度自动化潜力”岗位中的比例已上升至9