米兰体育 Google I/O深度领路: 给Agent 时间寻找最经济的解


整场I/O 2026,谷歌CEO Pichai说了句不太像他会说的话:"最前沿的Agent可能只触达过寰宇上0.1%的东谈主。"
话外音没说,但真谛很瓦解:Agent这东西仍是跑通了,可跑通和跑起来是两件事。
OpenAI有Operator、Codex,Anthropic有Claude Code、Cowork,但它们于今只在少许数东谈主的责任流里转。Google想作念的,是让Agent酿成「自来水」。
这梗概是连气儿整场I/O 2026最要道的一把钥匙。
Gemini 3.5、Spark、Omni、搜索变革、TPU 8,看上去是五件事,但底层只讲了一件事:Agent怎样从0.1%走到99.9%?

1
Gemini 3.5 Flash是统统其他事情的底座。
Agent的经济模子能不可开拓,取决于单次任务的本钱够不够低。3.5 Flash作念的事情,是把Agent的运行本钱拉到一个不错规模化的水位。
Google我方也仍是这样干了——里面token日处理量从3月的5000亿飙到3万亿,每隔几周翻一倍。
基准测试一句话带过:Terminal-Bench 76.2%、MCP Atlas 83.6%、GDPval 1656 Elo,全面压了自家四个月前的3.1 Pro一头——又一个中杯干翻大杯的故事,和GPT-4o mini逾越GPT-4、Sonnet贴近Opus是祛除条弧线——参数壁垒正在被工程后果摊薄。
但Pichai把3.5 Flash推到舞台中心,不是在秀肌肉,是在算账。
3.5 Flash输出速率是其他前沿模子的4倍,在Antigravity框架内优化后可达12倍,订价不到同档前沿模子的一半。
他在台上平直报了数:一家每天在Google Cloud上处理1万亿token的企业,把80%的负载迁到Flash,一年能省逾越10亿好意思元。Pichai还补了一句:"你可能听过CIO怀恨年度token预算到五月就花光了。"
Pro下个月才上,但Flash仍是够用了。

2
引擎有了,接下来是车。
Gemini Spark,Google的第一个个东谈主Agent居品,24/7跑在云霄假造机上,你合上电脑它还在干活。
HG真人游戏官方网站底层是Gemini 3.5 Flash加Antigravity框架,复旧长周期任务。
演示场景很能说明问题:让它写一封居品追溯邮件,它自动从Gmail、Docs、Sheets、Slides里拉事实写草稿;让它管学校时辰表,它横跨日期、邮件、通信录来合作。
这些事拒绝看齐不复杂,但串起来需要一样东西:对用户数字生存的全盘拜访权。这即是Google作念Agent的护城河——和OpenAI、Anthropic不在一个维度上。
后两者的Agent更强、更生动、编码智商更硬,但它们够不到你的邮箱、日期、文档和通信录。
Spark不错,因为它就长在这些东西里。
某种真谛上,这是Google二十年来积存的最大一笔钞票第一次被激活。Gmail、Calendar、Docs、Sheets、Drive——这些居品各自齐稀有亿用户,但一直是孤岛。Spark第一次用一个Agent把它们连成了群岛。
这和智高东谈主机早期的一个时刻是同构的。iPhone之前,手机上的App亦然孤岛——你在通信录里找到号码,手动切到短信App发送。iOS把通信录、短信、电话、日期买通,一个有关东谈主卡片上就能平直发短信、打电话、鸠合议。
这种"买通"自己不是时期窒碍,但它改动了用户的活动样子。Spark即是Google版的那次"买通",金年会(JinNianHui)体育官网仅仅从手机扩张到了统统数字生存。
3
Gemini 3.5 Flash是Agent的引擎,Spark是Agent的车,而第一次亮相的Omni则走了另一条路——它不跑Agent,它跑"寰宇模子"。
Gemini Omni 当前还唯独 flash 版块,仍是上线Google FLow,它的定位是"能从任何输入生成任何输出模态的模子",从当前的演示看,你不错浮浅的连气儿为「P视频」。
文本、图像、音频、视频,大肆组合输入,跨模态推理后输出视频。不是活水线拼接,是一个推理历程把统统输入吃透,生成一个逻辑自洽的功令。
Omni不是Veo的通例升级,它是Gemini主架构从输入端多模态延长到输出端多模态的产物——Veo和Nano Banana酿成了它身上的智商组件,而不是孤立模子。
Omni其实又是一个"专用模子走向调治模子"的案例——GPT-4运转把文本和图像塞进一个模子,Gemini 1.0接入了音频,但生成侧仍然割裂。
而Omni把生成侧也完成调治——就像早年的声卡、显卡、网卡从孤立板卡整合进CPU,不是因为专用决策不够好,而是因为调治决策甩掉了模态间的退换本钱,米兰体育中国官网而这种本钱是多模态责任流里最大的摩擦。
4
模子变了,搜索也得变。
Agentic Coding参加搜索:搜"黑洞如何影响时空",搜索引擎不再复返联贯,而是及时写代码、跑代码,给你一个不错拖拽参数的交互式可视化页面。搜索第一次从"找信息"酿成了"作念事情"。
这代网民梗概不会牢记,1998年Google上线时作念的事儿叫"组织各人信息"——你发问,它给地址。
28年往常,学问图谱让它更精确,AI Overview让它更平直,但底层逻辑弥远没变过:我帮你找到,你我方看。
而当前,这个逻辑被撕开了通盘口子,搜索平直在原地搭建一个谜底。从信息检索到问题措置,一个典型的范式挪动。
Google敢对所灵验户免费绽开,因为它需要用户养成"搜索即措置问题"的民风——一朝开拓,搜索引擎就从流量进口酿成了任务推论进口。
5
底层逻辑变了,底层硬件也得随着变。
TPU 8拆成了两颗芯片:TPU 8t专攻考试,TPU 8i专攻推理。算力翻倍在AI行业仍是不算新闻了,果然故真谛的是考试和推理第一次被当成了两种天差地别的责任负载。
早年的预备机唯惟一颗通用处理器,自后GPU孤立出来,CPU和GPU的分家是因为预备需求的分化倒逼了硬件的分化。
TPU 8t和8i的分家罢职不异的机制——考试是批量重预备,推理是低延迟轻预备,强行用一颗芯片兼顾两者,就像让一辆车同期跑拉力赛和F1。拒绝之后,各自奔向各自的最优解。
这是基础面貌走向老成的记号。
一个行业还在草泽阶段时,通用决策就够了;唯独当需求分化到一定进度,专用决策才比通用决策更经济。考试和推理的分家,意味着AI预备的需求仍是复杂到值得在硅片层面作念采用了。
6
回看整场I/O 2026,Pichai那句话其实仍是把底牌亮了。
Gemini 3.5 Flash把Agent的运行本钱拉到可规模化的水位,Spark把Google二十年的居品矩阵第一次用一个Agent串了起来,Omni把多模态生成从分治推向调治,搜索从信息检索酿成了任务推论,TPU 8把考试和推理拆成了两条专用赛谈。
虽然,还有Antigravity 2.0 重构,隐形水印通用尺度SynthID,AI Studio更新,AI智能眼镜等等等等。
这几件事看上去各管各的,但横着排开,Google在作念祛除件事:给Agent时间的每一个层级找一个最经济的解。
DeepMind 掌门东谈主哈萨比斯在已毕时说:"当咱们回望这一刻,我想咱们会意志到,咱们正站在奇点的山眼下。这将是东谈主类一个真谛长远的时刻。"
这话听起来像修辞,但若是你把I/O 2026的发布横着排开看——模子、居品、生成、进口、硬件——Google如实在搭建某种竣工的东西——一个尚未到来的时间作念脚手架。
不外,脚手架和建筑毕竟是两回事。
Google在I/O上展示的统统智商——Spark的长程任务、Omni的跨模态生成、搜索的Agentic Coding——齐是受控演示。当这些智商被数亿用户果然使用时,会发生什么?
Spark会不会在你不正经的时候把一封不该发的邮件发出去了?Omni生成的视频会不会在某个你不着重的细节上出现事实性漏洞?Agentic Search跑出来的代码,谁来考证?
时期从0.1%到99.9%的路上,最大的不容从来不是智商不够,是出错之后怎样办。
Google此次专门花了时辰讲Spark的安全联想——想考轨迹及时展示、明锐操作前征求许可——但这仅仅第一个版块。
果然的熟悉是,当Agent的权限大到不错替你发邮件、订会议、写代码的时候,一次误操作的代价也大到用户承受不起。
0.1%的东谈主能容忍Agent犯错,99.9%的东谈主不可。从前者到后者的距离,可比从0到0.1%远得多。
对了,可能还有些你早仍是在各大媒体上说起的数据,我以为这些不是要点,却是 Google 感勇于作念上头这些事的最大底气。
Gemini App月活用户一年翻倍至9亿+米兰体育,谷歌搜索的AI概览功能用户窒碍25亿、AI样子用户超10亿。