欢迎观看本期【巷语记】,在阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持。
文 |无言

最近测试Gemini3Pro,越测越觉得这AI跟《天龙八部》里的虚竹似的。
本来以为只是个普通大模型,结果上手才发现,人家早打通了AI界的任督二脉,以前的AI是“能说”,目前它是真“会干”。

作为Get笔记的产品经理,我随口跟Gemini提了个需求。
用户录音时AI输出总错字,体验太差,想问问怎么优化。
本来没抱多大期待,没想到它直接甩来一套完整交互方案。
从用户触发场景到错误提示,再到修改流程和确认反馈,每一步都写得明清楚白。

它点出的核心矛盾让我眼前一亮。
用户核心任务是“听”和“记”,改错别字太费脑子,所以得“轻标记,后处理”。
这思路,比不少资深设计师想得都透彻。
更绝的是,它还在我上传的截屏上直接做了设计稿,还原度高到离谱。

个人测试不算啥,行业大神的验证才真叫炸裂。
AI大神安德烈・卡帕西跟它掰扯年份,说2025年11月,Gemini非说是2024年,还指责卡帕西“煤气灯操纵”。
这固执劲儿还真有点像人。
等联网核实后,它立马道歉,还主动去查2025年的新闻,那惊讶的语气,完全不像个冷冰冰的程序。

沃顿商学院的莫利克教授更狠,把自己十年前的杂乱众筹文件扔给它。
就一句“整理好准备新分析”,结果Gemini自己定题目、做假设、跑统计,最后交出14页论文,还自创了个“创意独特性”指标。
如此看来,AI的错误已经不是瞎编,而是像人一样的理解偏差,这变化可太大了。

搞不清谷歌以前是咋想的,明明手里握着王牌却藏着掖着。
2017年就是谷歌提出的Transformer架构,这可是所有大模型的祖师爷。
当年研究员开发的Meena聊天机器人效果极佳,预言能取代搜索引擎,结果被谷歌雪藏改名叫LaMDA。
毫无疑问,谷歌是怕冲击搜索业务。

毕竟搜索每年稳赚上千亿,要是AI直接给出答案,谁还点广告?无奈之下,当年的8位核心作者全离职了。
直到2022年底ChatGPT爆火,谷歌才慌了神,拉响“红色警报”,创始人都亲自回来改代码。
谷歌的积淀真不是盖的。
搜索二十多年的用户意图数据,YouTube的海量视频,地图的全球地理信息,还有Android几十亿用户的使用习惯。

这些东西别人没有,也拿不到。
目前Gemini把这些能力全整合在一个模型里,就像虚竹打通任督二脉后,所有武功都能融会贯通。
发布当天就敢接入搜索主营业务,这魄力不是谁都有。
要知道搜索是谷歌的命根子,能这么干,足以见得他们对Gemini的稳定性有多自信。

用户数单季度涨2亿,日常调用量翻了两倍,这数据就是最好的证明。
Gemini最牛的不是更机智,而是更能干。
以前的AI是给你代码,你得自己折腾才能用。
目前不一样,说要个书摘工具,30秒就给你个能直接用的成品,调尺寸、换背景、下图片,一步到位。

这种生成式UI功能,直接把“开发工具”变成了日常操作。
本来想,后来做个小工具还得求程序员,但后来发现,目前自己跟AI说一句就行。
还有它的Agent能力,Vending-Bench2测试里,500美元起家运营售货机一年,最后资产五千多美元,远超其他竞品。
很显然,人机协作已经不是以前那样了。

以前用AI得盯着,怕它瞎编,目前你更像个项目经理,说清目标就行,它自己规划执行。
莫利克教授说的没错,目前是“人类指导AI工作”,而不是“修复AI错误”。
普通人的机会也在这。后来会不会编程不重大,重大的是你知道自己要什么。
遇到重复性工作,别先忙着手动做,试试让AI整个小工具。

慢慢你会发现,清晰表达需求的能力,会变得越来越重大。
Gemini的突破,实则是谷歌技术积淀的聚焦爆发。它标志着AI从聊天工具,正式变成了能干活的生产力伙伴。
后来的工作模式,注定会被这种“能说会干”的AI改写。
与其害怕被取代,不如主动拥抱,毕竟能把AI用清楚的人,未来才更有竞争力。

支持作者,写作不易!如果您喜爱我的文章,可以点个“关注”,成为铁粉后能第一时间收到文章推送。