纳米 AI:红衣大叔的新战刀

145 2025-09-18 20:19

文|史中

(零)红衣大叔又抽出了 40 米大刀

最近半年,我听到“AI”这个词,感觉越来越愤怒。

点开头条公众号:某 28 岁 AI 大神被挖走,年薪上亿;某厂搞出最新模型,股票长虹。

点开抖音小红书:各路天才选手用 AI 生成的视频段子像泥石流一样往脸上呼。

点开得到小宇宙:一众大佬说不会 Vibe Coding 就等于文盲+残废。

点开微信钉钉:发现我自己的活儿竟不会用 AI 干一点儿。。。

关掉手机屏幕,映出一张不知所措的脸。

AI 已来,只是分布不均。 这种不均,是我和马斯克的总资产有 3000 亿美元的那种不均。

我猜你和我一样,心里隐隐觉得不公平,但转念一想又天经地义:毕竟 AI 这么难,人家玩得转,活该赚大钱。

但这,正是房间里的大象!

如果一个时代的门槛比《只狼》还高一百倍,高到只有极少数天才垄断创新,并且心安理得地拿走绝大多数时代红利,这叫什么伟大的时代?

面对高耸的门槛,产品创业者眼前只剩两条路:

第一,抽身观望,泡沫破裂时别血溅了我爱马仕的长衫;

第二,躬身入局,抽出 40 米大刀,冲到 AI 的门槛前面一顿狂砍,解救被时代围困的普通人。

周鸿祎选择后者,一点儿都不意外。

遥想红衣大叔第一次抽出 40 米大刀,还是在十几年前。当时普通人买不起杀毒软件,也看不懂专业界面,360 就是用“免费+傻瓜”的大刀砍掉了网络安全的门槛,结束了人人(被迫)与毒共舞的时代。

而这一次,他的大刀叫:纳米 AI。

最近,红衣大叔几乎每周都做一场直播,就是在给你我这样的普通人手残党安利纳米 AI。

你也许看过直播,但没注意在画面另一端还有个“蓝衣大叔”,他不是来给直播间配色的,而是纳米 AI 的产品负责人,也是我们今天故事的主讲人:梁志辉。

“人不能开引擎,人只能开汽车!”梁志辉的吐槽开门见山。

在他看来,各种大模型就像引擎:

引擎性能再好、再便宜,你也不会买回家自己攒汽车吧?

专业人士在发动机周围做一整套传动系统,做好底盘车架,再包一层帅气的铁皮,经过 10086 个步骤做成量产车,才能真正让这个技术走进千家万户,定义一个时代。

纳米 AI 的目标就是:做出一辆开起来最简单的车。

简单到啥地步呢?

“你会在微信群里口喷吗?将来只要一个人会用微信,就能调动一群 AI 帮你完成复杂任务!”梁志辉说。

我怀疑他在内涵某些老板。但讲真,如果有朝一日每个牛马都能翻身当老板,对“赛博牛马”呼来喝去就把班儿给上了,这画面还真挺诱人呢!

要理解纳米 AI 具体如何实现“口喷即干活”,咱得先科普一下当今 AI 的“最强组织模式”:

“大模型”,就像一个眼神清澈的赛博毕业生;

教会它特定的技能,再塞给它一些工具,它的眼神就没那么清澈了,成了一只赛博蜜蜂,也叫“智能体”。

面对复杂任务,需要好多个智能体协作,它们组成的业务部门就叫“蜂群”。

话说,纳米 AI 的师傅们,最近半年做了很多智能体和蜂群,例如:说一句话就有一群 AI 帮你生成大电影;说一句话就有一群 AI 给你生成专业的调研报告。

但在我看来,纳米 AI 提供的最锋利的想象力,不在某个智能体或蜂群,而是“想要啥智能体就能有啥智能体的能力”!

没错,它们还做了一个“360 智能体工厂”。你口喷就能创造智能体,还能口喷把一堆智能体变成蜂群!

说到这里,图穷匕见:纳米 AI 正在挥舞的大刀,不只是在砍 AI 使用的门槛,同时也在砍 AI 生产的门槛。

梁志辉算了下,这半年来,官方团队拼死拼活才做出了 200 多个智能体,而在智能体工厂里,普通用户做出的智能体/蜂群已经超过了恐怖的 10 万个。

理解了这些,你或许能体会我的激动:一个*普通人*可以玩懂 AI,并且享受 AI 红利的恢宏时代正在缓缓降临。

而如今的一切,都源自一颗小小的种子。

(一)搜索:蜂群里的一只蜜蜂

2023 年春天,ChatGPT 爆火,那是本轮人工智能开始邪门的起点。

评论家首先为之疯狂,他们高呼:“模型即产品”的时代到了!

但曾经手造了几个亿级 DAU 的梁志辉和同事们一起试过 ChatGPT 后,有种“有句话不知当讲不当讲”的感觉。

先不说激发模型的能力需要极其精准而冗长的提示词,就单说一个问题,靠模型自己就无法解决,那就是——幻觉。

深度学习之父辛顿认为:幻觉是智能的副产品。注意,是智能的副产品,而非仅仅是“人工智能”的副产品。(参考《辛顿的冬与春》)

模型的本质是对世界的“有损压缩”(《当 AI 活成了你的样子》),它在还原世界的时候,就必然会经历反向“生成”的步骤,所以它们本质上全是幻觉。

大众意义上的“幻觉”,只是恰好生成内容和现实中的强证据存在逻辑矛盾而已。

那么,怎么让模型生成的内容和现实世界尽量不矛盾呢?

AI 您动动发财的小手,自己搜一下再说不就行啦?!

看到了吗?搜索,是大模型进化成智能体的路上擎起的第一个工具,它无异于原始人的火炬。

实际上,英雄所见略同。 就在老师傅技术验证的过程中,主打搜索的 AI 产品 Perplexity 窜红,梁志辉他们直拍大腿,决定火速研发!

你可能觉得,“让模型查搜索引擎”应该三五个人七八条枪就能搞定。

错!作为智能体家族老大哥,搜索智能体的难度在于“开模”——定义出模型使用工具的*基本范式*。

一个模型使用工具好不好,效率如何,标定了智能体的能力基线,直接影响后来“蜂群”的工作效果!

回到当下,老师傅其实没想这么深远,他们无畏地上路了。。。

刚出发就直接进坑了。

当时的 360 搜索引擎,是给人用的,不是给 AI 用的。

啥区别呢?很多,这里我挑一个最本质的说下:

人在查看网页时,大脑会根据排版、字号、颜色等等多个模态进行“权重判断”,也就是哪些话要重点看,重点想,哪些话要略过。

所以,给人用的搜索引擎只要把网页合理排序展示出来就行,信息冗余点儿不碍事。

AI 在查看网页时,只能依靠文字本身的内容来判断权重。

所以搜索引擎给到 AI 的内容,必须尽量去掉无关的文字,最好再对网页的内容进行一次总结抽象。信息越精炼越好。

这么说吧,一个 AI 搜索功能,直接把搜索引擎团队的师傅给拉下水了。。。

2023 年冬天,梁志辉写了一个规划书,建议把搜索团队和 AI 团队进行架构合并,老周全力支持,眼神殷切,搜索引擎团队瑟瑟发抖。

而后几个月,搜索引擎团队把底层索引机制全部拆开,挨个升级。新的引擎能够对每一个网页的语义都进行向量计算,它给出的信息,不仅和用户的真实意图更对应,还更简短。

2024 年 1 月,360 AI 搜索,也就是纳米 AI 的前身正式上线。

在 2024 年 10 月的榜单上,360 AI 搜索全球排名超过了 Perplexity。

如果说如今的纳米 AI 是一个蜂群,那么“AI 搜索”就是其中的一只蜜蜂,而且是只相当能打的蜜蜂。

多说一句,现在 AI 界的师傅已有共识:AI 产品要想好,三大支柱少不了——搜索、浏览器、编码能力。

在当时“搜索到底重不重要”还没定论的情况下,这群人就已经冲着一根支柱跌跌撞撞走去了。这可以说是一种幸运,但更是一种嗅觉。

正因做搜索,老师傅无意间走上了一条超长的雪坡。

故事是这样的:

随着纳米 AI 逐渐火爆,很多用户开始上强度,拿各种偏门、专业的题目来“刁难”它。

难题一多,老师傅很快注意到一个问题:大模型使用搜索引擎查询到的东西,有时会相互矛盾。

于是,“搜索小蜜蜂”就不能傻傻地直出答案,而要在生成答案之前多加一道工序:选边站。

选过边的小伙伴都知道,站队是个很耗费脑力的工作,它必须得做很多判断,例如:哪个信源更权威?哪个说法更自圆其说?哪个说法和上下文能印证?

而在选边站之前,起码还得有一道工序:感知查询到的资料里是不是存在矛盾。

是不是感觉事情变复杂了?

敲黑板!这里我们要引入一个重要的概念:任务复杂度。

任务越复杂,“搜索小蜜蜂”查到矛盾信息的可能性就会增加,也就更需要更多*工序*去做感知、验证、深入调查,保证最终结果质量。

于是,一个水灵灵的问题摆在老师傅面前:

怎么才能正确地计划所有工序,稳定地执行多道工序呢?

这句云淡风轻的追问,召唤着一场汹涌的技术突破。。。

(二)脑海里的“小窗地图”

一个任务复杂不复杂,咱们基本能靠直觉判断。

你问:周鸿祎是男是女?这是个简单的任务。

你问:根据 2025 年美国各个行业对中国稀土的依赖程度,判断一下它对于中国芯片卡脖子的政策未来会有什么变化。这就是个复杂的任务。

但做工程不能靠直觉,必须追问到底:究竟是什么因素决定了任务的复杂度?

跟我一起想象:

一个像血管支脉一样的迷宫,大模型从原点出发,每一步都要在诸多岔路中选择一条,最终的目标就是找到出口。

每一步面对的支脉越多,就越难选对正确的岔路,这对应着横坐标:“任务的开放性”。

从起点到出口经历的步数越多,走出迷宫就越难,这对应着纵坐标:“任务的步骤数”。

横纵坐标一乘,面积越大,任务的复杂度就越高。

但是!以上只是站在“全知视角”的示意图。

大模型在执行某个具体工序的过程中,是不知道任务总体有多复杂的。

玩游戏的同学很容易理解这个比喻:

大模型周围存在一个“战争迷雾”,它只能处理眼前的岔路,不知道自己出发了多久,也不知道出口在多远的未来。(其实人生也是如此。)

这会导致一个严重的问题——迷路。(用文艺的话说就是:走得太远,AI 会忘记自己为什么出发。)

所以,为了让复杂的工序得以一步步正确推进,大模型必须在视野角落建立一个“小窗地图”,每时每刻都提醒自己从哪来到哪去,总体任务是什么,现在进行到第几步。

这个“小窗地图”,就叫“规划”。

正所谓:“凡事预则立,不预则废”嘛!

说回 2024 年,纳米 AI 老师傅评估了一下市面上大模型的规划能力,结论是:不太行。

问题很棘手:一边是广大人民群众让纳米 AI 解决复杂问题的殷切希望,一边是 AI 无法自主规划复杂任务的废柴现状。

老师傅冥思苦想,找到一条“妥协路线”:谁说规划必须自己做?也可以遵循套路嘛!

你大概做过旅游计划。

如果你擅长,就根据实际情况亲自定计划,肯定玩得又尽兴,花钱又少;

如果你不擅长,就报一个旅行团,跟着别人规划的标准路线走,也可以嘛!

梁志辉他们绞尽脑汁,把需求分门别类,手搓了好多“工作流”,例如:有帮你做研究报告的,有帮你写小红书文案的,有帮你做旅游攻略的。。。

工作流的每一个步骤上,都挂载具体的思考方式,再配好相应的工具。

本质上,相当于这个任务的全貌(也就是复杂度)已经被人为规定了,大模型只负责在流水线上一步一步执行下去就行了。

就像酱↓↓↓

然而,这样做代价是巨大的:

梁志辉回忆,当时遇到复杂一点的工作流,整个团队要写两三个月的代码。

在赛博空间里,筑起一堆极其复杂的“脚手架”。

每个脚手架都被螺丝拧死,大模型在通道里面按部就班地推理,跟八股文一样没有自由发挥的空间,用户稍微提出非分要求,AI 就选择狗带。

现在回望,2024 年冬天,是纳米 AI 最幽暗的一段时光。

老师傅每天都在寻找各种新的细分需求,然后从头到尾一遍遍焊接工作流的脚手架,到最后真是焊不动了呀。。。

就在最痛苦的时候,他们看到了援军的烟尘。

(三)“四自递递”与“三只小猪”

2025 年春天,DeepSeek 横空出世。

普通用户只是看到它回答问题前会自己“穷嘟囔”,可梁志辉他们看到的是:模型的自主规划能力终于上了一个大台阶。

没过几天,Manus 又刷屏了。看到这里你会明白,Manus 正是利用了模型刚进化出的自主规划能力,再配上各种工具而形成的一个智能体。

今天看来,以 DeepSeek 和 Manus 为代表的产品奠定了一个 AI 蜜蜂的“工作范式”。

我愿称之为“四自递递”:

1、干活之前先自主制定规划;

2、干的过程中自主决定使用什么工具;

3、自主发现工作中的矛盾和瑕疵;

4、自主判断什么时候该结束思考。

5、从原始信息开始,把每一次思考的结果不断填入模型的上下文迭代思考,传递再传递,最终得出答案。

卸掉脚手架,真是一身轻松↓↓↓

虽然蜜蜂在“战争迷雾”里行进,但因为有清晰的规划,每一步有清晰的反思,还是能找到比较好的答案。

不过,梁志辉他们尝试之后发现个问题:当时主流的国产模型在迭代次数方面是短板,最多思考 20 步。超过之后 AI 的“思想负担”就迅速变重。

换句话说:那个“小窗”太小,装不下大地图。。。

于是纳米师傅决定:博采众长,成一家之言。

他们找来几个在迭代任务上表现出色的国际模型,对自家的智脑模型进行强化蒸馏。

效果拔群!做出的模型竟然能迭代 99 步左右仍然不犯迷糊。

不知你发现了没,一开始我还在讲“搜索”,后来我悄悄把这个词换成了“任务”。

没错,你如果能让一个智能体“如如不动”迭代 99 步,它就不只能做搜索,而是能完成更丰富的创作任务了。

你可以如此理解:搜索只是任务的一种,搜索智能体也只是任务智能体的一个子集。

纳米 AI 不知不觉从“搜索智能体”进化成了“创作引擎”。

意识到这一点,老师傅仿佛中了一道闪电,这幸福的闪电告诉他们的,他们也准备告诉每一个人。

他们决定,让纳米 AI 秀一下肌肉,完成一个复杂任务。

“咱们就用一句话做一个电影,讲《三只小猪》的故事,如何?”团队有人提议。

这个任务很有深意,咱们简单拆解一下,从一句指令到最终成片大概需要五步:

1、从关键词出发,查询《三只小猪》的故事梗概;

2、写出《三只小猪》的脚本;

3、根据脚本画分镜;

4、根据分镜图片输出各段动态视频;

5、把镜头拼接在一起,加上包装做出成片。

以下就是纳米 AI 完成任务全部流程↓↓↓

这个任务的起点极低:甚至不需要完成九年义务教育的人都能给出完整指令:

这个任务的终点极高:要知道一个人类团队从编写剧本、画分镜,到草稿到绘制完成至少需要 10 人天的劳动。

这么大的高度差,其实都是这只“赛博蜜蜂”靠自己规划,又靠自己一步步徒手攀岩上去的。

“四自递递”的范式,就是这么凶猛。

纳米 AI 发布会上,红衣大叔展示《三只小猪》作品,是我路转粉的时刻。现在回顾,很多新用户注意到纳米 AI,也都是从《三只小猪》开始。

下面就是成片,你感受一下↓↓↓

AI 怕出名猪怕壮,舞台之上纳米 AI 爆火,舞台后面的梁志辉团队却被架在了烧烤架上。

他们发现,依靠现有的技术,无论换什么姿势,都没办法让一个“赛博蜜蜂”思考超过 100 步。但用户才不管这些,他们疯狂给纳米 AI 发来复杂度超越 100 步的任务,而且“变态需求”的比例还在迅速攀升。

老师傅像被霸总逼到墙角,这个变态的客,不接也得接。

他们胡思乱想:既然一只蜜蜂不够用,咱要不,养一群蜜蜂试试?

但很快又被自己的想法吓到了,要让一堆智能体组成“蜂群”,难度并不亚于管理一群真人,需要哪些工程框架?模型能不能支撑?一切都无法预料。

前面是漆黑一片的深渊,看看左右的友商,有人往下探探脚,有人对深渊喊一喊,就是没人敢纵身一跃。

梁志辉决定:你们不跳,我跳!

这是一些用户的问题和任务。

(四)蜂群之战

人类的公司,其实是蜂群现成的仿生学教材。

老师傅从中学到的重要一课就是:层级。

他们为蜂群设计了三层架构:

最高层,是“蜜蜂 CEO”,它负责把人类这个董事长布置的任务做规划,拆解成不同的子任务。

中层,是“蜜蜂经理”,它负责认领一个子任务,立下军令状,保证给 CEO 交付满意的结果。

下层,是“蜜蜂牛马”,也就是之前咱们说的智能体,宏观战略不用它思考,有意见保留,它只负责想办法把分配到手里的任务完成好!

这个班味儿十足的架构,怎么说呢,是真™有效率。。。

它的效率来自于两方面:合+分。

所谓合,就像会议室。

有些任务没办法拆分,例如之前提到的《三只小猪》视频任务,先要查询故事,才能扩写故事,才能生成分镜,每一步都依赖前一步,没办法“跳步”。

老师傅索性搞了个“智能体协作空间”。它就像一个大会议室,任务就摆会议桌上,赛博经理指挥一圈蜜蜂你一下我一下进行操作,封闭开发,效率自然大大提升。

所谓分,就像格子间。

有些任务是可以拆分的,例如《三只小猪》任务的分镜生成后,下面就是依据每一个分镜来生成视频。

但每一段视频之间其实是(相对)独立的。赛博经理把它分配给多只蜜蜂,拿回工位分头干,不就相当于并行处理了吗?

这样一来,整体任务完成的时间会大大缩短。

现在,所有的压力都给到这个 CEO。。。

面对一个具体的复杂任务,究竟要以怎样的方式对手下的蜜蜂排列组合呢?

这里,一个终极命题出现了:

由于蜂群总体的可能性是每个蜜蜂面对的可能性的乘积,算下来复杂度已经是天文数字,几乎没有 AI 能够短时间内找到最优路径。

就像“一个人应该如何过好一生”这种天问,本质上已经是一个偏好问题,不存在标准答案了。

面对极端复杂问题,如果放手交给 AI 自主规划,有时结果不遂用户的偏好;如果完全规定套路,又难以适配各种变化,

思来想去,他们来了个“两头堵”:

既可以通过“连线”的方式规范协作流程;也可以通过“拉群”的方式让 AI 自己决定协作流程。

比如,“一句话生成大片”是个很多人都用得到的功能,老师傅尝试了很多种套路之后掌握了一套“最佳实践”,索性就把这种组合方式用连线的方式固化下来,开放给用户直接去用↓↓↓

比如,你想让 AI 根据你自己具体的情况提供一些面试建议,就可以拉几个你信任的智能体进群,直接下命令,让它们现场研究现场写报告↓↓↓

梁志辉告诉我,把这么多智能体在一起,先不说连线还是拉群,首先面临的难题其实是:“成功率”。

你可能玩过那个“传水”的团建游戏。人蒙眼站成一排,把自己桶里的水倒给下一个人。这中间,每个人都会撒出一些水,到最后就所剩无几。

而且但凡有一个猪队友,把水全撒到外面,整个 Mission 就 Failed 了。。。

简单的数学:如果一个任务需要 100 步,每一步的成功率是 90%,那么最后的成功率就是 0.9¹⁰⁰≈0.002656%。

反过来算,如果需要一个任务最终成功率是 98%,那么每一步的失败率就要低到万分之二(0.02%)。

这是极为变态的要求。

老师傅尝试了很多方法,连打带骂调教这些赛博蜜蜂,效果都不太好。最后他们发现,答案就在灯火阑珊处:“知人善任”。

不同模型适合不同蜜蜂的体质,他们索性接入了全中国 16 家主流模型,给每个模型安排最合适的角色,如果失败率还是压达不到万分之二,就让模型厂商去改模型。。。

“其实模型厂商很愿意去改模型,一来我们是大客户,二来我们提供的都是真实用户需求,这对模型进化来说是非常珍贵的。”梁志辉说。

就这样折腾几个月,成功率真的稳定在了 98%,蜂群舞起来了!!

说到这,你心里可能会升起一个大疑问:光成功管啥用,干出来的活儿到底好不好啊?

这。。。是另一个神坑。

(五)创作非儿戏

同样是你,给你一个铲子和给你一个挖掘机,干活儿的效果是不一样的。

每个蜜蜂干活的质量,也极为依赖于它手中的“工具”。

幸亏,从最早做搜索智能体时对搜索引擎进行深度改造开始,老师傅一直在积累经验。

所以此时,他们的目标很明确:蜂群之中每一只蜜蜂都要能根据具体任务选择正确的工具,每一个工具都要像之前那个 AI 搜索引擎一样强大而稳定。

话说,都有啥工具呢?

比如,从分镜到视频要用到“图生视频工具”;

生成一个新闻播报员要用到“数字人工具”;

让人物说话要用“声音对口型工具”;

视频剪辑包装要用到“剪辑工具”;

还有更基础的搜索引擎工具、地图工具等等。。。

目前业界已经形成标准,这些工具都通过一个叫做 MCP 的协议被大模型使用,所以也叫 MCP 工具。

“今天市面上大概有 16000 个 MCP 工具,可是绝大部分都是玩具。”

梁志辉毫不客气。

举一个实际的例子:我有一款 A 相机,现在想拍人像,想知道哪款镜头比较好。这时,蜂群中有一只蜜蜂会去查询小红书上大家怎么说,它就必须用到——小红书内容抓取工具。

这事儿如果让人来做,真的不难。

打开小红书,搜关键词,扫一眼屏幕,就能知道这个帖子的内容,有多少人点赞转发,评论区在讨论啥,信息就抓到了呀。

但这事儿给 AI 来做,可是要跨越千山万水。

AI 必须得有一个电脑用来跑浏览器吧?

AI 要想查询小红书,得有个账号登录吧?

AI 要想理解一段视频在说啥,得有图像理解能力吧?得会语音转文字吧?

AI 得理解页面布局,知道点赞、转发、评论都在哪吧?

以上每一步,但凡走不通就拿不回来信息。但凡没理解准,拿回来的信息就是错的。如此,其他小蜜蜂干得再勤奋,也是在浪费算力。

为了做好这个工具,他们专门开发了 AI 能方便使用的浏览器,又给浏览器准备了虚拟机沙箱环境,还针对小红书的页面布局做了专门的解析模块,甚至为了让工具能大规模稳定运行,连底层的 MCP 服务系统都几乎重写了一遍↓↓↓

“小红书”还只是一个工具,老师傅为各个蜜蜂量身定做或修改过的工具,算起来有上百个。

这些工作全都做在暗处,如果不说,一般用户肯定不知道。但梁志辉很有信心,他们一用纳米 AI,就能*感觉*出来。

时至今日,创作早已不是儿戏,而是很多人赖以吃饭的家伙,如果一个 AI 不能帮助创作者*稳定地达成目标*,最终是不会有人买账的。

但实话说,在现有的条件下,即便有最强模型+最强智能体组成的蜂群,也很难一次创作成型。

就拿“一句话生成视频”这个官方制作的蜂群举例。

一个 90 秒的影片,大概需要 20 个镜头,其中但凡有一个镜头出现人物一致性错误,或者出现三头六臂,或者出现解说混乱,都没办法用。

好的 AI 蜂群,需要具备“Redo”的能力。

梁志辉把这件事儿称为“反悔”,他们设计了两种反悔能力:即时反悔和延时反悔。

啥是即时反悔?

就是在每一个子任务执行的过程中,经理都会进行质检,判断刚刚生成的视频里有没有“明显瑕疵”,例如出现敏感画面、人物畸形之类的肯定不行。

如果存在问题,那就不往下走了,直接返工重做。

啥是延时反悔?

就是在全片生成之后,交给人类审看。人发现某个不满意的地方,还可以追溯回去,让负责这个任务的蜂群返工重做。

比如下面这张看上去像剪映的界面,就是一个“P视频”的系统,你如果对某个片段不满意,可以直接上手修改它的提示词,替换原有画面,直到满意为止。

同理,人物口播、旁白、配乐也都可以修改。

梁志辉的想法很实际,他确信在未来相当长的时间内,AI 都没办法 100% 独立完成任务,这也就要求人必须以某种(简单的)方式“在回路”。

由此看来,这个编辑界面是一个完美的隐喻,它是并不完美的人工智能和同样并不完美的人类智慧相互咬合的接触点。

藉由这种相互搀扶,人机才能各自成为左右脚,向那些宏大的、也许永远没有答案的命题里一步步迈进。

(六)当蜂群渗入人生

“纳米 AI 的终极目标是什么样?”我问。

“我们想挑战 AI 应用的上限。具体到每一次的挑战方向不好提前预测,其实都是用户需求推动的。所以,我最怕的是用户不用。”梁志辉笑。

一瞬间,我意识到有趣的问题:很多人都在说“用户”,但当他们说“用户”时,心里想的其实并不是同一群人。

梁志辉所谓的用户,特指那些在 AI 上“没有经过特别训练”,也“没有特别天赋”的数量众多的普通人。

之所以要面对这样的普通人,是因为他们身上有“金矿”——他们不仅面对着巨量的“解决问题”的场景,甚至面对巨量的“定义问题”的场景。

中国是一个产业体系最完整的国家,此刻在看这篇文章的人,可能分布在极为广泛的垂直行业,做着彼此难以理解的工作内容,面对着复杂又具体的难题。

举一个小例子:

在医院里,医生问诊之后,需要把刚才问到的信息,结合医学常识写成一个标准格式的报告。

这会耗费医生大量的时间,降低问诊效率。

本质上它是一个可以被智能体蜂群解决的问题;

但真正困难的是,纳米 AI 的老师傅不一定知道这个问题的存在。即便知道,隔行隔山,也很难精确描绘解决问题的流程。

这也是他们开发“智能体工厂”的核心逻辑。

梁志辉告诉我,在智能体工厂里,用户不需要任何代码能力,用自然语言的方式就能给智能体描述它的职责,通过拖拽就能安排“赛博蜜蜂”的协作顺序。

然后,一个“特种蜂群”就诞生了。

如果你对它们的工作不满意,只需要调整协作顺序,调整岗位描述,就能改进他们的能力;如果还不满意,你就可以“人在回路”,在蜂群工作的基础上完善一下就好了。

这并非空想,实际上已经有医生用“智能体工厂”做出了辅助写诊断报告的蜂群,并且投入使用。

在 360 的老本行网络安全领域,也有很多同事用纳米 AI 做出了专业蜂群,使用各种安全产品做网络安全运维。

除此之外,还有各行业的老铁们做了发票报销蜂群、宣传片制作蜂群、竞品分析蜂群。。。

观其本质,“定义问题”这件事情终于从行业精英的垄断权力成为了普通职业人的日常。面对问题的同时,你可能已经离解决问题很近了。

正如前述,各行各业的用户已经在纳米智能体工厂上做出了超过 10 万个智能体和蜂群。

每个蜂群,至少对应一个“岗位职责”。

坦白说,以目前的 AI 水平,无法覆盖所有岗位的所有职责,但梁志辉提出一个评价蜂群价值的客观的指标:相应人类岗位的月薪。

随着技术演进,期待蜂群能替代的岗位月薪越来越高,意味着它的技术含金量越强,价值也就越大。

这个未来的降临,似乎还需要 AI 补齐一个能力,也就是三个支柱中的最后一根——编码。

虽说现在大模型已经具备一定的编码能力,可以搭个网站之类。但梁志辉觉得这远远不够,AI 在工作中使用的工具,绝大多数还需要人类帮它们编写。

相比 AI 的燃烧算力,人类显然是拖后腿的猪队友。

他期待有一天,模型可以根据需要现场编码任何工具,触达任何系统。

只有这样,蜂群才有机会深入工业产线,进行实时调参,分析数据,优化排产;有机会深入游戏领域,实时 3D 建模、渲染出动画;有机会深入影视制作,自动分析画面内容,个性化剪辑。

未来,智能体之间的协作靠实时生成的上下文,模型工作靠实时编程的工具,人类编码越来越薄,人类介入越来越轻,AI 反而能像水一样渗入更多的场景。

这才是 AI 应用真正爆发的时刻。

梁志辉说。

弱小和无知不是生存的障碍,傲慢才是。

今天的 AI 并不完美,但未来不能靠一边说风凉话一边等待而降临。

大模型,正如钢铁。

人们很早就发明了冶铁技术,可这远非创新的终点。

随后几千年,人们锻出了铁犁与镰刀,铸造了铠甲和戈矛,发明了齿轮与钢筋,组装了轮船与火箭,唤醒了机器人,至今一切仍在蓬勃。。。

那是留给一代又一代梦想家的舞台与追光。

告别老师傅,我突然想起 8 年前,一篇名叫《人民想念周鸿祎》的文章在网络上流行。

我确信,人们想念的并不是某个具体的名字。人们想念的,是在历史的轮回里,每一次站出来与高耸的技术壁垒对峙,抽出 40 米大刀的那个人。

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天,欢迎和我做朋友。

下一篇:HE340A欧标H型钢330*300*9.5*16.5理论重量表
上一篇:数字经济:重构人类文明的数字基因
推荐资讯