现在我又坐下来了。
现在一切又重新开始了。
我看着这方“口”字型的园区从热烈的仲夏到金秋的桂雨,从江南不算凛冽但绝算不上温柔的枯冬再到勃然万物竞发的早春,时间从不停下它忧伤的脚步,你的感受快也好、慢也罢,它确切地发生了,不可质疑。于是,一年的光景在这片四方的空间里经过去了,见也不到、抓也不着,我在这片空间里又成长了一岁,这里的一年便是我人生的一年。

这是极难量化的一年,我肯定地承认自己有着全方位的成长,但落笔时你问我到底是哪一方面或是什么事情显著变得更有能力,我一时也说不出个所以然。从学校毕业之后,人生的路径从二维平面全面变成了三维立体空间,一瞬间,有无穷多的纵深是在此之前从未涉猎甚至从未思索过的,人生从此没有了清晰的目标:没有了分数制的成绩与排名、没有了安稳的基础生活保障、也没有了安设在前方绝对刻度的毕业终点,但平凡的日常并没有太大变化,不是吗?你依然是从睡不醒的循环里挣扎起床,更换一种单位时间可以跑更远的交通出行方式前往接近相同的目的地,坐下,然后开始尝试完成仍被时间表规划好的一切,然后是一些出神和休息,在灵魂疲惫的周转之时迎来脑电波频率的峰值,然后那数值陡然下降,电子时钟不知道如何地从黄昏调到夜晚,然后你再沿着那条熟悉的小路回去,到那个叫做容身的空间里完成胳膊与腿的救赎,再然后时间也消失了,只剩下一片虚无…
但人生开始变得多元了,从经过高精度测量的小地图走向茫茫未知的宇宙,你就不清楚自身所处位置的绝对坐标了,你只知道与周围实体间的相对度量,但要注意的是,你也不会知道与所谓“极远点”的剩余距离。于是,你采取了广度优先搜索的策略填充满你遇见的每个与你直接相连的格子,容易证明地,因你的广度提升而导致了深度的下降,下降的终点极易导致坍塌。你梦到自己变成了三维宇宙中极小的一点,小到几乎没有质量,也几乎不受其他宇宙实体的引力,你已经小到你甚至可以靠近他们到一个很小的距离,在这个距离上你瞪大了眼睛向他看,内心的疑问是:“他是个什么玩意儿?等等,我是个什么玩意儿?”
你发现你之前懂得的”宇宙距离测量学“也不太管用了,之前你身边的同学年龄与你相仿,大学里那些与你拿不一样学位证书的人也只是比你大上几岁,哎,不会大太多的吧,你忽略下离群点,主要看统计意义。现在不管用了呀,你的同事年龄上比你可能大的要多得多了,就更不用说社会上那么多的旁人了。“距离测量”失效后直接导致了参照类似天体生存的能力大幅折损,那些先干了A又干了B之后得到了C的观测值一瞬间都不好用了,你没办法做到只看他们现在的样子来回溯他们走过的路并大声朗读出路上每个标记点的坐标和信息。你这小东西又再次不知道该怎么做到同龄人里的最好了,因为,你压根已经不生活在一个同龄人的世界中了。世界变大了,你变小了,但总体没变。
此时此刻,你若问我未来,我想到读书时曾有老师课上问大家:“大家毕业之后的人生目标是什么?” “- 买车买房。” “买完车买完房之后呢?” 我也还不知道之后,因为我也还处于茫茫奔命的一员之中,本无暇考虑在那之后。当我站在会场外的大长龙队伍之中时,也能依稀看到已经检票入场了的人的下一步动作,“- 继续买车买房” “- 生孩子,在下一代上重新轮回” “- 享受生活,畅游世界” “- 升职加薪,闯下一片自己的天地”。我也全不知道我将来会做哪些,我将来能做哪些,但我的脑袋总是怀揣诸多问号 “?我为这个世界带去了些什么”。读书时有另一位老师曾经问我们一小撮人:“十几年后你们在座的各位一定能买房买车在这座城市留下来或者过上物质条件不错的生活,那时候你们还想做些什么?”,沉默,振聋发聩,想到的只有梁博的两首歌,《黑夜中》《我不知道》。
一年之后,我还在等待那个转折何时到来,应该,早就已经发生了,并且已然改变了我的生活。但那远在光年之外的“新生”播撒出的光,此刻,还没传播到光年的这一端。在这中间的一段时间里,无论从我的视角还是另一个第三方的视角来看,之后的故事会不会因为我此时此刻做的事情不同而发生变化,那是否也有可能回到从前。把20分钟车程换成20分钟步行,把红绿灯前的排队拥挤换成大雪天泥泞污浊的山坡弯路,把一切都对等地替换,再把电脑换成灰黑色的卷子,再把背后的椅子旋转180度排在我的前面,再把现在这个人换成从前那个人,全部重新来过一次你会惊讶的发现一切都还是原封不动,好似从来没发生过一样。
关于这一年,我还想与你分享三部分:阿里之内、AI、工作之外。
阿里之内
花名。来到阿里的第一件事情,要给自己起一个名字,这好像是自出生以来第一次有机会实实在在自己给自己取个名字(英文名就算了,毕竟我们并不是从那出生并一直接受他们的文化模式)。我与你分享,我的花名是『其无』,取自《道德经》中《道经》第十一章:
三十辐为一毂,当其无,有车之用。埏埴以为器,当其无,有器之用。凿户牖以为室,当其无,有室之用。故有之以为利,无之以为用。
我并非刻意与你分享现如今并不常见的一些字和诘屈聱牙的古文,我现在简单给你做个翻译解释,要注意这只是一层简单的文言文 → 现代汉语的翻译,让你快速理解文字原本的内容,而非将你的思想局限于此。
用一个个条幅搭起车轮的结构,正因为中间是空的,才能发挥车轮的作用。用陶土做器皿,正因为中间是空的,才能用来盛东西做容器。开凿或搭建房子,正因为中间是空的,才能用来居住。所以这些“有”的部分给我们带来了便利,我们用钱买的也是轮子本身、罐子本身、房子的砖瓦混凝土本身,但真正发挥作用的、我们真正使用的是那些“无”的部分。
我希望在阿里写的每行代码、做的每个实验、参与的每个业务等等这些“有”的部分都可以转化为“无”的所在埋藏在我的内心,就如同“轻轻的我走了,正如我轻轻的来”,我知道那一些都发生过了,但我什么都不记得了。
马老师的心和脑。提阿里就不得不提马老师,这第一年里,我与马老师最近的一次是年初他在集团年度战略会上分享内容的时候,但我那时还是只在屏幕上听了他的演讲。有一句令我印象极深的话“智能来自于大脑,智慧来自于心脏”,说完这句至理名言般的话之后他又加了半句“我是60岁之后才明白的”。我自己也是坚定的「AI无法取代人类」阵营中的一员,AI也不可能掌握人类全部的知识与能力,这一部分放到后面再展开讨论吧。
一年香。阿里的这一年,我实实在在地参与到了真实的项目中,而这些项目背后的算法实打实地在被真实用户每天使用,这一点,是我选择从学校走向社会最直接的因素。在这里,我是在做真事的,真所以有意义。一个有原则的企业才能赢得尊重,这一点与做人是一致的,因此我也坦然接受存在的所有问题。阿里的文化中有很强烈的年陈文化,这里将工作年限比做酒的存储年限,这一年我开始发生了变化,极尽全力的想产生化学变化,也争取让自己和身边的环境都因此变香,但我想,香只是酿酒的第一步,慢慢来,静候变化。

阿里是一个江湖。江湖有血雨腥风,江湖有人情世故,江湖的掌门人目前是东邪,而我绝不是靖儿,我没有他一生梦幻般的与高人偶遇以及神奇般的避险经历,我每次只走一步,但每一步走得肯定。江湖之中充满纷争和故事,小故事可能成为茶余饭后的笑料,那些大的故事往往就成为了风云变化的乌云和闪电。阿里价值观里有一条“唯一不变的是变化”,初见时触目惊心,现在我也已经跟原则align地协调,好在这座巨轮中的人还可以跟着船一起改变,微调、掉头和放弃都还功能正常。江湖之中同样充满人情味,在我浅薄的观察里,阿里是对员工的亲友最好的一家企业,周末的时候你可以在各个园区看到推着婴儿车的父母、互相搀扶的老人家、一起运动的伙伴们,这里像公园,也像大学,这里真挚地欢迎每一位亲友的到来,这里充满了让员工多停留一会的点滴温暖,我想这一切的一切都是我全文不提阿里是家公司的原委。

AI
作为一直学习这个专业的学生以及目前的从业者,我也算是完整经历了AI的第三次浪潮。读书时的CNN也是用AI来称谓,现在的LLM也显然冠以AI之名,对于普通的“用户”来讲大家是全然分不清这些智能的区别的,但作为深处漩涡之中的我来讲却总是三缄其口。
我想在当前阶段笔录下我的一些理解和思考,如果有可能的话希望对非本专业的人有一点点小启发便足以,不奢望能深入探讨行业内的范式甚至预测未来,显然我应该也还不具备这种能力:我所经历的早期AI尤其是计算机视觉相关的算法我更愿意将其看作模式识别,通过人类观察世界的方式尽可能用计算机能处理的方法找到一种容易做到匹配的能力,这个阶段里最有名的AI应用便是人脸识别,我们可以把它理解成通过一系列特征的检测来判断这个人是谁。一切晦涩的算法定然可以用人类语言通过举例子的方式讲出来,这也是算法最原本创新的起始点。譬如你认识了一个新朋友,此人浓眉厉目,那这犀利的目光和浓厚的眉毛特征必然让你印象深刻,虽然你可能与此人只有一个照面,但当下次与他路过的时候你很容易地就回想起这个眉毛和目光是不是在哪里见过,于是你飞速回想,终于想到了这个人的人脸对应的名字。这就是典型的模式匹配了,那段时间的各种视觉AI算法以此为基础不断推陈出新不同的视觉匹配方法,同时辅以海量人脸数据集,在评测上不断刷新指标,好一派繁荣景象。但此时一个AI人脸检测的系统具备智能吗?我的答案是具备少量统计意义下的智能,但与我们人类通用的智能还八杆子打不着关系。人类并不只是通过这一个单纯的视觉信号记住一个人的,这整体是一个及其复杂的事情,但这看似极其复杂的事对于每个人来说却恰恰是相对容易的事情,我们不是通过比对过大量不同特征的人脸并与他们的名字一一匹配来记住身边人的,有时候就是一瞬间就完成了记忆,很有可能是终身难忘的,但这一瞬间究竟发生了什么,这是一个复杂的课题。
跳过中间粘稠的“停滞期”,由于一款应用的问世使得AI这个概念以换壳般的身份重新涌入了我们的社会,这便是ChatGPT。其实深处学校和研究单位的人应该在那更早之前就意识到了GPT系列的能力,只是ChatGPT提供了一个完全面向用户可用的窗口使得普通人也能接触到顶级的语言模型,好像这个AI一下子跟之前的所有语音助手都不同,好像AI一下子有了大幅度的跨越,好像《钢铁侠》里的贾维斯一下就触手可及了。但重新回到做此研究的人群中,你问他们这是智能吗?OpenAI官方对于GPT模型的解释是,这是压缩(或者也可以说是统计)。我来帮你理解下,假设你之前有一本很厚的故事书,里面讲了一个惊天地泣鬼神的故事,因为这本书足够的厚,他有充裕的空间详细描述了主人公每天从早晨起来到晚上睡觉的所做的所有事情,每天重复,并没什么不同。倘若在书中稍微几天不展开记录,只是说与之前相仿,也全然不会影响阅读,甚至由于更加简洁可以让读者把更多的注意力放到略微不同的其他故事上。这里说的压缩是重复内容上的压缩,你可以想象的人类之前写过的书籍中存在大量的内容冗余(冗余也可以一定程度上被理解为重复),那把这些东西凝练一下是很棒的。LLM(大语言模型)便是通过了一系列算法来实现了类似的事情,它使用了超大规模的训练数据,几乎把人类所有可以电子化的文字内容都进行了整理和过滤,同时调用了超级强大的计算资源(可以理解为超多超大超快的电脑)充分拟合人类所有过往文字的内容,并做压缩。人类的文本内容可以说是人类智慧在一个侧面最精华最浓缩的智慧,有些人也说正是因为人类有了语言和文字才使得人与其他生物不同,你要注意的是,当数据达到了一定的规模之时,所有你能想到的事情大概都被描述了,从一个小婴儿出生到长大所需要学习的所有文化课、做全世界美食的食谱、政府政策的方针政策、甚至是一个个人的银行流水清单,只要可以电子化、文本化、可计算化,那没什么是没有涵盖的(视觉信号、音频信号等等也可以通过某种算法变得可计算)。举全球之力培养一个脑容量和精力无限大的智能体,它在一些方面是会给普通人眼前一亮的“智能”的。顺便一提,GPT的英文全称是Generative Pretrained Transformer,翻译过来就是通用的预训练的(大)Transformer,而这个无数学生天天挂在嘴边的Transformer可以理解成一个小的电子元器件,无数的元器件堆叠形成芯片一样的可以用来做强大计算的物件,所以GPT从来不是什么高大上的名字,它的名称也几乎符合外国人直白通俗的习惯。
再简单讲讲LLM是如何学习的,比如你找到一本书的一句话“今天的天气是多云”,我们会把“今天的天气是”输入给LLM,同时期望它输出“多云”。当我有几十亿的类似语句喂给LLM学习,由于它的脑容量是如此之强,它比较容易的就学会了人们的说话方式,同时也很容易能“猜”到人类大概率会怎么说,它可以结合更之前的一些蛛丝马迹推测今天的天气可能是多云。这就是大名鼎鼎的Next Token Prediction,也就是LLM不断预测下一个词最应该说什么,你给他起个头,它就一个字一个字的蹦出来,因为它的计算能力是如此之强,以至于你感觉它完整的说了好长一段话,甚至很多时候里面还有大量废话,其实本质上它是一个一个“字”的说出来的。
当然OpenAI发布ChatGPT之后,世界风云剧变,做类似事情的企业如雨后春笋般拔节生长,一时之间大有上百家公司和团队在做重做类似的事情,并在蓝本之上创新,其中最有名的也就是你知道的DeepSeek。(当然其中我们更应该肯定通义千问团队所做的开源贡献,毕竟我也是通义实验室的一员hhh。)在之前的GPT使用中,大家经常会发现它对于一些很简单的事情会做的很差,比如你问它3.11和3.9这两个数字谁大?小孩子都能轻易计算的规则,这个庞然大物居然就是无法成功计算,这是,你在输入给它的问题结尾跟上一句“让我们一步步地想”,有时就会有神迹发生,原本不会的问题突然像任督二脉被打通了一样可以说的很不错,甚至能因此给出了正确答案。就好像你作为一个操心的父母在教一个小孩子做计算题,他粗心大意的总是算错,这时候你坐下来跟他说:“乖,你再仔细读读题干,是不是要注意这里有个小于号呀,这里你抄公式是不是抄错了呀?”,他经过你的亲手指导一步一步的重新做算术题很有可能就做对了。现在你希望你的宝贝LLM也可以这样,你无外乎有两种大的策略:1)继续训练LLM让它掌握更多更全的知识,让它从小学文化涨到大学本科的水平;2)你作为一个操心的父母实时指导,做错一步你就教它改一次,一步一步地来做。要知道做(1)这件事情是极其耗费钱的事,全球也没有几家公司真正能具备训练这种模式的资源和钱,所以DeepSeek较早较好地做了(2)这件事。他们提出了新的方法策略能够实现(2)这种模式的高效训练和使用,具体可以归纳为思维链模式或更学术一点的Test Time Scaling,什么意思呢?你如果使用过DeekSeek的话会发现当你问它一个问题的时候,它会先输出灰色的思考过程,通常是以“嗯,用户问我的问题是xxxxx”如此口语话的思考内容开头,然后,当所有灰色的思考内容输出完,它会借用自己这个LLM本身具备的归纳总结功能对这些灰色内容进行凝练,最后给出一个更好的答案。当然这其中还有大量复杂的计算、创新、工程实现,这里我只是微薄的探讨它的顶层设计模式,内容之覆盖面不足一毫。
现在我们终于可以聊聊上文提到的「马老师的心和脑」了。现在的AI是什么?现在的AI有智能吗?现在AI有智慧吗?我是人类乐观主义者,在我深入的学习并从事AI相关的工作的过程中,我当然看到了AI的快速发展,这是令我欣喜的,也可以说是喂我吃饱饭的。但再往后看,看得足够长远后,AI缺少的可能不是我们脑海里的东西,Ta缺少一些深埋我们心底的,每个普通人心底的。Ta是一个举全部财力、电力、算力而来的精英式的智能体,而我们每个人是平凡、重复、但充满个性的普通人。AI要学习通过睡觉来补充自己的精力吗?AI要学习刻意说违心的话吗?AI的脑子里会突然冒出一个什么奇怪的想法吗(比如上着课突然想今晚吃啥)?AI要模拟溜号吗?我们人类很多时候的不假思索、第六感、我觉得、这不是很自然吗,这些东西是程式化的大脑推理过程吗?物理硬件的可靠性验证可以仅通过AI的模拟和负反馈检测来检测吗?
AI在时间之外吗?
AI还有人们口中的很多很多种,但无论是什么所谓AI,都不是Ta们改变了这个世界,还是人,是我们,让这个世界每时每刻都变得不同。
再次说明,这一大段有关AI的描述实在是本人浅薄的理解,且限于篇幅(已经过长了)实在不能同你完整的讲清楚我脑中对于AI的观察和理解。
工作之外
我好像错过了每个社交媒体时代,我没刷过微博、没种草过小红书,更不必说云云视频媒体平台,我向来不喜欢短信息,而是喜欢很长时间阅读一个东西,甚至反反复复只读同一个东西。AI全面赋能的时代,每个人的手机里都藏着一个足够能力强的智慧大脑,可以快速帮我们归纳整理、输出铺天盖地多的文字,2个字的概念可以被用2000字详细阐述,这既是我们的幸事也是我们的负担。我们大脑的“吃食”从粗粮变成了细糠,我们显然可以更好的吸收,但也大可做甩手掌柜任凭AI系统替代我们的大脑做加工。每个时代,我们最缺的从不是发声的平台和向外的传播,我们缺少的是向内、向心的沉淀补给,坐得住冷板凳,下得了苦功夫。
记得保持独立思考。举一例为言:当电和电灯泡被发明的时候,一些点煤灯的贵族绅士说电太不方便了吧,需要一台硕大的发电机咕隆隆的转动,吵人安宁,哪似这煤灯丝丝波动沁人心脾;这电力尚需长长的电线做引线,方可点亮灯泡,难道每家每户都需要一台大家伙发电机和长长的引线吗?真是笑话,在荒凉的大山深处、深不见底的洞穴里难道电力可以送达?这时候我这盏绣花的煤灯可大有用处了,扇风即着,随意架设,了然自由,没有人需要电和灯泡,那些都不会成就根本,还是我这稳定的化石能源最靠得住,那些现在安了电灯泡的人将来早晚要后悔。然后,现在炙热的新能源汽车行业与传统汽车、新能源中的某些技术方案与真正未来科技的方案又在重复上演历史。打败你的很可能完全是另一个领域的人,不必弯道超车,我们有属于自己的路。
这一年我多了很多机会认真地观察自然,作为在东北长大的孩子,我从小就不明白二十四节气为什么那样演进变化,直到我重回长三角并定居后才渐渐地有所领悟(原本二十四节律是在中原统计出的,但东北实在距之甚远而江南十分接近)。我能清楚地感受到清明江南的细雨、惊蛰时作物的苏醒,也特别喜欢“小而未满”的寓意,数日期待着旁边的农田在小满之后的15天后收割冬小麦。说来惭愧,虽然长在中国粮仓的东北大地上,但我从来没去过农村的田间地头,可以说是五谷不分,但这一年我完整地观察了夏水稻的成熟 → 冬小麦的播种 → 冬小麦的成熟 → 夏水稻的播种,原来这里的土地是一年两种。因我在苏杭两地生活,我甚至可以略微感受到杭州和苏州播种和收种时间上很小的不同(也可能是不同农户个人的决定)。我也开始知道水果的上市时间,甚至买水果的时候也留心起来产地了,东山的枇杷、仙居的杨梅、阳山的水蜜桃,难怪我小时候并不知晓,这些地名原来就在身边,驱车可达。

其他啊,还有很多,不知从何说起,便不必说了。
人生一年、人生又一年、人生再一年,世界愈变愈大,空间越来越小,时间的轨迹不可追,就连起止的边界都不容易观测。我知道一年过去了,我知道第二年开始了,在这里,保持健康,继续,继续。
一年,如常,依旧对未来迷茫

