藏地密码

字:
关灯 护眼
藏地密码 > 学霸的征途是星辰大海 > 第518章 和DS的合作 一

第518章 和DS的合作 一

热门推荐: 收尸人盗墓笔记剃头匠鸿蒙道
    第二周的一个上午,四月上旬,天气非常不错。徐辰前往了位于中关村的深度求索北京分公司。


    深度求索北京分公司就在融科资讯中心,距离北大东门也就一公里不到。本身放在这边,就是为了吸引北大丶清华丶中科院这一圈密度高到离谱的高校人才。结果徐辰之前一直没意识到它居然这么近,近到石南把车钥匙都掏出来了,徐辰看了眼导航,沉默两秒后提议:要不骑共享单车吧。


    于是,两人一人一辆共享单车,沿着北大东门外的路一路骑到了融科资讯中心。


    ……


    把单车停在大厦楼下的专属非机动车划线区,徐辰抬头看了一眼这栋充满现代科技感的建筑。


    就在这栋大楼里,藏着如今全球ai领域最炙手可热的超级独角兽。


    回望过去的一年多的时间,整个全球ai市场经历了一场史无前例的大洗牌。


    而这场十二级大地震的始作俑者,正是徐辰当年顺手用来「刷经验「的那套slrm(逻辑增强模块)框架。


    slrm横空出世之前,整个ai产业的底层逻辑其实很简单粗暴——


    拼算力,拼参数,拼谁家显卡堆得更多。


    十万张h100起步,二十万张算入门。低于这个规模,你都不好意思说自己在搞前沿ai研究。


    那时候的ai创业公司里,最重要的岗位不是首席科学家,而是首席融资官。因为模型还没训练完,帐上的钱可能先烧没了。


    美国那边的资本市场则直接烧成了狂欢。2026年前后,openai丶anthropic等公司的估值一度接近万亿美元,折合人民币将近七万亿。华尔街最流行的一句话是:


    「ai公司不是按照收入估值,而是按照未来人类文明的所有现金流估值。「


    翻译成人话就是——反正先吹,吹爆了再说。


    只要公司ppt里写上「agi「,配一张炫酷的神经网络结构图,估值就能自动往上蹿三层楼。


    然后slrm来了。


    slrm引入了极强的符号逻辑推理能力,使模型不再单纯依赖概率预测来「蒙答案「。许多原本必须在云端超大模型上完成的任务,被小模型加逻辑增强模块就能完成得七七八八。


    算力需求,出现了断崖式的下滑。


    本地化部署随即兴起。企业不再非得把所有数据上传到云端,个人用户也能在自己的终端设备上运行足够强大的智能助手。


    原本那些靠垄断算力起家丶靠「云端霸权「撑估值的科技巨头们,这下直接傻了眼。


    市场格局瞬间从「几家寡头垄断「变成了「百花齐放,群魔乱舞「。


    一句话总结:以前只有巨头玩得起ai,现在稍微有点工程能力的中型企业,也能在垂直场景里搞出像模像样的产品。


    这对技术生态当然是好事。


    但对那些靠算力护城河支撑着天价估值的美国ai巨头来说,就不那么友好了。


    openai和anthropic在可用性上已经未必胜过全面拥抱新架构的国内企业,如今却仍靠着美股市场强大的金融想像力,死守着3000亿美元(约2万亿人民币)上下的估值。看起来帐面数字依然吓人,可懂行的人都清楚,和2026年八九千亿美元的巅峰相比,这已经是腰斩再腰斩。


    技术可以输,叙事不能输。


    只要还能讲「美国引领agi未来「的故事,股价就还能硬撑一段。这大概就是美国金融市场最动人的地方——即便皇帝已经没有新衣,只要华尔街的分析师还在卖力鼓掌,这场狂欢就不会轻易落幕。


    当然,眼下的格局也并非铁板一块。


    华为的lpu(逻辑处理单元)产能依然有限,而slrm的推理能力对lpu的依赖远比传统gpu深得多。算力的硬体瓶颈,无形中给了美国ai公司一定的喘息机会。总体而言,如今华国在算法层面已经实现了对美国的全面超越,算力上略有差距但整体可控丶且未来可期,数据层面美国公司依然凭藉历史积累保有一定优势。华国ai曾经落后半年到一年的差距,如今已基本追平,并且一旦lpu产能跟上,大概率将彻底完成反超。


    而在这场大洗牌中,最早抓住slrm红利丶被徐辰亲手「点拨「过d-ltmn记忆机制的deepseek(深度求索),则借着这股东风一路狂飙,如今已彻底确立了全球ai技术top1的统治地位。


    市值1万亿人民币。


    因为走的是开源普惠路线,帐面数字看起来不如美国那几家唬人。


    但在真正懂行的人眼里,ds才是当之无愧的无冕之王。


    ……


    一楼大厅里,已经有深度求索的员工等着接人。徐辰刚到,对方便快步迎了上来,态度十分恭敬地把他领进电梯,直接按下了最高层。


    电梯门刚打开,梁文锋正好从办公室里出来。


    「徐教授。」梁文锋先一步伸出手,笑得很自然,「终于把你等来了。」


    「梁总,打扰了。」徐辰和他握了握手。


    两人都不是那种喜欢把寒暄拉得很长的人,简单叙了两句近况,梁文锋便顺手带着徐辰在公司里走了一圈,简单地参观了下。


    逛完一圈,两人很快回到梁文锋的办公室,门一关,外面的喧嚣就被彻底隔开了。


    这次见面,前面的铺垫其实已经够了,真正要谈的只是最关键的细节。


    梁文锋给徐辰倒了杯茶,自己在对面坐下,直接切入正题:「你先给我讲讲这套框架现在到哪一步了。」


    徐辰也不绕弯,从包里取出笔记本,打开后,把「诸葛」架构的整体思路丶slrm在灵感模块上的设计,以及目前那版demo的测试结果,简单而清晰地过了一遍。


    从为什么要把transformer的概率式联想压下去,到为什么要用slrm去接管高精度推演,再到模型在imo压轴题上的表现,徐辰都讲得明明白白。讲到最后,他索性把笔记本转过去,让梁文锋看后台记录的几组效果数据。


    梁文锋看得很认真。


    他没有急着开口,先是把几页日志来回扫了两遍,手指在桌面上轻轻点着,像是在脑子里默算什么。几秒后,他才抬起头,目光里多了几分真正的兴味。


    「很漂亮。」他先给了一个极高的评价,语气里没有半点敷衍,「不是那种『堆出来的漂亮』,是底层逻辑真的站得住。」


    徐辰笑了笑,没接这个夸奖,只是安静等着他的下文。


    梁文锋把笔记本推回给徐辰,身体微微后靠,话锋也跟着一转:「但我得先说句实话,这东西的商业前景,确实不太好。」


    徐辰闻言,心里一点也不意外。


    这种话术,他之前已经在其他公司那边听过几轮了。梁文锋这话,倒不完全是压价,这确实是事实。来之前他自己在心里也盘算过,这项目要是真铺开,算上高昂的机会成本,前几年非但见不到回头钱,大概率还会是个吞金的无底洞。


    因为上百名顶尖工程师,按三百万年薪算都得一年3个亿;再加上稀缺的lpu算力卡,以及为了这个项目必须腾挪掉的其他商业模型的资源,整个成本轻轻松松就会滚到十个亿。


    而这些钱砸下去,换来的却很可能只是一个「学术圈叫好丶商业上不赚钱」的产品。毕竟,这世上需要用到这台机器的顶尖数学研究者,满打满算也就那么一小撮人。


    所以这事,看起来徐辰技术很牛,但其实在残酷的商业逻辑面前,手握资源的ds才是掌握主动权的那一方。


    ……
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈
热门推荐
收尸人 盗墓笔记 剃头匠 鸿蒙道 我老婆是美女总裁 创世至尊神系统