笔趣阁

字:
关灯 护眼
笔趣阁 > 学霸的征途是星辰大海 > 第301章 真理的启迪者 三

第301章 真理的启迪者 三

    稍微适应了一下升级后的大脑,徐辰估摸着deepseek的论文应该是发出来了。


    (请记住台湾小説网→??????????.??????网站,观看最快的章节更新)


    他打开电脑,熟练地登录arxiv,输入了关键词。


    果然,那篇论文赫然在列。


    徐辰在公寓里下载了这篇论文,仔细研读了一遍。


    论文的核心原理极其惊艳,直击当前大语言模型(llm)的软肋:现有的transformer架构虽然通过moe(混合专家)实现了「条件计算」,但缺乏原生的知识查找机制。


    当模型需要回忆一个静态事实的时候,比如「巴黎是法国的首都」,它只能通过消耗宝贵的注意力机制和前馈网络层去「重新计算」和「模拟提取」。这就像是让一个顶级数学家去死记硬背电话号码,极大地浪费了推理算力。


    而deepseek给出的解法,正是「条件记忆」。


    他们引入了一个名为「engram(记忆印迹)」的模块,将经典的n-gram嵌入现代化,实现了o(1)时间复杂度的常数级知识查找。简单来说,模型不再需要死记硬背,而是学会了「查字典」。


    论文中还提出了一条「u型缩放定律」,证明了将大约20%到25%的稀疏参数分配给engram模块时,模型性能达到最优。更恐怖的是,由于engram的查找是确定性的,它完全可以绕开昂贵的gpu显存(hbm)限制,直接从廉价的主机内存(dram)中进行运行时预取,几乎没有额外的性能开销。


    「干得漂亮。」


    徐辰看着论文里的架构图,暗自点头。


    以他升级后的信息学lv2的眼光来看,梁文锋的这个成果,和系统当初给出的那个完美的d-ltmn方案相比,其实做了一些工程上的妥协。


    系统方案更偏向于底层硬体架构的微调,而deepseek则是在现有的gpu集群和transformer框架下,做到了软体层面的极致压榨。


    「这算是……系统方案的『青春版』?」


    徐辰摸了摸下巴。


    但这已经足够惊艳了。


    不出意外,这篇论文将在接下来的几个月里,成为整个ai界讨论的焦点。


    ……


    徐辰猜得没错。


    此时的曼哈顿下城,摩根史坦利大楼。


    高级分析师约翰·史密斯正对着电脑屏幕发呆,手里那杯昂贵的冷萃咖啡已经在那儿摆了半个多小时,冰块化了一半,也没动一口。


    屏幕上是一份还没写完的研报草稿——《英伟达:算力帝国的黄昏还是黎明?》。


    约翰感觉自己的头发都要掉光了。


    现在的华尔街,简直就是个精神分裂的疯人院。


    一方面,整个美股全靠那几只科技巨头撑着,尤其是英伟达,简直就是全村的希望。只要ai的故事还在讲,只要大模型还需要烧钱买卡,纳斯达克就能接着创新高,大家的年终奖就有着落。


    如果英伟达倒了,ai泡沫破裂,美股大盘就会瞬间崩盘,引发系统性的金融危机。到那时,不仅他的饭碗保不住,整个华尔街都要排队去跳楼。


    所以,上头的指令很明确:「看多!必须看多!不能让泡沫破了!」


    但另一方面,现实的数据却像是一记记响亮的耳光。


    年初那个中国小子搞出来的slrm架构,已经让训练端对gpu的需求砍了一半。现在好了,deepseek又搞出了个engram,直接在推理端把显存需求给废了!


    「这日子没法过了……」


    他在研报里敲下了一段极其纠结的文字:


    【……我们注意到,近期来自中国研究团队的slrm架构与engram模块,在优化大语言模型(llm)的kvcache显存占用及推理计算量方面取得了显着进展。这表明,在纯文本推理端,算力边际成本递减的趋势正在加速。】


    【基于dcf(现金流折现)模型及对未来三年tam(总潜在市场)的重新评估,我们预计北美四大云服务商(csp)在纯文本推理端的capex(资本支出)增速将出现拐点。engram架构的o(1)常数级查找特性,实质上打破了『显存墙』的物理限制,导致单token的算力与显存成本呈断崖式下降。因此,我们将英伟达2026财年的营收预期下调12%,目标价由145美元下调至115美元。】


    写完这段,约翰又觉得太悲观了,可能会被老板骂「唱空美股」。


    于是他又加了一句找补的话:


    【当然,如果考虑到未来ai应用场景的爆发式增长,市场总需求的急剧膨胀将完全对冲单token算力成本下降带来的负面影响,英伟达的算力护城河依然深不可测。因此,我们维持『增持』评级。】


    看着屏幕上这段文字,约翰自己都觉得滑稽。


    一边大幅下调目标价,一边又给出「增持」评级,这简直就是赤裸裸的精神分裂!


    但是作为华尔街的分析师,他根本没办法。


    他既要闭着眼睛吹捧美国ai产业蒸蒸日上,以保住当前脆弱的股市大盘和自己的饭碗;又要面对英伟达不断累积的产业崩盘风险,在研报里留下足够的「免责声明」,免得日后泡沫破裂时被愤怒的投资者起诉欺诈。


    其实,不仅仅是华尔街,现在的美国到处都在上演着这种「精神分裂」的荒诞剧。比如华盛顿那帮政客,美联储一边声嘶力竭地喊着维持高利率抗击通胀,财政部一边却又在疯狂发债印钞,往市场里大肆放水。


    这种极度拧巴的现象,归根结底,核心矛盾只有一个——美国的真实科技与金融实力已经开始不可逆地衰退,但为了维持全球霸权,外部的宣传和资产定价却必须死死撑住,绝不能露出半点疲态。


    里子已经千疮百孔,但面子还得硬撑。这就是约翰,也是整个华尔街此刻面临的死局。


    ……


    然而,就在华尔街还在纠结怎麽「圆谎」的时候,有人已经动手了。


    对于幻方量化(deepseek母公司)的交易团队来说,技术突破不仅仅意味着发论文,更意味着——暴利。


    早在论文发布的前一周,他们就已经通过复杂的期权组合,在离岸市场上悄悄建立了大量的英伟达空头头寸。


    当论文发出的那一刻,也就是收网的时候。


    纳斯达克开盘。


    英伟达(nvda)的股价,在盘前交易阶段就跳空低开了5%。


    开盘后,更是如自由落体般一路向下,短短半小时内蒸发了近千亿美元的市值。


    交易大厅里,哀鸿遍野。


    「该死!deepseek这帮人简直是强盗!」


    一个交易员愤怒地摔了键盘,「他们一边发论文砸盘,一边在期权市场上做空!这简直是降维打击!技术碾压就算了,金融手段也这麽狠!」


    「听说幻方那边的空单已经翻了三倍了!这帮搞量化的,简直比抢银行还快!」


    恐慌情绪迅速蔓延。


    原本还在观望的机构纷纷抛售,英伟达的股价一度跌破了关键支撑位。


    几位交易员瘫坐在椅子上,不禁发出了灵魂拷问:


    「上帝啊,到底谁才是科技强国?到底谁才是金融强国?」


    「我们建了那麽复杂的金融衍生品,不就是为了收割全世界吗?怎麽现在反过来被中国人用技术加金融的双重手段给收割了?这剧本不对啊!」


    ……
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈
热门推荐
大奉打更人 阴阳风水秘录 学长,我错了 斗战魔神 含桃 逆天邪神