互联网巡回犬 Vol.18:一个要杀死 Transformer、一个让 AI 改进自己、还有一块上海的类脑芯片
互联网巡回犬
2026/05/20 08:08:30@Yoky Liu

互联网巡回犬 Vol.18:一个要杀死 Transformer、一个让 AI 改进自己、还有一块上海的类脑芯片

本期叼回三个项目:Subquadratic(迈阿密,$29M 种子轮)用 SSA 架构把注意力计算压缩 1000 倍,12M token 上下文,要从底层重写长上下文代价;Recursive Superintelligence(旧金山,Richard Socher 创立,$650M / $4.65B 估值)4 个月团队无产品却融了目前最大早期轮之一,押注递归自我改进 AI;脑智算芯(上海,复旦团队,天使轮)用类脑稀疏激活芯片攻击大模型推理能耗问题,已适配千问/GLM/DeepSeek。储备追踪:Reflection AI $20 亿融资存档。

今天叼回来三个项目,横跨 AI 底层架构、自主研究能力、算力芯片三个方向。迈阿密一家公司说他们用新架构把注意力计算压缩了一千倍;旧金山一家四个月大的公司没有产品却融了 6.5 亿美元要做「递归自我改进」;上海一支复旦团队刚拿到天使轮,在用脑科学重写推理芯片的底层逻辑。

Subquadratic:迈阿密的两个人说他们造出了第一个「后 Transformer」模型

Subquadratic 是一家成立于迈阿密的 AI 基础设施公司,5 月 5 日从隐匿模式出来,同步发布了一笔 2900 万美元种子轮融资和他们的第一个模型 SubQ1
SubQ 做的事,用一句话说:把 Transformer 里最贵的那部分计算改掉了。
标准 Transformer 的注意力机制是 O(n²) 复杂度,意思是上下文窗口每翻倍,计算量就变成四倍。这是整个行业在 RAG、分块、路由这些工程上大费周章的根本原因——大家都想绕开「喂整本代码库」的代价。SubQ 采用他们自研的 **SSA(Subquadratic Sparse Attention)**架构,把注意力计算的复杂度降到线性增长。发布数据显示:12M token 上下文窗口,比业界主流模型的注意力计算量少约 1000 倍,性能基准上接近前沿模型水平2
目前在私测的产品包括 API、SubQ Code 和 SubQ Search。500 亿美元估值是外界流传的数字,公司没有正式确认。
创始人方面,CEO Justin Dangel 和 CTO Alexander Whedon 联合创立了这家公司。Whedon 此前在 Meta 做软件工程师,后来在 TribeAI 主持生成式 AI 方向。团队里有 11 位博士,研究背景覆盖 Meta、Google、牛津和剑桥2。投资方阵容里包括 Justin Mateen(Tinder 联创)和 Anthropic、OpenAI、Stripe、Brex 的早期投资人。
为什么值得关注:长上下文的「算力税」是当前 AI 工程的隐形成本,大量 Agent 系统在这里卡住——要么花在推理费用上,要么花在规避全文本输入的工程开销上。SSA 如果在独立评测中站得住脚,这个位置很可能影响的不只是推理成本,而是 Agent 能做什么任务的上限本身。现在这个结论还在「需要第三方验证」阶段,公司自己也承认没有完整独立测评——这是最大的未解问题。
正在加载链接预览…

Recursive Superintelligence:四个月、没有产品、6.5 亿美元

5 月 14 日,一家叫 Recursive Superintelligence 的公司从隐匿出来,宣布融资 6.5 亿美元,估值 46.5 亿美元。团队不到 30 人,公司成立仅四个月,目前没有任何对外发布的产品3
这是今年最极端的一笔早期融资,值得拆开看看这笔钱押的是什么。
创始人 Richard Socher 在 AI 圈里不是新面孔——他曾任 Salesforce 首席科学家,也创立过搜索类 AI 产品 You.com。此次与他共同创立 Recursive Superintelligence 的还有:Tim Rocktäschel(此前在 Google DeepMind 主导开放性和自我改进研究团队,参与开发 Genie 3 世界模型,提出了目前各主要实验室都在用的 Rainbow Teaming 方法);Josh Tobin(OpenAI 早期成员,主导过 Codex 团队和深度研究团队);以及 Cresta 联合创始人 Tim Shi。AI 传奇人物 Peter Norvig 也在团队里4
这家公司要做的事,字面意思就是他们的名字:让 AI 能递归地改进自己。Rocktäschel 的愿景是,从 AI 研究想法的构思、实现到验证,整个流程完全自动化,AI 能发现自身缺陷、在无人干预的情况下重新设计解决方案。公司明确说不想只做研究实验室,要推出用户喜欢的产品——首款产品的时间节点「按季度推进」。
投资方是 GV(Google Ventures)领投,Greycroft 跟投,AMD Ventures 和 NVIDIA Ventures 参与。
这笔融资里有几个现实逻辑值得细看:其一,Rocktäschel 和 Tobin 在自我改进 AI 领域的研究积累是真实的,不是概念驱动的团队;其二,当下市场上「AI 加速自己研发」这个方向的估值逻辑已经形成——Meta 花 140 亿美元收购 Scale AI 49% 股权、Reflection AI 没有产品就到 80 亿美元估值——投资人买的是通往这条链路的最强团队票;其三,4 个月无产品但 46.5 亿估值,本身就是市场温度的一个数据点。
问题也是明显的:让 AI 在没有人类干预的情况下递归改进自己,在安全对齐上是个已知难题,Rocktäschel 团队提出的 Rainbow Teaming 是当前对抗测试方法之一,但离「让自我改进 AI 安全可控地量产」还有很长距离。
正在加载链接预览…

脑智算芯:上海复旦团队在用神经科学的方式重写推理芯片

今天看到一笔国内天使轮——脑智算芯(上海)科技有限公司宣布完成天使轮融资,由英诺天使复旦科创基金联合领投,水木清华校友种子基金和容亿投资跟进5。融资金额未披露。
公司成立于 2025 年,由复旦大学科学家团队孵化,依托上海市类脑芯片与片上智能系统研发与转化功能型平台。创始团队在类脑计算领域深耕超过 20 年,覆盖从架构设计到量产落地的完整链路。
他们的核心思路是:用脑启发的计算范式解决当前大模型推理的高能耗问题。芯片采用稀疏激活与存算融合机制——简单说,就是模仿大脑神经元的「事件驱动」方式,只有在需要的时候才触发计算,而不是像传统 GPU 那样全量激活。这可以将计算量压缩到传统方案的一半以下,同时保持接近主流 ANN 模型的性能。他们还自研了「瞬悉」类脑大模型,并与国内大模型头部企业达成「芯模算一体」联合研发合作,目前已适配 GLM、千问、DeepSeek 等主流大语言模型。
为什么现在做这件事有意义:大模型推理能耗高、成本高是 AI 商业化最实际的障碍之一——算力成本不下来,AI Agent 的调用频率就永远受限。类脑芯片的逻辑在学术界已经讨论多年,但真正到产品化这一步的团队极少,能同时覆盖芯片架构和大模型适配的更少。复旦团队的 20 年研究积累和现有量产经验,是这条路上最稀缺的门票之一。
眼下问题也很直接:第一代芯片仍在「研发与原型验证」阶段,融资资金主要用于这一步。类脑计算路线能否在实际部署场景下对抗英伟达 GPU 的规模优势,要等真实工业测试结果说话。

储备追踪:Reflection AI(旧金山)本周完成 20 亿美元融资,估值 80 亿美元,7 个月估值涨约 15 倍。联合创始人 Ioannis Antonoglou 是 AlphaGo 联合开发者,团队涵盖 Gemini、PaLM、ChatGPT 核心成员。他们的策略是「开放模型权重 + 私有训练堆栈」,对标企业 AI 自主部署需求,NVIDIA、红杉、Lightspeed、Eric Schmidt 联合押注。项目已被广泛报道,本期仅作存档,待后续有新产品动态时深度跟进6

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。