帝都、魔都双双押宝 年底了AI圈居然还有高手

好好好,本以为 OpenAI 直播已经是 24 年 AI 领域的尾声,没想到还有高手,国内 AI 圈又传出个大新闻。

就在前几天,国产 AI 六小虎中的阶跃星辰,拿到了数亿美元的融资。

而且更值得一提的是,这轮融资的背景可不简单,差评君还从投资方里找到了上海国资的身影。

帝都、魔都双双押宝 年底了AI圈居然还有高手

要知道就在几天前,北京国资也投了六小虎中的另一家智谱。

一南一北两大超级城市,各自押宝,都上了赌桌。

有一说一,经过前段时间的“百模大战”, AI 在融资圈儿其实是有些降温的,结果这次两大国资先后出手:

这一波,难不成是大模型版的沪爷 VS 京爷?

帝都、魔都双双押宝 年底了AI圈居然还有高手

虽然话是这么说,估计一些网友还是对“阶跃星辰”的名字有点陌生,“这又是从哪冒出的大模型公司?”

但其实在圈儿内,阶跃星辰早就小有名气,不过倒也不怪大家没听过,主要这企业确实比较低调。

相对其他AI创业公司,阶跃是六小虎里最后出场的,但在登场时,就已经是独角兽的存在了。

如果要用一句话来形容的话,差评君能想到的就是“低调神秘有实力,国资背景大牛多”,是国产 AI 里的一匹黑马。

帝都、魔都双双押宝 年底了AI圈居然还有高手

不仅在首秀时,阶跃星辰就掏出了个对标 GPT-4 的万亿参数模型,而且主打一个速度快、效率高, 10个月内就发布 11 款模型,并且在 16 个月内,就捣腾出了从理解到生成的全系列模型矩阵。

虽然人家确实挺有实力,不过咱这次的重点倒不是纯讲这个。

差评君觉得借着拿阶跃星辰融资这事,还是有挺多有意思的 AI 圈内故事,能和大家聊聊的。

帝都、魔都双双押宝 年底了AI圈居然还有高手

首先不可否认的是,大模型领域实际已经在缩决赛圈儿了。

差评君也和不少圈内人聊了聊,发现大家基本都在从两个点,来判断这家公司有无能吃鸡的冠军相。

一个是有没有牛逼的人才,另一个是能不能坚持投入技术研发搞AGI

帝都、魔都双双押宝 年底了AI圈居然还有高手

咱先说人才,其实大模型的人才圈儿,可能比差评君的朋友圈还小。

就拿今年诺奖得主乔弗里辛顿来说,他这个深度学习之父的实验室,一向就是各大公司眼中的顶级宗门。

像什么 OpenAI 联合创始人伊利亚,就是他的博士;谷歌 DeepMind 的大佬阿列克谢,是他的博士后;

Meta 的人工智能负责人杨立昆也是他的弟子;前百度首席科学家吴恩达,也跟他有千丝万缕的关系。

帝都、魔都双双押宝 年底了AI圈居然还有高手

而在国内,被北京国资选中的智谱 AI ,实际上也是学术上的大宗门出身,直接来自有 27 年人工智能研究历史的清华大学知识工程实验室。

所以说,有没有这些牛逼人才,往往是行业内认不认可一家公司的理由之一,甚至有时候请这些圈内大牛,要比花钱买显卡搞计算还重要。

前不久,差评君就和某大模型一线技术人员聊了聊,他用前不久字节高薪挖阿里通义大模型技术负责人周畅的新闻举例,告诉差评君目前圈内人才急缺。

他觉得传闻中花费 8 位数薪资挖人的操作,是可以理解的。

因为大模型训练成本动不动就是几千万上亿,而合适的人才,能少走很多弯路,反而是最省的操作。

帝都、魔都双双押宝 年底了AI圈居然还有高手

而这次的阶跃星辰,差评觉得它能被资本看好,也和人才脱不了干系。。。

不过与学院派京爷智谱不同,沪爷阶跃这方面也很特色,很多人都是行业内老人了。

他们里面很多研究人员都是从读博士开始搞相关领域,然后在大厂工作过,亲身在一线经历了过去 10年 AI 的最前沿发展。

比如阶跃星辰的创始人、CEO姜大昕,这哥们以前是微软前全球副总裁,日活上亿、备受差友们喜欢的 Bing 搜索,还有全球最早的智能个人助理 Cortana ,都是他曾参与过的项目。

这么说吧,他把深度学习技术应用到了 Bing 上,帮助 Bing 搜索服务扩展到全球 200多个国家和地区。

帝都、魔都双双押宝 年底了AI圈居然还有高手

除了CEO,阶跃的首席科学家张祥雨,在这个圈子里也很有名。

这老哥本来是西交跟微软亚洲研究院的博士生,师从孙剑和何恺明,还是开山大弟子。

但这还不是重点,重点在于读博期间,他们师门四人完成了——引用次数几十万、本世纪最火的深度学习著名论文——ResNet(残差学习),而张祥雨在里面就负责了底层框架和编码。

帝都、魔都双双押宝 年底了AI圈居然还有高手

有的差友可能不了解这个ResNet,没关系,重点就一句话,这文章的核心思想残差网络,对现代深度学习影响巨大。

当年打败八冠王捷豹的 AlphaGo 系列,就用了 ResNet 技术;现在的 Transformer 网络(GPT里那个T)里,同样也用了残差网络。

除了这个,张祥雨在其他技术上也很牛逼,在这咱就不细说了。就说一个苹果的 3D 人脸解锁,也就是 FaceID ,那其实也是受他的 ShuffleNet 技术影响才搞出来的。。。

总之,这个 2023 年 4 月才建立的团队,在六小虎里亮相最晚,但人才的实力却丝毫不虚,从这点上看,能拿到魔都的投资也不算奇怪。

帝都、魔都双双押宝 年底了AI圈居然还有高手

然而另一方面,除了人才以外,大模型厂商路线的选择,也越来越受重视。

而 AGI 基座模型这方向,其实也是技术理想主义者们最兴奋的方向,是大部分创业者入局大模型领域的初心所在。

帝都、魔都双双押宝 年底了AI圈居然还有高手

换句话说,基座大模型就是那一层地基,只有地基扎实了,模型的基础能力逐渐提升了,才有可能在未来搞出能真理解世界的通用模型,并运用到各种场景中改变人们的生活。

像是 OpenAI 、 Google 、 Anthropic 、 Meta ,还有国内的智谱、阶跃等,就属于这一派,在坚持推出各类 AI 应用的同时,也依旧在基座大模型的探索上越走越远。

帝都、魔都双双押宝 年底了AI圈居然还有高手

然而就像开头说过的,整个 AI 领域其实有些降温。

不少初创厂商们因为成本上的压力,逐渐搁置了基座大模型的研究和探索,把重心放在 AI 应用上。

要么转向垂直行业赛道、要么单纯搞 toC 的生意来赚钱,毕竟要先活着才能去实现理想。

帝都、魔都双双押宝 年底了AI圈居然还有高手

而在 2024 年,国内依旧在不断更新基座模型,依旧在公开场合重申 AGI 为最终目标的公司里,智谱和阶跃星辰算是很典型的代表了。

几个月前,差评编辑部就跟智谱的 CEO 张鹏对话过。张鹏表示:我们的目标定在 AGI ,这里面每一个问题的突破都有可能带来飞跃式的发展。

帝都、魔都双双押宝 年底了AI圈居然还有高手

包括阶跃星辰也一样,阶跃的创始人姜大昕曾经说,高昂的训练成本的确是一个挑战。有人调侃“讲卡伤感情,没卡没感情,用卡费脑筋”,但如果追求的目标就是 AGI 的话,付出再多也还是要坚持下去。

姜大昕给阶跃星辰设计的技术路线中,就分成“单模态-多模态-多模理解和生成-世界模型-AGI”,一共五个步骤。

这可能也是阶跃的大模型系列之所以被命名为 Step 的原因,五步成诗。

到了现在,阶跃星辰已经走出了两步。

帝都、魔都双双押宝 年底了AI圈居然还有高手

阶跃的第一步,就是万亿参数大模型 Step-2 ,它在上个月就炸场了一番。

在图灵奖得主杨立昆亲推的权威榜单,有“全球最难大模型评测”之称的 LiveBench 上,Step-2 拿下了国内第一、总榜第五的成绩,成了唯?进?前?名的中国语??模型。

榜单成绩时间:2024-11-19

帝都、魔都双双押宝 年底了AI圈居然还有高手

而阶跃的“第二步”Step-1V 走的也不错。

拿?模型竞技场 Chatbot Arena 的数据来看,这个竞技场网站里网友们可以试用所有的大模型,然后给它们打分,今年 11 ?的榜单里 Step-1V 的总分已经达到了 Gemini1.5 的水平。

除了这些,在 C 端应用上这家公司也做出过一些出圈的产品,就比如主打拍照识别的跃问 app 。

他家的跃问拍照问,也是最早接入 iPhone 16 相机控制的国产大模型功能。

帝都、魔都双双押宝 年底了AI圈居然还有高手

还有一上线就快速冲上 App Store 美食榜前三的胃之书,用的就是阶跃的多模态大模型;

今年在圈内爆红的AI 小游戏换你来当爹、灵魂提取器,也是基于阶跃模型能力开发出来的。

像是界面财联社这些财经垂类的专业媒体,也跟阶跃做过 AI 合作。

帝都、魔都双双押宝 年底了AI圈居然还有高手

但归根结底,阶跃星辰给人最深的感觉,还是在低调有实力,和坚持着 AGI 初心这两点上。

而这,或许就是上海国资之所以选择它的另一个原因。

最后,差评君觉得在 AI 领域逐渐降温的 2024 年末,智谱和阶跃星辰两家先后拿到了国家队的投资,这对国产 AI 行业来说也是一个比较重要的信号。

一方面,这意味着行业内的方向已经开始逐渐清晰,最顶端国家队的层面,也希望能尽快看到 AGI 。

而另一方面,这也可以说是拉开了国内大模型下半场的序幕:

拥有人才、找准方向、能坚持到最后的人,才有机会向人工智能的 One Piece —— AGI 进军。