海外AI圈“大V”36小时中国行:在北京,“生态感”更强

admin 商品展示 13

短短一天多时长,并不足以真切地领会一个规模巨大庞杂的产业,然而却足以致使一些原本既定的认知开端出现松动。

在5月的首个小长假期间之时,有一支调研团队,该团队是由国外的AI学者、研究员以及独立撰稿人等共同构成的,在36小时以内,此团队密集地展开了走访行动,其走访之地乃是北京AI产业的核心区域地带,也就是先后走进了阿里巴巴北京园区、月之暗面、智谱、美团、小米、零一万物等诸多公司,并且还和中国的AI研究员们进行了交流沟通。

他们也许曾预想过将会看到些什么,毕竟在硅谷所构建的叙事当中,中国的人工智能常常被贴上了“追赶之人”以及“应用比基础强硬”等诸般标签。然而,这一回的行程啊,却是刷新了好些外国学者对于中国人工智能行业的认知了。

艾伦人工智能研究所(AI2)资深科学家、后训练负责人内森·兰伯特(Nathan Lambert),此人来自美国,竟感慨道:北京简直就像湾区(硅谷所在地)。德国人工智能研究中心研究员弗洛里安·布兰德(Florian Brand),他却认为“这里的整体行业活力和旧金山出奇类似”。

多名外国AI学者,除了能感受到那扑面而来的“湾区气息”,還注意到了中国AI研究人员的独特气质,那就是谦逊、务实,执着于提升模型能力。他们发现,中国企业特别重视年轻人,学生也能够深度参与大模型训练,并且企业普遍乐于开源,各家都存在着自己的大模型训练路径。而所有这些,都与硅谷的AI氛围形成了颇为迥然的对照。

5月11日,有一人,此人是国内一线大模型项目负责人,该负责人深度参与了此次国际交流活动,此负责人向新京报AI研究院透露说,内森的观察准确捕捉到了当下中国AI产业的现实氛围,并且本次交流还是一个能让外界认识中国大模型公司的好机会。“坦率讲,除了OpenAI、Anthropic等顶级美国AI公司,说到技术实践方面的经验,我们领先于这些来访学者,这次交流亦是一个可让中国AI大模型的影响力朝海外扩散的好机会。”。

硅谷研究员来华,第一次面对面深聊

此次中国行,14名海外AI圈“大V”组团到访。

新京报AI研究院知晓,此次交流活动是由海外AI博主联盟SAIL举办的,这个联盟致力于集合全球顶尖的AI研究员、作者,去打造高质量的AI内容库。组织成员除了内森以外,还包含着SemiAnalysis的总裁道格·奥劳克林(Doug O’Laughlin),大模型工程师、有影响力的书籍《从零构建大型语言模型》的作者塞巴斯蒂安·拉施卡(Sebastian Raschka)等等。

国内一线大模型项目负责人向新京报AI研究院表示,平常在线上会跟那些外国AI研究人员开展技术交流,然而,硅谷的研究员主动来到中国,且与国内企业进行高强度线下接触的情况,属于“第一次”。

交流活动告终之后,内森有一篇博客文章,名为《写自中国AI实验室内部的笔记——此次走访中国多家顶尖人工智能实验室的经历所获得的启示》,受到了中国与美国AI圈的留意。

身为从加州大学伯克利分校毕业的研究人员,内森发觉,北京的情形跟旧金山湾区极其相像:竞争激烈的那些实验室,步行或者乘坐网约车就能到达,“我下了飞机以后,在去酒店的途中就顺便逛了逛阿里巴巴北京园区呢。随后的36个小时里,我们走访了智谱AI、月之暗面、清华大学、美团、小米以及零一万物等企业或者研究机构哟。乘坐网约车的时候,还能打到后排配备按摩椅的车子哎。”。

海外AI圈“大V”36小时中国行:在北京,“生态感”更强-第1张图片-开云手机入口官网下载-开云app官方最新下载--V3.6.9

外国AI学者调研团到此走访,部分走访之地是北京AI实验室所在地,由新京报AI研究院整理好标点符号。

在从首都机场前往城里的这段路途之上,去拜访阿里巴巴位于北京的总部还算得上是顺路的情况而智谱这家AI公司的办公地点,还有月之暗面这家在AI领域较有影响力的公司办公位置,以及零一万物这家专注于特定领域的AI公司办公场所开云app官方入口网站,它们更是密集地聚集在海淀区从中关村一直延伸至知春路的这一片区域之内,相互之间的直线距离连两公里都不到的啦这样的距离使得它们完全能够凭借步行的方式将彼此串联起来的哟。

实际上,于旧金山湾区那儿,OpenAI、Anthropic、Meta AI等这类公司呢,同样是集中在城西Mission区的附近,这般硅谷样式的地理密度呀,在中国AI的核心区域同样成为了现实。

这种密度不只是物理层面,更在于人才与信息的高频共振。

弗洛里安·布兰德出生于德国,他从第三方视角观察了中美AI企业氛围,他在博客中写道,他接触到的中国AI研究者都十分谦逊,大家都会由衷夸赞其他实验室以及同行的成果,深度求索(DeepSeek)被频繁说起,大概是由于在他们到访前几天,深度求索刚发布了新模型,业内人士谈及DeepSeek的论文时充满敬佩,很多研究者彼此私交挺好,要么是校友,要么是同乡。他们对于公开交流研究工作持有乐于的态度,相关成果常常是在之后的几个月时间里,就会被整理起来进而发表成为论文。

下面这种情况,是跟西方AI圈之间最大的差异所含有的其中之一。在美国,行业所呈现出来的氛围常常会更加倾向于零和博弈这种状况。各个不同的实验室全都小心翼翼地进行卡位,并且很注重自身所具有的定位,研究者每时每刻都会去考量竞争方面所存在的关系,其中一部分人甚至还表现得十分自负。行业当中处于领军地位的人物甚至会在被泄露出来的内部备忘录里面相互展开攻讦,用言语进行诋毁。导致出现这种差异的原因可能是这个样子的:美国处于头部位置的AI实验室大多都是闭源的状态,然而中国有不少实验室选择了开源。弗洛里安讲道。

内森进行总结,中国的AI研究员之间存在着一种更为浓厚的“生态感”,大家相互尊重,美国实验室里那种“非我不可”的门户之争相对比较少见。

与此同时,他留意到,中国人工智能研究员更换工作的频率跟美国硅谷的情况相类似,人群在选择前往何处时,主要考量的是“哪一个实验室的氛围更为良好”。知识以及创意在这些机构彼此之间流动的速度,要比外界所想象的速度快得多。

在弗洛里安眼中,北京的整个行业活力与旧金山极为相像,研究者们长久活跃于线上,频繁更新 X 账号以及小红书账号,并且小红书的行业影响力正逐步增大。“大家都借助 Claude Code 或者自行研发的命令行工具(CLI)不断迭代开发下一代模型。在开会的间隙期间,还有人实时对模型训练进程进行监控,注视着奖励曲线持续攀升。”。

这种生态感,可能才是北京AI产业比肩硅谷的真正底气。

中国AI实验室里,有一群学生搞研发

落在一个看似不起眼的细节上,是内森此行最深刻的印象,这个细节是,在中国AI实验室里,核心贡献者有很大比例是在读学生。

这并非是讲中国实验室仅仅让学生做打下手的工作,而是学生被径直归入核心研发体系之中,被视作“平辈”而非从事“打杂”之事。这样的团队架构具备年轻且充满活力的特质,使得内森回想起自己于艾伦AI研究所所拥有的经历,在那里开云手机入口app下载,学生同样属于核心研发力量。

据称,《新京报》AI专业科研机构知悉,众多学生被大量引入以参与研究工作,此乃国内人工智能相关企业独具的特色情形之一。其背后存在的缘由之一在于,这些企业凭借与清华大学、北京大学等顶尖高等学府的关联背景,时常会有企业内部人员向自身的低年级师弟、师妹发出邀请,促使他们前来公司进行实习实践。与此同时,部分公司的人工智能项目团队内部组织架构呈现出极端扁平化情况,以至于 frequently,会有实习生在项目中担当主力角色。

AI 研究院在了解新京报情况时发现,存在一些企业,那些企业之中有高中生实习生,他们的表现同样不存在逊色之处。

内森察觉到两国之间氛围有所不同了,美国顶级的 AI 实验室情况是大不一样的,OpenAI,Anthropic,Cursor 基本不太会提供具有真正意义的实习机会,谷歌虽说在名义上存在着与 Gemini 相关的实习机会,然而好多人担忧只能接触到处于边缘的工作,这样一种“隔离文化”,正使得美国实验室没办法拥有一种独特的优势,也就是由新鲜视角所带来的颠覆性思维。

内森在交流里发现,中国大模型企业有着融入年轻血液的优势,一个刚进入行业的学生,没经历过先前那一轮AI炒作周期,不存在对某种技术路线的“路径依赖”,反倒能够更快接纳新的技术范式,他们乐意全身心投入,摒弃所有预设,直接与问题本身展开对话,这种状态,在大模型技术路线迅速迭代的当下极为珍贵;过去几年,行业先后历经MoE架构,强化学习,Agent智能体三次范式转换,每一回都是对“老兵”的挑战。

他留意到一个细微巧妙的文化差别,中国的研究员极为“径直”。在被询问对于诸如AI伦理、社会风险、长期影响等之类话题的见解时,许多人的反应是感到困惑,在他们眼中,自身的任务单纯得很:将模型打造得最为出色。这跟美国AI领域里随处都能见到的“AGI哲学争辩”构成了显著的反差。

弗洛里安持有如此的认为,那就是中国研究者的核心目标是极为纯粹的,具体而言便是训练出更为优质的大模型。“在这样一种状况下,当他们得知你已然使用过他们所研发的模型之时,他们眼里会在瞬间放出光芒,并且也是迫切地期望在接下来的一个版本里去补齐现有的模型之中的所有的短板。出于要赶模型发布节点这样的原因,他们能够通宵达旦地加班,然而在第二天却依旧能够像平常一样到岗去工作。”。

这种文化差异,正在悄然影响大模型研发的效率。

内森讲了,美国的AI研究文化更倾向于鼓励“为自己发声”,这当然能够在激励个人发展方面起到作用,然而也会引发光环膨胀以及产生组织内耗的情况。他听闻,存在这样的实验室,就是需要给顶级研究员额外支付费用,才能够让他们接受自身的方案没有被纳入最终模型。中国的研究员并非如此,他们更乐意朝着最终结果进行让步,并非那么在乎自己的方案是不是被单独采纳。

个人所拥有的光环,让位于团队确立的目标,这样一种文化基因,在大模型这般需要众多人员协同合作,进行优化的复杂工程当中,变成了独特的优势。

没有盲目跟风,世界重新认识中国AI

经由这一回的交流,内森察觉到,面向中国的大模型社区而言,它更像是一种“生态系统”,并非是那种呈现为“交战的部落”的存在。

就他而言,他跟弗洛里安聊起了这么个事儿,那就是几乎所有的实验室都对DeepSeek表示认可。存在着一支团队,这支团队是以梁文锋作为领头人的,这支团队被看作是“技术品位最为出色的”。然而,有国内的研究员跟内森讲了这样的情况,说道DeepSeek是那种备受大家推崇的技术领导者,可是并非市场领导者。它们把发展的方向引领起来了,但是却并没有拥有在经济层面能够取得成果的基础。

内森持有这样的看法,在市场这个范畴之内,中国的AI行业把字节跳动以及阿里巴巴当作 benchmark,这两家在行业当中堪称巨头的企业,依靠着雄厚的资源,有着占据所有市场里大部分份额的可能性。

新京报AI研究院留意到,在这回的交流里头,好多学者觉得美团、小米以及蚂蚁的情形“相当特殊”,鉴于同种类的国外公司通常趋向于购置现成的服务,然而这三家并非以AI作为主业的公司却挑选自行研发大模型。

内森称,那些企业的研发动机,不是为着追逐新兴技术潮流去盲目跟风,而是出自对自主掌控技术栈、开发当下最为重要核心技术的深切渴望。针对中国AI企业普遍乐于开源的现象,他觉得,这一理念主要是源于实用性考量,也就是那有助于模型获取来自全球的优质反馈,再回馈开源社区,从而强化企业的核心使命。

中国AI存在着客观的短板。弗洛里安谈到,近乎全部的研究员都在思索,怎样去进一步扩大模型规模,他们又都在抱怨算力资源不够充足,同时还对当下主流评测基准现今的状况心存不满。

内森还指出,中国的实验室大多普遍存有对更多高端GPU的强烈渴望,与此同时,中国企业于数据产业范畴的投入相较于美国AI企业而言要少开云手机入口官网下载,众多实验室倾向于自行搭建训练环境,而非去购置外部的数据服务。

这次,那些来自外国的AI学者,进行了一场时长为36小时的中国之行,这一情况,折射出了这样一个中国AI,它正处在被世界重新发现的进程中,这个中国AI具备速度与活力并存的特点。

上述国内一线大模型项目负责人向新京报AI研究院表示,那些处于硅谷核心圈层的学者拥有向国外泛科技公司传递信息的能力,“我们期望像苹果、沃尔玛等国外公司能够关注到,中国AI尽管在业内有一定名气但也急需迈入更为广泛的国际商业视野之中。”。

弗洛里安说,总的来讲,此次旅程使我对中国的人工智能生态有了初步的见识。仅仅1天多的时长,根本不可能切实领会如此一个庞大文明的内在文化。身为开放人工智能生态以及开放科研理念的坚决拥护者,我对二者的未来极为乐观,同时也期望未来能够催生出更多国际间的合作。

此番行程开始之前,我对于中国相关情况的知晓程度极度有限,少之又少,然而当这次出行告终的时候,我却有种真切感受,宛如正处于开始学习的初始阶段一般,仍非常浅显。中国绝不是那种能够借助规则或者固定模式去予以描绘的所在之地,而是一个洋溢着独特动态氛围以及文化独有魅力闪耀光辉的国家或地域。它所拥有的文化存在时间的跨度极为漫长,文化内涵的深度特别深厚,并且这种文化与国内技术方面达到的发展态势紧密地相连接,关系密切,不可分割。同时,我察觉到中国具备的诸多特质以及运行操作的机制模式,都格外难以运用西方那套进行决策的模式来开展模拟比拟,几乎毫无办法。内森这般表述说道。

新京报AI研究院留意到,这次交流使得不少外国AI学者原先认为中国AI欠缺从“0到1”原创突破能力的那种刻板印象有了改变,给他们营造了一个新颖的参照体系,在中国,AI并非是一个抽象性的概念,而是一场当下正在进行的、紧凑且务实的产业实践活动。

“中国的人工智能研究人员,称得上温暖、真诚且谦逊,极具人格魅力。当我从笔记本电脑前抬起头,看到地平线上不断涌现的起重机时,能明显感受到这种研发氛围,与中国整体科技建设的文化脉络、创新动能完美契合在一起。身为人工智能领域的从业者,我目前担忧的是同组成员和参与团体之间,正因国籍标签而产生裂痕。而世界需要更多这样纯粹的积极态度。”内森发出感慨。

新京报AI研究院 罗亦丹

编辑 王进雨

校对 付春愔

标签: AI产业 中国AI 海外学者 大模型研发 生态感

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~