《机器之心》报告编辑:Panda 这两天,一份 VentureBeat 的报告在 Hacker News 上引发了热议。 Lion Jones 是这篇颠覆性的《你需要的就是注意力》文章的作者之一,现任 Sakana AI 首席技术官,他在最近的 TED AI 会议上表示,他厌倦了《变形金刚》。 《变形金刚》的主创为何做出这样的说法?最近在旧金山举行的 TED 人工智能会议上,Rion Jones 表示:“尽管人工智能领域有前所未有的投资和人才流入,但该领域仍然陷入一刀切的架构方法中,这可能会让研究人员对下一件大事视而不见。”他将此归因于投资者对回报的要求以及研究人员努力在拥挤的领域脱颖而出的“巨大压力”。当然,我们必须承认,这种说法并不新鲜。但考虑到狮子就是琼斯,这非常令人惊讶,甚至更值得注意。如上所述,琼斯是《All You Need》一文的作者之一不仅如此,他还是将后来改变世界的 AI 架构命名为“变形金刚”的人。请注意,这篇文章的所有作者都是同一位作者,名字是随机排列的。嗯,这篇发表于 2017 年的文章已经获得了超过 20 万次引用,毫无疑问是本世纪最有影响力的计算机科学文章之一(或者也许是其中之一)。现在,作为总部位于东京的首席技术官和联合创始人萨卡纳艾, 琼斯即将放弃他的创意。 “今年早些时候,我决定大幅减少花在《变形金刚》上的时间,”他说。我做了一个个人决定。 “现在我们显然正在探索并寻找下一步的重大进展。”更多的钱会减少创新吗? Lion-Jones在演讲中表示,人工智能领域面临着一个巨大的悖论:随着资源的增加,创造力却在减少。他说研究人员正在不断检查是否 他们被“利用”研究同一想法的竞争对手的年龄”,并且学术界正在选择比那些有风险且有创新潜力的项目更安全、更容易发表的项目。事实上,最近的一份报告还发现了两个值得注意的案例。一方面,四篇不同的论文大约在同一时间提出了类似于谢赛宁的表示自动编码器(RAE)的想法,其中两篇也报道了这一点(另外两篇是 arXiv:2509.25162 和 arXiv)。 :2510.18457),参考:VAE时代结束?谢赛宁的“RAE”团队出现,并将自动编码器描述为无需 VAE 扩散模型的 DiT 训练的新基础。清华大学科灵队“意外”和谢才宁队“RAE”。第二个是Zhipu的Glyph和Depth Search的DeepSeek-OCR失败,这两个都 探索如何视觉上标记文本。针对这种情况,Lyon Jones进一步解释道:“现在,如果你正在进行标准的人工智能研究,你必须假设有三个或四个我们的其他团队正在做非常相似或完全相同的事情。不幸的是,这种压力对科学产生了负面影响,因为人们急于发表论文,创造力下降。”他对人工智能本身做了一个类比:“探索与利用。”权衡:如果系统过度开发或探索不足,它将找到一个平庸的局部最优值,并错过更好的替代方案。他认为,“我几乎可以肯定AI行业现在就处于这种境地”。这背后的意义发人深省。琼斯还记得《变形金刚》出现之前的日子。当时,研究人员正在不断地以小增量使用以前占主导地位的架构——循环神经网络 (RNN)。当变形金刚 出来后,所有这些工作突然显得无关紧要。他提出了一个问题:“如果研究人员知道像变形金刚这样的东西即将到来,你认为研究人员会花多少时间来改进循环神经网络?”他担心该领域正在重复这种模式。 “我是同担心我们目前只专注于一种架构,不断改变它并尝试不同的东西,然后真正的突破可能就在眼前。”“你需要的只是注意力”源于自由,而不是压力。为了明确自己的观点,琼斯描述了变形金刚诞生的条件,这与当前的环境形成鲜明对比。他说,这个项目“非常有机和自下而上”,诞生于“午餐谈话和办公室随意涂鸦” 白板。” “重要的是,我们一开始并没有一个完整的想法,但我们可以自由地花时间研究它……更重要的是,管理层没有压力要求我们做某个项目或发表多少论文来改进某个指标,”琼斯回忆道。琼斯表示,如今普遍缺乏这种自由。即使是花费巨资聘请的研究人员也会感到无力承担风险。 “你有没有感觉到力量不敢冒险?当他们开始一份新工作时,他们会被赋予权力吗?”他问道。尝试一下你自己的一些最疯狂、最具投机性的想法。或者你是否感到巨大的压力,需要证明自己并回去寻找唾手可得的果实?“元研究人员对此有何看法?研究自由值得一百万美元的薪水吗?”琼斯提出了一个解决方案:打开“探索旋钮”并公开分享你的研究,即使这意味着支付有竞争力的费用。琼斯先生处于他的位置。我意识到了讽刺。“听到《变形金刚》的一位作者上台说,‘我厌倦了变形金刚……’听起来可能有点争议,但这有点道理,对吧?”我在《变形金刚》上工作的时间比除了另一个人之外的任何人都长。 七。 ” Jones 表示,Sakana AI 力求重现 Transformer 出现之前的环境,开展受大自然启发的研究,并最大限度地减少追逐角色或直接与对手竞争的压力。他向研究人员引用了工程师 Brian Cheung 的话:例如,Sakana 的“连续思维机器”,它将类脑同步机制集成到神经网络中。 Machine Heart 报道:“连续思维机器来了!八家初创公司之一的 Transformer 正在推出,以消除人工智能做出“一步”决策的需要。提出这个想法的一名员工告诉琼斯,如果他接受了前雇主或学者的工作,他会面临怀疑和压力。这被认为是浪费时间。在 Fish,琼斯给了他一周的时间去探索。该项目最终成功了,并被 被人工智能重要会议 NeurIPS 接受为专题论文。琼斯甚至表示,在招聘方面,自由胜过薪酬。 “这是吸引人才的一个非常好的方式,”他谈到这种探索性环境时说道。 “想一想:有才华、聪明、雄心勃勃的人自然会寻求这样的环境。”日前,《信息报》报道报道称,Sakana AI 已以 25 亿美元的估值筹集了 1 亿美元,并且可能为其研究想法获得更多资金。变形金刚取得了成功,但它们可能会阻碍人工智能的进一步发展。不仅如此,琼斯还暗示变形金刚可能会成为自己成功的受害者。 “事实上,当前的技术如此强大和灵活,让我们无法找到更好的技术。”他说,“可以理解的是,如果当前的技术很糟糕,更多的人会寻找更好的替代品。”需要明确的是,他并不是贬低正在进行的变形金刚研究。“就现有技术而言,仍然有很多非常重要的工作要做,这些工作将在未来几年提供巨大的价值。”我想说的是,鉴于我们现在拥有的人才和资源,我们非常有能力做得更多。”他的最后信息是合作,而不是竞争。琼斯总结道:“坦率地说,从我的角度来看,这不是一场竞争。我们都有相同的目标。我们都希望看到这项技术的进步,以便每个人都能从中受益。因此,我们越能共同努力,加速发现并公开分享我们的发现,我们就能越快实现这一目标。”这一观点也成为了网友关注和争论的焦点,许多人在 Hacker News 上分享了自己的观点。人工智能的探索事关重大。这一评论发表在人工智能发展的关键时刻。现在越来越多的证据表明,简单地构建大型变形金刚模型可能正在接近性能递减的瓶颈。 返回。领先的研究人员开始公开争论当前范式是否存在根本性限制,一些人认为人工智能系统需要架构和规模上的创新才能继续发展并变得更加强大。琼斯的警告表明,发现这些创新可能需要改变推动近期人工智能热潮的现有激励措施。数十亿每年在人工智能研究和开发上花费大量美元,实验室之间的激烈竞争更加强调保密性和更快的出版速度。您所描述的探索性研究环境类型似乎正在消失。但他的内心观点具有非凡的分量。作为帮助创造当今领先技术的人,琼斯讨论了如何实现突破性创新以及何时放弃这种创新方法。了解行业面临的两种风险。他决定告别为他赢得声誉的变形金刚架构,这为他所传达的信息增添了可信度。否则,这可能看起来是一种非常规的立场。当然,我们不知道AI巨头是否会响应这一号召。但琼斯清楚地提醒了我们存在的风险。下一个 Transformer 规模的突破可能即将到来,并且正在被有空闲时间探索的研究人员所追求。尽管成千上万的研究人员争先恐后地发表论文如果对架构进行进一步的改进,它可能会被束之高阁,未被探索。用琼斯的话说,变形金刚架构的创建者之一“绝对受够了”。 Hacker News 的尖锐评论 毕竟,他在 Transformer 上工作的时间比几乎任何人都长。他自然知道什么时候该翻页。 https://venturebeat.com/ai/sakana-ais-cto-says-hes-absolutely-sick-of-transformers-the-tech-t hat-powers https://arxiv.org/pdf/1706.03762 https://scholar.google.com/quotes?user=_3_P5VwAAAAJ hl=ja https://www.theinformation.com/articles/openais-japanese-rival-sakana-talks-raise-capital-2-5-billion-value https://tedaisanfrancisco.ted.com/speakers/2025/llion-jones/
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
请注意:以上内容(包括图片和视频,如有)不能在社交媒体上使用一个平台。是网易号用户上传发布的网站,仅提供信息存储服务。