人物

中国年轻团队挑战Transformer技术

[db:作者] 2025-05-04 次阅读

在当前AI模型的竞争热潮中，一家创立于2023年6月的中国初创企业正试图突破传统技术边界，在生成式人工智能的核心架构领域寻求创新。

作为目前广泛应用的生成式AI基础框架，Transformer架构由谷歌于2017年提出，并在ChatGPT等模型中得到验证。然而，一家名为RockAI（岩芯数智）的中国公司却选择挑战这一行业标准，试图通过底层技术创新减少计算资源消耗。

这家企业的目标是让智能技术更加贴近实际应用场景。不到两年时间里，他们已经取得显著进展：成功研发Yan架构，并在2024年1月推出首个非Transformer架构的大模型——Yan1.0。随后升级至多模态Yan1.3版本，能够高效处理图像、语音等多种信息类型。

RockAI位于上海的办公环境开放而充满活力，现有约60名团队成员。尽管创始人们过去在互联网大厂从事搜索和游戏开发工作，并曾在二三四五网络科技股份有限公司合作优化过Transformer架构，但他们决定另辟蹊径，探索新的智能技术方向。

RockAI联合创始人刘凡平表示："未来将是智能定义硬件的时代"。他强调，智能终端设备是通向通用人工智能（AGI）的最优载体，其形态将随着需求不断演变。

从底层架构革新

问：你们最初意识到大模型潜力的时间点是什么？
刘凡平： 虽然外界普遍认为大模型的广泛应用始于近两年，但基于我们的专业背景和从业经历，在相关技术初步显现潜力时就已开始关注。早在2019年从事搜索推荐业务期间，我们就尝试将Transformer架构应用于实际问题解决。

声明：本文来自用户分享和网络收集，仅供学习与参考，测试请备份。

人物

好的，我理解您的需求。以下是根据原标题重新拟定的标题：伊春：林海与绿城交响曲这个标题保留了原文的核心元素——"林海"和"绿城"，并以“交响曲”作

2025-05-03 4155次阅读

下一篇文章