在当前AI模型的竞争热潮中,一家创立于2023年6月的中国初创企业正试图突破传统技术边界,在生成式人工智能的核心架构领域寻求创新。
作为目前广泛应用的生成式AI基础框架,Transformer架构由谷歌于2017年提出,并在ChatGPT等模型中得到验证。然而,一家名为RockAI(岩芯数智)的中国公司却选择挑战这一行业标准,试图通过底层技术创新减少计算资源消耗。
这家企业的目标是让智能技术更加贴近实际应用场景。不到两年时间里,他们已经取得显著进展:成功研发Yan架构,并在2024年1月推出首个非Transformer架构的大模型——Yan1.0。随后升级至多模态Yan1.3版本,能够高效处理图像、语音等多种信息类型。
RockAI位于上海的办公环境开放而充满活力,现有约60名团队成员。尽管创始人们过去在互联网大厂从事搜索和游戏开发工作,并曾在二三四五网络科技股份有限公司合作优化过Transformer架构,但他们决定另辟蹊径,探索新的智能技术方向。
RockAI联合创始人刘凡平表示:"未来将是智能定义硬件的时代"。他强调,智能终端设备是通向通用人工智能(AGI)的最优载体,其形态将随着需求不断演变。
从底层架构革新
问: 你们最初意识到大模型潜力的时间点是什么?刘凡平: 虽然外界普遍认为大模型的广泛应用始于近两年,但基于我们的专业背景和从业经历,在相关技术初步显现潜力时就已开始关注。早在2019年从事搜索推荐业务期间,我们就尝试将Transformer架构应用于实际问题解决。