下一代AI半导体竞争激烈,新兴企业追赶英伟达
2024/01/08
在半导体领域,探索作为生成式AI(人工智能)运算基础的图形处理器(GPU)的替代技术的动向正在加强。这是因为GPU原本是面向游戏而发展的,存在电力消耗大的课题。加拿大和美国的新兴企业开发出适合生成式AI的半导体,向GPU领域约占80%份额的美国英伟达发起挑战。
“希望成为第一个客户”,力争在日本代工最尖端半导体的日本Rapidus的社长小池淳义于11月宣布,作为开拓客户的第一步,将与设计开发AI半导体的加拿大Tenstorrent展开合作。在美国圣何塞市的联合记者招待会上送出秋波的是Tenstorrent的首席执行官(CEO)吉姆·凯勒。
吉姆·凯勒(左)与小池淳义握手(11月,美国圣何塞市) |
凯勒先后任职于苹果、特斯拉和AMD等美国企业,在各家企业参与了主力半导体的设计。在硅谷被称为“传说中的半导体工程师”。小池强调称“被他选中在行业内具有重大意义”。
Rapidus计划加深与无厂企业Tenstorrent的关系,在2025年投产的北海道千岁市的工厂承接后者设计开发的AI半导体的生产。希望重现过去英伟达和最大的半导体代工企业台积电(TSMC)借助分工体制取得的飞跃。
GPU有“弱点”
崇拜凯勒的技术人员陆续从大企业转移到2016年成立的Tenstorrent,目前该公司有350名员工负责开发专门针对AI的半导体。2023年从韩国三星电子旗下的投资基金和现代汽车集团等成功筹集了1亿美元资金。
对于英伟达具备优势的GPU,凯勒断言称“不是为AI而设计的”。英伟达的GPU虽然擅长大量数据的并行处理,但原本是面向游戏处理超高清图像而开发的,要嵌入作为生成式AI基础的数据中心的服务器,存在很多弱点。
最大的问题是电力效率低下。由于在芯片上负责运算的运算器和存储信息的存储器相互分离,GPU在数据交换方面耗费大量电力,而不是运算本身。有估算称,被认为使用数万个英伟达GPU的生成式AI“ChatGPT”每天的电费等运营成本按日元换算达到1亿日元。
Tenstorrent正在开发的AI半导体通过让运算器和存储器位置靠近,缩短了数据的移动距离,减少了电力浪费。凯勒比喻称,“在AI中,就像运算器相互对话一样,将运算结果直接传递到下一个运算是很自然的事情”。
英伟达在决定半导体运行的“指令集”上使用英国ARM的技术,而Tenstorrent则采用了任何人都可以免费使用和修改的开源的“RISC-V”。目的在于控制授权费支出,同时也方便根据客户的需求灵活变更半导体的设计。
凯勒表示,“对于想要开发价值数百万日元的机器人的企业来说,数百万日元的GPU就太贵了”。该公司正力争开发除了节电性能之外、在价格方面也足以对抗英伟达的新一代AI半导体。
通过存储器运算
目前生成式AI 处于发展阶段,开发企业将大部分运算资源用在提高精度的“学习”上。今后,随着ChatGPT等各种服务进入全面普及期,AI输出问题答案等“推理”的运算所消耗的电力比重或将提高。还出现了专注于这一推理领域、致力于改善GPU课题的初创企业。
版权声明:日本经济新闻社版权所有,未经授权不得转载或部分复制,违者必究。
报道评论