铠侠驱动AI时代存储革新 掌握代理式推论存储器革命新契机 智能应用 影音
236
黑客松
Event

铠侠驱动AI时代存储革新 掌握代理式推论存储器革命新契机

  • 尤嘉禾台北

铠侠应用SSD技术高端主管福田浩一(Koichi Fukuda)于 COMPUTEX 2026论坛分享AI时代SSD在推论运算与数据存取架构中的关键角色,强调存储创新将成为Agentic AI的重要推动力。铠侠
铠侠应用SSD技术高端主管福田浩一(Koichi Fukuda)于 COMPUTEX 2026论坛分享AI时代SSD在推论运算与数据存取架构中的关键角色,强调存储创新将成为Agentic AI的重要推动力。铠侠

COMPUTEX 2026前夕NVIDIA在台北主办的GTC(NVIDIA GTC Taipei)大会聚焦于「代理式推论」(Agentic Inferencing)的新发展议题,随着代理式 AI(Agentic AI)的快速演进,AI模型需要不断存取庞大的历史上下文的数据,导致系统效能受限于大量数据进出GPU与传输速度的限制,造成AI基础设施的瓶颈从GPU效率不彰转变为「数据搬移效率与存储器容量」的竞争,而HBM与DRAM成本居高不下,SSD存储器迅速获得青睐,扮演新时代存储架构的关键角色,全球存储器大厂铠侠(Kioxia)凭藉创新SSD存储解决方案,全力拥抱Agentic Inferencing时代的迅速普及。

铠侠应用SSD技术高端主管福田浩一(Koichi Fukuda)先生以「Exploring the Critical Role of SSDs in AI」为题,在COMPUTEX论坛做一场聚焦AI与SSD存储器解决方案为主题的演讲,他分析AI推论中由于AI Agents对话与长文本(Long Context)数据的滥觞,产业界积极整合存储处理器与智能化软件平台,有效突破AI推论中的存储器限制,优化大型语言模型服务的部署效率,这当中底层SSD存储器创新成为重要的驱动力,尤其是在GPU Direct Storage(GDS)技术的引领之下,将与HBM、DRAM形成更紧密的关系,成为GPU运算下的数据汇聚与存取的核心管道,提升整体Agentic AI的运作效能。

Kioxia大规模推动GDS设计  拥抱Agentic AI的普及化

Fukuda介绍铠侠这次在Computex 2026期间发表重要的SSD硬件产品线,首先依据BiCS FLASH第八代技术,整合CMOS直接键合阵列(CBA)技术,并搭载QLC Die 32 层堆叠架构的系列SSD产品线,此技术大幅提升了效能与效率表现,能够有效地回应市场上快速成长的存储密集型应用。

再者,针对用在存储服务器与跨机柜存储系统,面对超大容量与高速数据存取的SSD产品,提供超高容量QLC NVMe SSD解决方案,满足AI训练与大规模分析推论的高速存取需求,并一举推出LC9系列企业级NVMe SSD系列产品线,最高容量达到245.76TB,实现超大规模数据的快速存取速度与高可靠性。

支持CMX存储架构  优化AI GPU工作负载

特别值得一提的,对于加速AI运算与强化存储器扩充能力为诉求,针对NVIDIA提出情境存储器存储(CMX)架构以解决长文本的设计,铠侠将SSD重塑为存储器扩展层架构,能让GPU直接存取快闪存储器,作为HBM的扩展,并在关键运算场景中大幅加速数据存取速度,目前推出CM三款系列产品,首先是包含CM9系列,其提供25.6TB TLC容量和3 DWPD耐久度;还有专为高密度AI生成与存储所规划的LC系列,以及第三个专为GPU Direct Storage(GDS)应用优化设计的GP系列,具备超高IOPS(每秒输入/输出运算次数)、高效能、低延迟的SSD产品线,让 GPU 可以直接存取并扩充可用存储器空间,目前新的样品预计2026年底前开始针对客户提供样品。

AiSAQ软件技术化解企业Token成本的痛点

另外,铠侠在开放软件支持上也是其产品成功的重要卖点,尤其是AiSAQ技术的突破,化解企业执行RAG指令花费的成本痛点,该技术解决企业部署AI时数据存取的核心挑战,透过AiSAQ矢量数据库扩展性技术,成功将矢量存储从DRAM卸载至SSD,能够在维持具竞争力的RAG指令的工作负载效能之余,还具备削减高达396倍的DRAM使用量,这对于Agentic AI所需要处理超大规模KV Cache管理与最佳化机制有关键的助益,一举节省企业在高昂Token使用费用的支出,进一步支持台湾电子OEM/ODM厂商与AI基础设施供应链,协助客户积极整合AI运算、存储、网络与安全功能的新商机,并掌握Agentic Inferencing高度成长契机。