DeepSeek「蒸馏术」启发台湾 中研院推进小模型应用
- 庄衍松/台北
DeepSeek推出R1模型一夕爆红,最主要是蒸馏技术(distillation)使成本大幅降低,而且模型比大语言模型(LLM)小,可适用于各种AI应用。中央研究院信息科学研究所所长廖弘源表示,每周都有新的LLM出来,但像DeepSeek蒸馏出小模型应用在...
会员登入
会员服务申请/试用
申请专线:
+886-02-87125398。
(周一至周五工作日9:00~18:00)
+886-02-87125398。
(周一至周五工作日9:00~18:00)
关键字