DeepSeek开源第三弹:V3/R1训练推理关键秘籍,核心代码仅300行 金磊 发自 凹非寺量子位 | 公众号 QbitAI开源周的第三天,DeepSeek把训练推理V3/R1背后的“动力”给亮出来了——DeepGEMM:一个FP8 GEMM(通用矩阵乘法)库,支持密集(dense)... 花花2025-02-264 阅读0 评论