面试中容易露馅的问题:大模型的训练和推理吃多少显存? 177 | 2026-5-27 16:04 | 大模型 简介 课代表: 01:07 推理阶段的显存之权重 04:26 推理阶段的显存之 kv cache 06:43 训练阶段的…