大模型显存占用详解:单卡训练与推理 | 极客日志