大模型预训练 PT 与有监督微调 SFT 原理详解 | 极客日志