从 BERT 到 DeepSeek:大模型架构演进、预训练与 RLHF 解析 | 极客日志