Sonic 表情生成算法:Transformer 与 CNN 混合架构解析 | 极客日志