近日,在用友主办的'2024 全球商业创新大会'上,中国科学院院士、清华大学人工智能研究院名誉院长张钹发表了主题为《生成式人工智能时代的产业》的演讲。
张钹院士从能力、应用、架构、趋势等几个维度,详尽阐述了学术界关于大模型的洞察与思考,全面剖析了大模型的演进路径,就该技术的应用前景、挑战及其在不同领域的实际应用展开了深入探讨。
01 大语言模型'三大能力'与'一大缺陷'不容忽视
张钹院士进一步探讨了生成式人工智能的核心优势及其可能带来的挑战。目前,在大模型发展的进程中,已呈现出'三大能力'和'一大缺陷'。
其中,生成式人工智能具备三大核心能力为:
- 第一,强大的语言生成能力,即在开领域生成多样性的、语义连贯的、类似人类的文本。这是大语言模型区别于其他计算机生成语言的灵魂和优势所在;
- 第二,强大的自然语言对话能力,即在开领域实现人机自然语言对话;
- 第三,强大的迁移能力,即在代理任务上训练一个模型,只需要少量数据和微调,就可以适配到下游任务中,从而凸显出大模型可举一反三的能力。
除了上述优势外,大模型也呈现了一大缺陷,那就是大模型的幻觉。换句话说,在多样性输出的过程中,大模型也会犯错,这与它的创造性同时产生。
事实上,这种幻觉是外部信息驱动下产生的,因为大模型与人类生成的语言只是行为上相似,而内在机制完全不同。更深一步讲,这也揭示出了基础模型的局限性。一方面,它输出的结果不一定正确,且质量不可控;另一方面,大模型不可信任;还有一方面,大模型对提示词的依赖性强,鲁棒性较差。
'正因具备上述优势与缺陷,产业在落地大模型应用时必须格外重视这些因素。' ——张钹院士
02 基础模型的三种落地方向
目前,在生成式 AI 的众多应用场景中,高阶应用如设计、规划,低阶应用如服务、营销是相对容易实现的。例如,券商可依托大模型打造新一代 AI 中台大脑,帮助企业实现智能化的开户、客服、AI 选股等服务场景。

与之相反,涉及企业关键业务领域的大模型应用场景则是较难实现的,如自动驾驶或制造行业的定制化生产、质量控制等。因为这些核心业务对于技术的容错率较低,而可靠性、准确性要求更高。
那么,大模型的应用场景该如何落地到核心业务领域?技术提供商、产业界的机会在哪里?
张钹院士提出了落地通用基础模型的三种方向。
- 面向各个行业的垂类大模型;
- 在大模型的基础上打造产业应用;
- 让大模型与其他技术、工具相结合,创造产业应用。
03 大模型的六种架构模式
找到了大模型的落地方向,那么让大模型真正落地,同时还能使其用起来安全、可信、可控,这是产业和企业普遍关注的话题。为此,张钹院士提出了基于大模型的六种架构模式。
第一,提示工程
在很多大模型设计的过程中,都会增加这一至关重要的中间环节。它可以提升模型的理解和响应能力,输出一个更令人满意的结果。
比如,当问及大模型 9.11 和 9.9 哪一个数大时,它会给出错误的答案。但是,当用户在提示了有小数点存在的情况后,大模型便会给出正确的结果。因此,提示工程是影响生成结果的关键因素。提示的质量直接决定了输出结果的准确性和质量。在实际应用中,如何优化提示内容成为提升生成式人工智能应用效果的重要手段。
第二,检索增强生成(RAG)
对于事实性的问题,为了提高生成内容的确定性,生成式人工智能需要结合检索功能,通过触发外部知识库检索机制,辅助大模型生成更加准确、详尽且具有针对性的答案。
第三,微调
在加入了领域知识和私有数据后,通过在特定领域进行微调,可以显著提高生成式人工智能的输出质量,使其更符合特定领域的需求。比如,大模型在进行了医疗专业知识训练后,它就可以完成执业医师资格考试,准确率可达 90% 以上。而且,在诊断推理的过程中,大模型也对结果做出合理的解释。
第四,知识图谱与向量数据库
将知识图谱与向量数据库结合使用,能够帮助生成式人工智能更好地理解和处理文本中的语义信息,可解决模型缺乏事实知识、幻觉和可解释性等诸多问题。在企业部署大模型时,通过建立向量数据库,并让它与文档数据库协同工作,从而提高生成结果的准确性。
第五,内部监测与控制
在加以人类控制后,大模型可检测出数据偏差和漂移,也可处理异常情况。同时,通过引入智能体强化学习,可以让大模型自我反应,帮助它完成感知、动作、学习的一体化,从而减少错误的发生。


