大语言模型 (LLM) 是什么？

大语言模型是基于大规模语料预训练的深度学习模型，旨在理解与生成人类语言。相比普通语言模型，其参数量更大、训练数据更丰富。在数字产业中，它变革了人机交互方式，丰富了产品种类并塑造了新兴商业模式。具体应用场景涵盖文本生成、问答检索及情感分析等。然而，发展也面临算法垄断、虚假信息传播及价值偏见等隐忧。该技术已成为人工智能领域的突破性进展，对新闻传播研究等领域产生深远影响。

赛博朋克发布于 2025/2/7更新于 2026/4/190 浏览

01. 语言模型与大语言模型

2023 年，让整个人类最为振奋的 AI 技术就是 ChatGPT。'大语言模型（Large Language Model）'这个词也随之映入人们的眼帘。ChatGPT 让人觉得惊艳之处，能够结合上下文，像人一样有逻辑性地回答问题，就算生成超长的文本也不会跑偏。

大语言模型示意图

**所谓语言模型（Language Model）**是一种机器学习算法，它可以根据给定文本来预测下一个词语或字符出现的概率，通过大量的文本数据来学习语言的统计特征，进而生成具有相似统计特征的新文本。

其核心目标是建立一个统计模型，用来估计文本序列中每个词语或字符出现的概率，从而实现语言生成、语言理解等自然语言处理任务。

大型语言模型（Large Language Model，LLM），即利用大规模语料数据进行预训练的预训练语言模型（Pre-trained Language Models，PLMs），是自然语言处理（Natural Language Processing，NLP）的方式之一。

简言之，大语言模型是在巨大数据集上训练以理解人类语言的深度学习模型，其核心目标是准确地学习和理解人类语言。大语言模型使机器能够像我们人类解释语言一样解释语言，彻底改变了计算机理解和生成人类语言的方式。

大语言模型示意图

大语言模型与普通语言模型相比，一个显著区别在于其规模。大语言模型通常具有大量的参数，并且在训练过程中使用了巨量的文本数据。

大语言模型是一种强大的工具，可以在最少的人工干预下快速、准确地处理自然语言数据。这些模型可用于各种任务，例如文本生成、情感分析、问答系统、自动摘要、机器翻译、文档分类等。

大语言模型 (LLM) 已成为人工智能 (AI) 领域的突破性发展，与 ChatGPT 功能对标的大语言模型，目前国外主要有 Google 推出的 Gopher、LaMDA 以及 Meta 的 Llama 等；国内为百度首发的'文心一言'、360 发布的大语言模型、阿里发布的'通义千问'、商汤发布的'商量'等。

大语言模型示意图