「电力系统运转正常,正在运行中的总机组容量为 2.8 亿千瓦……」这是科幻作家刘慈欣在 1991 年出版的小说《超新星纪元》中描写的一个片段。在这本小说中,辅助孩子们处理政务的是一台能和人交谈的超级量子计算机。
在今年 WAIC 世界人工智能大会的现场,我们就看到了有类似功能的 AI 大模型。这个模型来自中国移动,是专门用于政务场景的行业大模型。和它一起发布的还有中国移动的客服大模型。
为什么先做这两个行业?因为这两个行业离每一个普通人最近,可以直接服务于普通大众,可以为我们的日常生活排忧解难。下面我们从这两个行业模型的技术特色、业务特色、中国移动大模型体系布局三个维度来解读。
技术篇
当前以 Transformer 为核心结构的大模型还存在诸多方面的挑战,其中最为显著的:
一是大模型的幻觉问题。也就是大家常说的「一本正经地胡说八道」。一个公司、部门或行业组织很难把自己的客户交给一个可靠性难以控制、可信性不能充分保障的系统来服务。
二是大模型自身的无行业目标性。用户提问题或者给大模型指令,大模型生成回复。大模型并不驱动对话,大模型的这种无目的性与大量行业智能应用需求之间需要一个桥梁。行业模型需要提供领域内的引导能力,实现基于行业模型的主动驱动。
中国移动发布的两个行业大模型——九天・海算政务大模型和九天・客服大模型从以下几个方面来克服上面的技术挑战,确保用户可以放心使用大模型的靠谱服务。
一、动态信息场。基于对用户的了解以及用户当下提出的需求,九天行业大模型被专门训练来构建动态信息场,涵盖相关的文档、知识、功能接口、数据库接口、流程、分析表图等等。信息场内的数据分为私域数据和公域数据,私域数据隐编码后和公域数据共同提供给模型,作为对模型生成回复的一个重要输入和约束。信息场一方面保护了私域数据的隐私,一方面降低了模型的幻觉问题。
二、全流程贯通。在很多行业中,人工智能小模型已经得到广泛的应用,嵌入在行业应用的某些环节。九天行业大模型强调面向行业全流程、全场景进行建模。比如九天・海算政务大模型服务于事项办理、政策解读、流程辅助、政务决策大屏分析等场景;九天・客服大模型服务于客户服务的所有环节,包括知识采编、在线客服、热线客服、服务质量检查等等。行业智能化应用的质量,在实际场景中需要从用户的角度去做端到端的评价。
三、关怀驱动。不管是政务服务还是客户服务,一个核心的目的是更好地服务于广大用户。一个用户或客户,不只需要得到信息的满足,也需要在交互中得到关怀。九天行业模型将情感关怀作为数据过滤、模型训练的目标之一,让技术更有温度,让服务更能顺应客户的意愿。
四、人机协同。大部分行业模型和基础大模型被训练用作大模型和用户之间一对一的交互,九天行业模型则强调人机协同式交互,也即大模型和专业人工服务协同共同为用户服务。比如在九天·客服大模型中,大模型先与客户沟通,在需要更高权限时请求人工客服加入并执行复杂任务,之后客服人员和大模型共同为客户服务。
业务篇
九天・海算政务大模型:让政务界面变成一个「对话框」
如果你去过当地的政务服务中心,那你可能对「一网通办」这个词有印象。它指的是进「一个网站」就能办全部事,本质上是打通了不同部门的信息系统,让民众只需操作一个办事系统,就能办成不同领域的事项。
九天・海算政务大模型就是为解决这类问题而诞生的。就解决「一网通办」问题来说,这个大模型有以下几个特点:
一是政务事项深度理解能力。模型实现了政务政策、事项、数据深度贯穿,它可以把民众的话语转化为政府办事的语言,打通口语化表述与专业化事项名词之间的壁垒。比如,民众咨询的是「我想开个烧烤店,需要办哪些手续?」系统通过大型语言模型进行语义理解和意图识别,发现这个问题涉及多个政务事项。为了实现「一件事一次办」,大模型把所有事情都清清楚楚地列了出来。

二是安全可信的信息关联扩展能力。中国移动首创的「政务大模型 - 政务服务信息场 - 应用」体系,将事项、政策、流程以及其他可能用到的政务数据汇聚到信息场中。例如,在提问者询问某个选址是否可行时,大模型列出了这个地点的人口密度、年龄构成、商业配套、竞品情况等信息,甚至还给出了自己的建议。这些信息是大模型从打通了海量政务数据的政府服务信息场中获取到的,并结合用户的私域数据进行解答,实现政务流程不出场,保证政务领域应用的安全可信。
三是面向复杂事项、复杂流程的多元 UI 交互能力。传统大模型只能给予文本或图片的答案形式,而政务场景下涉及文本、语音、表格、事项流程等各类任务,九天・海算政务大模型可以按照最符合用户习惯的交互模式给予用户解答。例如,在后续对话中,大模型列出了所有需要准备的材料以及模板下载链接。在这些对话中,大模型结合上下文理解,回答民众问题、引导民众完成事项的多个办理流程,实现了从用户咨询到事项办理的全流程贯通。






