收藏!大模型相关岗位全解析:算法/开发/Agent等5大类,小白也能分清

收藏!大模型相关岗位全解析:算法/开发/Agent等5大类,小白也能分清

大模型算法、大模型应用、基座算法、agent研发、Agent开发…… 刚接触大模型赛道的你,看到这些岗位名词是不是瞬间脑袋发懵?其实这真不能怪你,毕竟就在几年前,咱们的师兄师姐找工作时,核心选择还只有Java和C++两种,哪有现在这么多细分方向。

不管是计算机科班小白、跨专业想入行的同学,还是刚转型大模型领域的程序员,几乎都会有同一个疑问:我到底适合哪个岗位?该从哪个方向准备才能少走弯路?

今天就帮大家把大模型相关岗位梳理得明明白白,分为5大类逐一拆解,结合岗位细节、入门门槛和行业趋势,小白也能快速对号入座,建议收藏备用,后续找方向、投简历都能用得上!

岗位划分

大模型算法工程师

我们先来介绍算法岗。

算法岗可以分为两大类:基座模型岗和应用算法岗。

基座模型岗

基座模型岗,有的也叫预训练算法岗,可以分为三类:理论派、工程派、能力派:

1.理论派:主攻 Attention、MoE 这些核心基础架构,目标是突破理论天花板。
2.工程派:做预训练、中期训练、后期调优全流程,验证模型的规模效应。特点是极其吃算力、数据等资源,可能千卡、万卡集群都很常见,有明确的技术交付指标,主打通用基础能力的搭建。
3.能力派:也是当下的热门方向,就是让模型具备自主行动能力,目标是 “模型即产品”、最终落地产生价值。现阶段的核心还是搭建 Agent 相关基础能力,比如工具调用、计算机操作,和前两类比,这类工作的反馈更快,要做大量后期调优和强化学习,还需要让模型和真实环境深度交互。

这里多说几句,很多同学对agent相关工作有误解,认为调个 API 套个壳,就是agent的全部工作了,就觉得这个工作跟算法好像没什么关系,但其实不是这样的。

通过数据微调,让模型原生具备更强的 Tool Call 能力、解决复杂场景的规划问题,这也是agent相关的工作。比如最近很火的 GUI Agent,其中美团做了一个 EvoCUA 的工作,团队中的成员也有发过工作总结,大家也可以去看一下:

Image

一般来说,基座模型岗是要求有对口论文的。

但有同学会说,居老师你说的不对,我没有论文我现在也在某某基座模型实习。

是这样的,一方面呢,基座算法其中有80%的工作是数据工作,另一方面,除了通义千问、字节 Seed、智谱 GLM 这些大家熟悉的基座模型,像商汤、讯飞、百川这些公司也有自己的基座模型研发团队。不过这里有个问题啊:现在基座模型领域正处于百模混战的阶段,行业发展规律其实和早年团购行业的百团大战很像 —— 初期大批玩家扎堆入局,后期经过市场、资源的层层筛选,最终只有少数头部玩家能站稳脚跟,持续提供大模型的底层基建服务,其余玩家会逐步被淘汰。

大家可以想想,最终能在基座模型这条赛道活下来的,会是哪几家?

应用算法岗

还有一类是大模型应用算法岗,也是大部分同学最终会入职的岗位 —— 不光是计算机科班,很多非科班、和计算机沾边的跨专业同学,或是没有论文成果的同学,都能适配入行。

这类岗位核心聚焦行业场景落地,比如金融、医疗、智能客服、营销等领域,核心业务目标就是让大模型产品落地后真正能用、好用。至于具体是调用 API、搭建 Workflow、做 Agent 应用,还是针对场景做轻量化模型训练,这些都只是实现落地目标的手段而已。当然部分业务部门的应用算法岗,也会根据需求做相关研究工作,部分岗位还会有论文产出的要求。这类岗位更看重对口的项目经验和工程能力,尤其是 Agent 方向,变化特别明显:以往算法岗基本只需要提供模型或算法逻辑接口,而现在随着行业业态的成熟,调度算法的业务逻辑逐渐由算法岗主导,算法岗尤其是 Agent 方向,后续对工程能力的要求大概率会持续提升。

当然算法岗对学历会有一定要求。

我今天把基座模型岗的内容讲得比较细致,而应用算法岗的范畴更广、细分方向也五花八门,没法穷尽。大家之后再看到大模型算法岗的招聘,只要排除掉基座模型岗的范畴,剩下的基本就都是应用算法岗了。

Image

大模型开发/Agent工程师**:**

  • 这个是界限最不明确的一类岗位了,这个岗位从诞生至今可能都没有超过三年,很多同学不太能区分它和大模型应用算法岗的区别。而且大模型算法岗其实就是以前的 NLP 算法岗,现在各家公司的大模型部门、业务线又都是刚成立没多久,所以岗位划分没有那么明确。
  • 这里面开发岗也分两种,用 java 或者 go 的,跟算法岗的区别特别明显;但用 python 的就容易混,比如有些大厂会让开发部门,自己做类似 langchain、langgraph 的框架供内部用,这类工作就和算法岗有点交集。这里有一个判断方法,比如云端部署、断点续传、缓存、模型api接口维护这些肯定是开发的工作,强化学习、思维链压缩、知识蒸馏这些涉及模型效果优化的肯定是算法的工作,但是像文档解析、agent搭建、tools编写、sft、向量入库这些就不是很清晰了,有的公司是算法在做,有的公司是开发在做。

AI Infra 工程师

  • 负责分布式训练、推理加速等底层支撑,是模型高效运行的基础,难度比较大,大多数做这个方向的同学在校期间导师的研究方向就是这个,有一定积累才会去做,真感兴趣的话就从看vllm或者sglang的源码开始吧。

大模型数据工程师**:**

  • 主要工作是是做数据的采集、清洗与 Pipeline 搭建,目标是构建高质量数据。

大模型评估 / Agent 评估工程师

  • 负责产品的性能、效果、安全性等维度的评测体系构建,是模型、agent迭代优化的关键环节。不是很推荐,学历不太好的同学可以做,更容易进大厂。

趋势判断

岗位介绍就讲完了,前段时间有个新闻,不知道大家有没有看到,就是前阿里 P10 毕玄(他现在正在创业)的一条钉钉消息:

Image

无独有偶,美团履约团队也推行 全栈化,把部分前端同学转到了后端组,前后端代码一起写。

Image

所以经常有同学问我,我不知道我应该投哪个岗位,我的意见都是,不用管岗位是什么名字,jd描述中你懂的东西超过三分之一就可以投。我也见到过很多同学,可能一开始准备的是算法,结果最后去做了产品。

尤其是大一大二的同学,等你就业的时候,这种打破技术栈边界的岗位划分说不定已经成了行业普遍现象,而大多数人只需要通过自然语言就可以独立开发可盈利、高可用的工具和产品。

这可能意味着,在未来,每个人都能找到自己独特的生态位,不再被单一技术栈定义,不再是流水线上的一个环节。

Image

而信息差的不断抹平,更是让 超级个体 和 一人公司 成为可能。比如前段时间火过的红墨、蕉幻、微舆这些产品,从想法萌生到产品落地,再到市场推广,整个链路的时间被不断压缩,一个人就能完成过去一个团队的工作 —— 当销售渠道、推广费用、后期维护这些环节,都能通过工具和平台高效解决,个体的创造力,会成为这个新时代最核心的竞争力。

当然,我们也得承认人性的差异:有人偏爱创新与探索,有人更倾向于稳定和按部就班,所以基础岗位依然会存在。

Image

但不可否认的是,大模型正在重构行业的人才需求,从专才到通才,从技术深耕到技术融合,是不可逆的趋势

Image

最后

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?

答案只有一个:人工智能(尤其是大模型方向)

当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右

再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。

图片


图片


对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。

如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!

下面是我整理的大模型学习资源,希望能帮到你。

图片

👇👇扫码免费领取全部内容👇👇

最后

1、大模型学习路线

img

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

在这里插入图片描述

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

在这里插入图片描述

4、 AI大模型最新行业报告

2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

img

5、面试试题/经验

img
【大厂 AI 岗位面经分享(107 道)】
img
【AI 大模型面试真题(102 道)】
img
【LLMs 面试真题(97 道)】
img

6、大模型项目实战&配套源码

img
适用人群
在这里插入图片描述
四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案
  • …👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述


在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传ZEEKLOG,朋友们如果需要可以微信扫描下方ZEEKLOG官方认证二维码免费领取【保证100%免费

Read more

Flutter 三方库 jwt_io 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、严谨、全能的 JSON Web Token (JWT) 加解密与身份安全验证引擎

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 jwt_io 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、严谨、全能的 JSON Web Token (JWT) 加解密与身份安全验证引擎 在鸿蒙(OpenHarmony)系统的端云一体化登录、政企应用的安全审计或复杂的跨端权限校验场景中,如何确保来自云端授信中心的 JWT Token 既能被正确解析(Decode),又能被严密地校验其合法性与过期时间?jwt_io 为开发者提供了一套工业级的、基于 RFC 7519 标准的 JSON Web Token 深度处理方案。本文将深入实战其在鸿蒙应用安全底座中的应用。 前言 什么是 JWT IO?它不仅是一个简单的 Base64 解码器,而是一个具备深厚 RFC

下载海康视频插件后,浏览器显示此站点正在尝试打开webcontrol浏览器中间件

已下载并安装海康的【VideoWebPlugin.exe】视频插件后,页面显示弹窗【要打开webcontrol浏览器中间件吗?xxxx://xxxxxx 想打开此应用】且页面仍然没有监控视频 解决步骤: 1、选中弹窗中的【xxxx://xxxxxx】这个地址并复制; 2、打开谷歌浏览器在地址栏输入【chrome://flags】,若是edge浏览器会自动跳转到【edge://flags】,其他浏览器同理; 3、在搜索框中输入【Insecure origins treated as secure】; 4、在输入框粘贴刚复制的【xxxx://xxxxxx】地址,并将【已停用】改为【已启用】,后点击右下角【重新启动】按钮重启浏览器; 5、重启后刷新该页面会在地址栏下方显示弹窗,点击【允许】按钮即可正常显示监控视频; *若点击的是【屏蔽】

数据结构:顺序表讲解(2)

数据结构:顺序表讲解(2)

目录 前言  一、动态顺序表的实现(继续) 1.顺序表的指定位置查找 2.顺序表的销毁 3.顺序表的指定位置插入 4.顺序表的指定位置删除 代码逐行讲解 1. 参数与断言检查 2. 元素前移覆盖(核心逻辑) 3. 更新有效元素个数 5.实现的总代码 二、顺序表算法题 1.移除元素 核心逻辑:双指针法 步骤分解 2. 删除有序数组中的重复项 3.合并两个有序数组 总结 前言    数据结构:顺序表讲解文章将讲解顺序表介绍,顺序表分类,顺序表动态顺序表的实现,顺序表算法题,顺序表问题与思考知识的相关内容,其中顺序表介绍、顺序表概念与结构、顺序表分类、动态顺序表的实现、尾插,头插,尾删,头删时间复杂度对比为上一章节知识的内容,

【OpenClaw从入门到精通】第04篇:Web/TUI/钉钉全打通!OpenClaw多端交互实测指南(2026避坑版)

【OpenClaw从入门到精通】第04篇:Web/TUI/钉钉全打通!OpenClaw多端交互实测指南(2026避坑版)

摘要:本文聚焦OpenClaw三大核心交互方式,针对新手“不知如何与AI助理沟通”的痛点,提供Web控制台、TUI终端、聊天软件(以钉钉为核心)的完整实操流程。Web控制台适配电脑端深度配置,TUI终端适合服务器远程维护,聊天软件满足手机端移动办公,三者协同实现“随时随地召唤AI”。文中包含2026实测的命令代码、配置步骤、问题排查方案,所有案例为虚拟构建,代码未上传GitHub,兼顾新手入门与进阶实操,帮助读者快速打通多端交互,最大化OpenClaw使用效率。 优质专栏欢迎订阅! 【DeepSeek深度应用】【Python高阶开发:AI自动化与数据工程实战】【YOLOv11工业级实战】 【机器视觉:C# + HALCON】【大模型微调实战:平民级微调技术全解】 【人工智能之深度学习】【AI 赋能:Python 人工智能应用实战】【数字孪生与仿真技术实战指南】 【AI工程化落地与YOLOv8/v9实战】【C#工业上位机高级应用:高并发通信+性能优化】 【Java生产级避坑指南:高并发+性能调优终极实战】【Coze搞钱实战:零代码打造吸金AI助手】