Agent Hunt
Lv2 · 职业百科 · 第 03· 6 分钟阅读

算法工程师 — 这职业到底是干啥的

算法工程师不是「调用 ChatGPT」,是「造大模型 / 训视觉模型 / 训自动驾驶感知」。门槛最高、薪资最高(中位 52.5k),但需要论文 / 比赛 / 训练实战。

算法工程师 — 这职业到底是干啥的

接着上一篇的发电厂类比:AI Agent 工程师是「装电的」,算法工程师就是「造发电机的」

发电机是怎么造的?要懂物理(数学),要试很多次(实验),还要看竞争对手家发电机功率多大(paper / benchmark)。算法工程师做的就是这件事 — 不是用现成模型,是训新模型

算法工程师做什么(具体)

公司说:「我们要做自动驾驶,需要一个能识别行人 + 车辆 + 红绿灯的视觉模型。」

算法工程师做法:

  1. 看 paper:扫一遍这个方向最近 1 年的论文,找性能最好的几个模型架构
  2. 准备数据:收集 / 标注 10 万张图片,做训练集 / 验证集 / 测试集划分
  3. 写训练代码:用 PyTorch / TensorFlow 实现模型架构,调超参(学习率 / batch size / loss 函数)
  4. 跑训练:在公司的 GPU 集群上跑 3 天 - 3 周,看 loss 曲线、看验证集 mAP
  5. 失败 → 调参 → 再训:90% 的实验是失败的。要会判断为什么不收敛、为什么过拟合、为什么 corner case 答错
  6. 上线 + 蒸馏:模型太大跑不快 → 做模型压缩 / 量化 / 蒸馏,让小模型继承大模型能力

这是一份「训新模型」的工作。不需要 ChatGPT API,但需要 GPU 集群、需要数据、需要懂训练流程的每一步。

三套硬核能力

1. PyTorch / TensorFlow 全链路。 不是「会用」,是能从 0 写一个训练 loop:DataLoader / 模型定义 / loss / optimizer / scheduler / checkpoint / 分布式训练。这一套写下来 1500 行代码,没有手撕过的人面试 30 分钟就露馅。

2. 数学 + paper 阅读。 看到一个新模型架构(比如 Mixture-of-Experts、State Space Model),能在 1 周内读懂论文 + 复现核心代码。这条线和「会用 LangChain」差异最大的就在这里 — 你必须能算 loss 怎么传

3. 训练实战(不是「我用过 Hugging Face」)。 简历里得有「我训过 XX 模型,数据集多大、epoch 几次、最终指标多少」。没自己训过模型只用过预训练模型的人,在算法岗投递里基本是「简历筛走」状态。

算法工程师的真实数据

Agent Hunt 抓到国内 1054 条算法工程师岗位

指标 数据
国内岗位数 1054
中位月薪 52.5k(p25 37.5k / p75 65k,样本 105 条)
中位经验要求 3 年
头部公司 字节跳动、腾讯、智谱 AI、MiniMax、Moonshot
最高频技能 LLM / Python / NLP / PyTorch / TensorFlow
学历分布 硕士 61 / 本科 44 / 博士 9(明显硕博偏好)

52.5k 是国内 AI 岗位里最高的中位之一,比 AI Agent 工程师(32.5k)高 60%。但门槛也高 — 硕博占了一半,本科生想进只能靠竞赛 / 论文 / 开源项目硬撑。

最高频的 sample title 包括「自动驾驶算法工程师」「LLM 算法工程师」「模型策略岗」— 反映出这条线现在两个主流方向:大模型预训练 / 微调,和自动驾驶 / 视觉算法

怎么开始

第一步(核心):完整训练过一个模型。 不是 transfer learning 调几个 epoch — 是从 random init 训 1 个完整模型(哪怕是小的 MNIST CNN / 100M 参数 LLM)。这一关过了才能开始

第二步:跑一个公开竞赛 / 开源项目。Kaggle / 天池 / NeurIPS Workshop / Hugging Face Open LLM Leaderboard — 拿到前 20% 就是简历亮点。

第三步:发一篇 paper / 写一个广为人知的开源项目。这一步选其一:发 ACL / EMNLP / CVPR Workshop / arxiv,或者写一个 GitHub 1k+ star 的训练框架 / 数据集。没有这一步硬撑,硕士去顶尖公司很难

第四步:投头部公司。优先:大模型公司(智谱 / MiniMax / Moonshot / 百川 / DeepSeek)+ 互联网大厂 AI 团队(字节 Seed / 腾讯 AI Lab / 阿里达摩 / 百度 KDD)。

不适合谁

1. 只用过现成 API、没自己训过模型的人。和 AI Agent 工程师看似都叫「AI 工程师」,但代码能力评估方式完全不同。算法岗会让你手写 attention,写错就刷掉。

2. 数学怕了的人。这条线绕不开线代 + 概率论 + 优化。看到论文里 ∇L(θ) 头就疼的人,不建议硬投。

3. 想 1-2 年快速涨薪的人。算法岗节奏慢,1 年训 1-2 个模型很常见。和 Agent 工程师那种「每周上线一个新功能」节奏完全不同。

算法 vs AI Agent 工程师(最常问的对比)

维度 算法工程师 AI Agent 工程师
核心动作 loss.backward() 改模型权重 model.invoke(prompt) 用模型
学历偏好 硕博明显占优 不卡学历卡项目
中位月薪 52.5k 32.5k
节奏 1 个模型训几个月 1 个功能上线 1-2 周
必备 PyTorch + 论文阅读 + 数学 LangChain + RAG + Prompt 工程
误投伤害 让 Agent 工程师手撕 attention 会挂 让算法工程师调 prompt 不会发挥

下一步