17个急聘岗位曝光 DeepSeek押注Agent时代：算力瓶颈决定下半年成败？

我真的没招了

2026-03-26 16:39:37

智能体（Agent）

模型优化

模型部署

文章摘要

DeepSeek近期开放17个核心岗位，聚焦Agent技术栈构建，从基础模型研究转向产业化落地。

DeepSeek近期一口气开放17个核心招聘岗位，其中算法、评测和基础设施岗位明确聚焦于Agent技术栈的深度构建，这标志着这家公司正从基础模型研究全面转向Agent的产业化落地。岗位要求中明确提及重度使用Claude Code、Cursor等工具，甚至要求理解“Vibe Coding”的创新应用，显示出其对实用化、工程化AI落地的迫切需求。这与我们观察到的行业趋势相符：随着Agent应用（如MiMo Claw、OpenClaw）的爆发，推理速度和多模态处理能力正成为新的性能瓶颈，下半年很可能成为多模态Agent的决战期。

我们的行业判断，Agent的复杂性（超长上下文、多模态输入、工具调用）正在以前所未有的速度消耗GPU的显存带宽，这使得模型推理的首个Token时间（TTFT）成为衡量可用性的关键指标。如果厂商不能解决预填充（Prefill）阶段的性能问题，再强大的Agent规划能力也只能停留在PPT上。

招聘侧写

DeepSeek全景布局：从模型到“运行时环境”

DeepSeek的招聘需求清晰地勾勒出了其构建端到端Agent能力系统的战略版图，它不再是单点突破，而是全链路覆盖。Agent专属岗位的设置，DeepSeek设立了专属的Agent算法研究员、数据评测专家和基础设施工程师岗位，显示了其对Agent技术的重视程度已提升至与基础模型同等的高度。

算法研究员聚焦于提升模型的多轮交互、长期记忆和过程奖励，这是Agent实现自主学习和复杂规划的基础。数据评测专家则肩负起构建体系化测试集的重任，以精准衡量Agent在工具调用可靠性和规划能力上的边界。

基础设施：为高速Agent搭建跑道，最能体现DeepSeek工程野心的，是Agent基础设施岗位的要求。

该岗位明确要求候选人熟悉MCP、Tool Use、Function Calling等协议规范，并负责搭建下一代容器调度与隔离平台。这说明DeepSeek正在构建一个安全、高性能的Agent运行时环境，用于管理复杂的工具调用权限和资源调度，以支撑海量Agent的高并发运行。

我们的点评：对比今年初，DeepSeek当时主要招聘通用AGI研究员。如今，招聘的重点转向了工程化、基础设施和应用落地。这表明他们已经完成了基础模型能力的验证，并将战略重心转移到如何让这些能力在真实的企业场景中可靠、高效地执行。

速度瓶颈

Token消耗爆炸，推理速度成为Agent的“生死线”

Agent应用的复杂性，特别是多模态Agent的引入，正在将模型的推理速度推向崩溃的边缘。

Token消耗的指数级增长，我们此前分析了阿里云和百度云的涨价，主要驱动力是Token调用量暴涨。对于Agent来说，其Token消耗比纯聊天机器人高出数倍。Agent需要巨大的Prompt来描述当前的任务意图、维护长期记忆（Memory MCP），以及加载所有可用的工具（Skills）的描述。更关键的是，多模态Agent（如小米的MiMo-V2-Omni）在处理图像、视频、音频时，需要将这些原始输入进行高维嵌入（Embedding），这会产生大量的预填充（Prefill）Token。

推理速度的决定性作用：TTFT。推理速度的核心指标是TTFT（Time to First Token），即模型从接收到指令到输出第一个Token所需的时间。对于需要实时反馈的Agent任务（如网页操作、实时语音交互），TTFT过长意味着“卡顿”，用户体验极差。目前很多多模态Agent的TTFT会超过10秒，这在交互中是不可接受的。这迫使厂商不得不压缩多模态模型本身的尺寸，以换取更快的TTFT。

行业趋势预测：多模态模型的瘦身与重构

为了应对这一瓶颈，我们预测下半年将出现大量尺寸更小、但多模态能力超群的“Omni轻量级模型”。这些模型将通过更激进的注意力机制优化（如线性注意力、mHCA等）和更精细的量化技术（如TurboQuant的3-bit压缩理念），来保障推理速度。厂商会牺牲一部分通用知识的深度，来换取Agent所需的感知能力和快速反应能力。

研发方向

从通用大模型到专属Agent生态的构建

DeepSeek的招聘方向，清晰地展现了Agent化趋势对模型研发的倒逼作用。

数据闭环的自我造血，算法研究员要求与数据标注团队紧密协作，设计标注方案与质量标准，目标是形成“数据-训练-评测”的完整提升闭环。这意味着DeepSeek正在摆脱对外部通用数据集的依赖，转而构建一套针对Agent任务的、私有的、高质量的反馈数据体系。这是构建Agent核心竞争力的关键。

Agent交互协议的标准化，基础设施工程师需要熟悉MCP、Tool Use等协议。这说明，DeepSeek认识到，Agent的可靠性取决于它与外部工具（如文件系统、代码库）交互的标准化程度。这种对交互协议的重视，恰恰是在为更复杂的、多步骤的Agent任务铺设安全、稳定的通道。

我们的点评：下半年无疑是“多模态Agent之年”。我们已经看到了MiMo-V2-Omni在跨模态执行上的布局，以及其他厂商在视频和语音上的投入。多模态是理解复杂环境的基础，而Agent是执行复杂任务的手段。两者结合，是实现“通用智能”迈向“实用智能”的关键。但速度的压力将是最大的考验，谁能用现有算力跑出更快的TTFT，谁就能抢占市场心智。

DeepSeek的挑战在于，它如何在保持模型综合性能（如MiMo-V2-Pro在OpenClaw上表现优异）的同时，解决多模态Agent带来的超高Prefill成本和TTFT延迟。如果其R-1模型曾在推理成本上颠覆行业，那么现在，它必须证明其工程能力同样能让Agent推理变得“快如闪电”，否则高昂的延迟会直接扼杀用户体验，使所有复杂的工作流规划都化为泡影。（微信公众号：Tahou_2025）

关注塔猴公众号，回复“1”加入专属社群

扫码下载塔猴APP，查看更多干货

以上内容不代表本平台立场，仅供读者参考