17个急聘岗位曝光 DeepSeek押注Agent时代:算力瓶颈决定下半年成败?

2026-03-26 14:56:56
文章摘要
DeepSeek近期开放17个核心岗位,聚焦Agent技术栈构建,从基础模型研究转向产业化落地。

DeepSeek近期一口气开放17个核心招聘岗位,其中算法、评测和基础设施岗位明确聚焦于Agent技术栈的深度构建,这标志着这家公司正从基础模型研究全面转向Agent的产业化落地。岗位要求中明确提及重度使用Claude Code、Cursor等工具,甚至要求理解“Vibe Coding”的创新应用,显示出其对实用化、工程化AI落地的迫切需求。这与我们观察到的行业趋势相符:随着Agent应用(如MiMo Claw、OpenClaw)的爆发,推理速度和多模态处理能力正成为新的性能瓶颈,下半年很可能成为多模态Agent的决战期。

我们的行业判断,Agent的复杂性(超长上下文、多模态输入、工具调用)正在以前所未有的速度消耗GPU的显存带宽,这使得模型推理的首个Token时间(TTFT)成为衡量可用性的关键指标。如果厂商不能解决预填充(Prefill)阶段的性能问题,再强大的Agent规划能力也只能停留在PPT上。

招聘侧写


DeepSeek全景布局:从模型到“运行时环境”

DeepSeek的招聘需求清晰地勾勒出了其构建端到端Agent能力系统的战略版图,它不再是单点突破,而是全链路覆盖。Agent专属岗位的设置,DeepSeek设立了专属的Agent算法研究员、数据评测专家和基础设施工程师岗位,显示了其对Agent技术的重视程度已提升至与基础模型同等的高度。

算法研究员聚焦于提升模型的多轮交互、长期记忆和过程奖励,这是Agent实现自主学习和复杂规划的基础。数据评测专家则肩负起构建体系化测试集的重任,以精准衡量Agent在工具调用可靠性和规划能力上的边界。

基础设施:为高速Agent搭建跑道,最能体现DeepSeek工程野心的,是Agent基础设施岗位的要求。

该岗位明确要求候选人熟悉MCP、Tool Use、Function Calling等协议规范,并负责搭建下一代容器调度与隔离平台。这说明DeepSeek正在构建一个安全、高性能的Agent运行时环境,用于管理复杂的工具调用权限和资源调度,以支撑海量Agent的高并发运行。

我们的点评: 对比今年初,DeepSeek当时主要招聘通用AGI研究员。如今,招聘的重点转向了工程化、基础设施和应用落地。这表明他们已经完成了基础模型能力的验证,并将战略重心转移到如何让这些能力在真实的企业场景中可靠、高效地执行。


速度瓶颈


Token消耗爆炸,推理速度成为Agent的“生死线”

Agent应用的复杂性,特别是多模态Agent的引入,正在将模型的推理速度推向崩溃的边缘。

Token消耗的指数级增长,我们此前分析了阿里云和百度云的涨价,主要驱动力是Token调用量暴涨。对于Agent来说,其Token消耗比纯聊天机器人高出数倍。Agent需要巨大的Prompt来描述当前的任务意图、维护长期记忆(Memory MCP),以及加载所有可用的工具(Skills)的描述。更关键的是,多模态Agent(如小米的MiMo-V2-Omni)在处理图像、视频、音频时,需要将这些原始输入进行高维嵌入(Embedding),这会产生大量的预填充(Prefill)Token。

推理速度的决定性作用:TTFT。推理速度的核心指标是TTFT(Time to First Token),即模型从接收到指令到输出第一个Token所需的时间。对于需要实时反馈的Agent任务(如网页操作、实时语音交互),TTFT过长意味着“卡顿”,用户体验极差。目前很多多模态Agent的TTFT会超过10秒,这在交互中是不可接受的。这迫使厂商不得不压缩多模态模型本身的尺寸,以换取更快的TTFT。

行业趋势预测:多模态模型的瘦身与重构

为了应对这一瓶颈,我们预测下半年将出现大量尺寸更小、但多模态能力超群的“Omni轻量级模型”。这些模型将通过更激进的注意力机制优化(如线性注意力、mHCA等)和更精细的量化技术(如TurboQuant的3-bit压缩理念),来保障推理速度。厂商会牺牲一部分通用知识的深度,来换取Agent所需的感知能力和快速反应能力。

研发方向


从通用大模型到专属Agent生态的构建

DeepSeek的招聘方向,清晰地展现了Agent化趋势对模型研发的倒逼作用。

数据闭环的自我造血,算法研究员要求与数据标注团队紧密协作,设计标注方案与质量标准,目标是形成“数据-训练-评测”的完整提升闭环。这意味着DeepSeek正在摆脱对外部通用数据集的依赖,转而构建一套针对Agent任务的、私有的、高质量的反馈数据体系。这是构建Agent核心竞争力的关键。

Agent交互协议的标准化,基础设施工程师需要熟悉MCP、Tool Use等协议。这说明,DeepSeek认识到,Agent的可靠性取决于它与外部工具(如文件系统、代码库)交互的标准化程度。这种对交互协议的重视,恰恰是在为更复杂的、多步骤的Agent任务铺设安全、稳定的通道。

我们的点评: 下半年无疑是“多模态Agent之年”。我们已经看到了MiMo-V2-Omni在跨模态执行上的布局,以及其他厂商在视频和语音上的投入。多模态是理解复杂环境的基础,而Agent是执行复杂任务的手段。两者结合,是实现“通用智能”迈向“实用智能”的关键。但速度的压力将是最大的考验,谁能用现有算力跑出更快的TTFT,谁就能抢占市场心智。

DeepSeek的挑战在于,它如何在保持模型综合性能(如MiMo-V2-Pro在OpenClaw上表现优异)的同时,解决多模态Agent带来的超高Prefill成本和TTFT延迟。如果其R-1模型曾在推理成本上颠覆行业,那么现在,它必须证明其工程能力同样能让Agent推理变得“快如闪电”,否则高昂的延迟会直接扼杀用户体验,使所有复杂的工作流规划都化为泡影。(微信公众号:Tahou_2025)


关注塔猴公众号,回复“1”加入专属社群

扫码下载塔猴APP,查看更多干货


声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
智能体(Agent)
模型优化
模型部署