文章摘要
文章围绕Copilot效率升级展开,介绍了提升效率的核心路径。一方面优化会话框架,通过提示缓存和按需加载工具减少资源消耗;另一方面扩展自动模型选择功能,结合模型健康状态和任务类型匹配模型。该功能已在多端上线,后续还将扩展场景,文中还给出使用技巧。

随着AI编程助手承担更多智能代理任务——从规划、编辑到调试、评审,以及在更长会话中调用各类工具,提升使用效率早已不只是减少令牌消耗那么简单,更关键的是学会更聪明地使用这些资源。

提升效率的核心路径有两个:一是减少会话中重复传递的信息,包括上下文、工具定义和缓存状态;二是为当前任务选择最适配的模型。快速解释、精细编辑和复杂的多文件修改,显然不应该采用完全一致的处理逻辑。

目前我们正在从两方面推进优化:一方面升级AI助手的会话框架,让更多会话资源投入到实际任务处理中;另一方面扩展自动模型选择功能,让助手可以自动匹配合适的模型,无需开发者每次手动选择。本文将重点介绍主流代码编辑器中AI助手的会话框架改进,以及自动模型选择功能在全平台的落地进展。

一、会话框架优化:提示缓存与按需加载工具

在长会话AI助手使用场景中,会话框架会为模型准备大量重复信息:包括系统提示、仓库上下文、对话历史、可用工具列表以及当前任务状态。其中部分上下文是必需的,但还有很多可以被缓存、延迟加载,或者仅在相关场景触发时才加载。

主流代码编辑器中的AI助手主要通过两项改进实现这一优化:提示缓存功能可以让助手复用重复的提示前缀对应的模型状态,无需在每次请求时重新计算相同的前缀内容;工具搜索功能则允许模型按需加载工具定义,不用在每一轮对话中都将完整的工具schema传入上下文。

当智能代理调用的工具越来越多时,这项优化的价值会更加凸显。一次会话可能需要访问多种工具,如果提前加载所有完整的工具定义,会为每一轮对话增加固定的资源消耗,即便只有少数工具和当前任务相关。通过工具搜索功能,助手可以保持工具集的广泛性,同时减少传入模型的不必要工具schema内容。

如果想要了解这项优化的技术实现细节,包括提示缓存、缓存控制断点、厂商专属工具搜索以及在长会话智能代理场景中的工作原理,可以查看官方技术深度解析文档。

二、自动模型选择的核心价值

自动模型选择功能解决了一个非常实际的问题:当前哪一个模型最适合这项任务?

在用户发起第一次请求后,AI助手会结合任务意图和当前模型的健康状态,选择最适配当前任务的模型。不同类型的工作对推理能力的需求不同,比如快速解释类任务不需要极强的推理能力,而复杂的多文件修改则需要更深度的思考,自动模型选择可以自动完成这一匹配,无需用户手动调整模型参数。

根据测试评估,没有任何单一模型可以在所有任务中都保持最佳表现。在多数场景下,性能更高效的模型可以达到和强模型相同的结果;而当任务需要深度推理时,更强的模型才能发挥作用。自动选择功能会学习到哪些场景下更强的推理能力会提升结果质量,在任务需要时升级模型,在不需要时保持高效运行。其核心目标不是用质量换取成本,而是选择最贴合当前任务的模型。

三、自动模型选择的运作逻辑

自动模型选择结合了两个核心信号:当前可用且健康的模型,以及当前任务的具体类型。

  • 实时模型健康状态:通过动态引擎跟踪模型的可用性、使用率、响应速度、错误率以及使用成本。即便某个模型具备处理任务的能力,也不代表它是当前时刻的最佳选择。自动选择会考虑当前系统的整体状态,让助手路由到既具备能力又处于就绪状态的模型。
  • 基于HyDRA的任务感知路由:HyDRA是一款路由模型,会综合考虑推理深度、代码复杂度、调试难度以及工具编排需求等因素。它会先筛选出能够达到任务质量标准的模型,再从中选择最适配的那一个。

根据测试数据,HyDRA的路由策略具备灵活的可调性:三种典型运行节点可以覆盖不同的使用需求——峰值节点可以在比主流高性能模型节省12.9%成本的同时实现更优的效果,聚合节点则可以在平衡质量的前提下实现72.5%的成本节省。在行业通用基准测试中,HyDRA的保守模式分辨率达到70.8%,和同类路由工具持平,成本节省达到3.3倍,聚合模式则优于主流企业级路由的两种运行模式。

综合这两个信号,自动选择可以避免一刀切的模型使用策略。我们的目标不是让所有任务都使用最强的模型,也不是全部使用最便宜的模型,而是精准匹配任务需求选择最合适的模型。

四、适配真实开发场景的细节优化

仅在测试中实现正确的路由逻辑还不够,要让自动选择功能在真实开发流程中发挥作用,还需要适配开发者的实际使用习惯:对话会越来越长、上下文会不断积累、任务会随时切换,同时开发者会使用多种编程语言。

缓存感知路由策略:每一轮对话都切换模型听起来很灵活,但实际上会破坏缓存复用效率。如果会话始终使用同一个模型,提示前缀可以被缓存并在后续对话中复用,中途切换模型会打破缓存,反而可能导致资源消耗超过路由优化带来的节省。自动选择会在自然的缓存边界进行模型切换:比如第一次对话时没有缓存可以复用,或者在会话压缩重置上下文之后,在这两个节点之间,选中的模型会保持不变,以便缓存持续积累。

多语言适配能力:AI助手服务全球的开发者,因此路由功能需要支持非英语语言。我们的路由模型基于覆盖16个语系的对话数据训练,包括东亚语言、欧洲语言等。测试结果显示,除英语外的其他语言组的路由准确率和英语基线差距不超过4个百分点,不存在统计学上显著的质量差异。

智能识别升级时机:自动选择不会简单地将任务划分为“简单”或“困难”,而是通过训练让模型学习不同模型之间的表现差异。对于每一个训练查询,我们会用弱模型和强模型分别生成回复,并从多个质量维度进行评分,让路由模型学习到何时强模型能够提升结果质量,何时高效模型也可以生成同等优质的结果。对于长会话中的上下文依赖对话,路由模型会基于完整的多轮对话进行训练,包括原始用户意图、近期助手回复以及会话元数据。

五、自动模型选择的落地与扩展计划

基于任务意图的自动模型选择功能已经在主流代码编辑器、网页端和移动端上线。它可以让AI助手更清晰地识别用户正在进行的工作类型——无论是编码、调试、规划还是调用工具,从而为任务选择更合适的模型。

我们正在持续将这项功能扩展到更多AI助手场景中,后续的推进计划包括:

  • 将任务意图自动选择功能扩展到AI助手CLI、GitHub应用以及更多IDE环境中;
  • 简化免费和学生版的模型选择逻辑,仅保留自动选择作为唯一选项;
  • 新增企业管理员控制功能,允许组织将自动选择设置为默认选项,或者强制仅使用自动选择功能。

六、进一步提升AI资源使用价值的实用技巧

AI助手已经在默认配置下变得更加高效,但还有一些实用习惯可以帮助你更好地利用AI信用额度:

  • 优先使用自动选择功能:自动选择是多数任务的绝佳默认选项,它会基于你的任务目标自动匹配合适的模型,无需每次手动选择。
  • 保持上下文聚焦:切换任务时开启新的会话,必要时整理长会话,当你明确知道需要使用哪些文件时,可以直接告知助手,减少不必要的上下文传递,让更多资源投入到实际任务中。
  • 避免中途切换模型或设置:中途切换模型、推理等级、上下文大小或者工具配置,会破坏缓存复用,导致助手重新构建上下文。建议先配置好会话参数,再集中处理相关任务。
  • 大型任务先规划再并行处理:对于复杂任务,可以先让助手制定规划方案。并行代理工具在任务可以真正拆分时会很有用,但同时也会并行消耗信用额度,因此需要谨慎使用。
  • 仅启用需要的工具:工具和MCP服务器功能强大,但宽泛的工具集会增加额外的上下文消耗。仅启用和当前任务相关的工具,关闭不需要的功能,可以通过代理工具管理功能来简化工具配置流程。
  • 查看使用统计数据:AI使用页面可以展示不同功能和模型的额度消耗情况,在AI助手CLI中,会话级别的使用统计也可以帮助你在工作中发现高消耗的使用模式,及时调整。

完整的使用指南可以参考官方帮助文档。

七、快速上手与反馈

自动模型选择功能已经在所有支持的AI助手场景中上线。想要了解更多细节,可以查看官方文档。你也可以在社区讨论区分享你的使用反馈和建议。

我们会持续优化AI助手的整体效率,让更多的信用额度投入到有价值的工作中,无需用户手动调整每一个模型选择参数。

你的AIGC知识价值,正在被看见!塔猴AI达人星火计划,发布课程,赢现金激励!点击加入活动:https://www.tahou.com/article/206587263682970629

AI生成内容提示:本文由人工智能辅助创作,内容仅供参考,不代表平台观点。请注意核实信息的准确性,并理性判断。

以上内容不代表本平台立场,仅供读者参考