Codex使用教程：从安装配置到项目实战的完整指南

2026-06-22 11:56:03

Codex使用教程

Codex

文章摘要

Codex是OpenAI推出的AI编程智能体，能够通过自然语言理解并执行代码生成、文件编辑、命令执行等任务。无论你是编程新手还是资深开发者，这份Codex教程都将帮助你系统掌握这一工具的核心用法，提升日常开发与自动化工作效率。

本文提供一份完整的Codex使用教程，涵盖从安装部署、基础操作到高阶应用的全流程。Codex是OpenAI推出的AI编程智能体，能够通过自然语言理解并执行代码生成、文件编辑、命令执行等任务。无论你是编程新手还是资深开发者，这份Codex教程都将帮助你系统掌握这一工具的核心用法，提升日常开发与自动化工作效率。

Codex使用教程

一、什么是Codex

Codex是OpenAI推出的AI编程智能体（coding agent），于2025年年中正式发布，到2026年已成为开发者生态中最热门的编程生产力工具之一。与传统的代码补全工具不同，Codex能够直接读取本地项目文件、编辑文档与代码、执行系统命令、操控各类软件，并支持联网检索信息。

Codex的核心定位

Codex的定位是一个“能够真正参与开发的AI工程师”。你可以直接告诉它：“帮我给这个React项目增加登录功能”、“重构订单模块”、“修复支付页面状态异常问题”，它会开始阅读整个项目，然后尝试修改相关代码。

Codex由OpenAI最新的前沿模型驱动，注重安全性、可测试性与开发者效率。每个任务都在其独立的沙盒环境中执行，确保操作安全可控。

Codex的三种使用形态

Codex提供三种主要的使用方式，适应不同场景：

使用方式	位置	适用场景
ChatGPT侧边栏	chatgpt.com	连接GitHub的任务队列
独立桌面应用	chatgpt.com/codex	更丰富的界面、自动化和插件连接器
终端CLI	命令行	脚本化流程、CI集成
VS Code扩展	VS Code市场	在编辑器内委派任务

Codex的发展历程

2026年，Codex经历了多次重大更新。6月3日，OpenAI宣布将Codex深度整合进ChatGPT，近10亿用户获得全新的Agent插件、批注和Sites三大功能升级。6月18日，OpenAI宣布Codex全面开放模型接入，支持DeepSeek、Claude、Gemini等任意第三方大语言模型。同一天，Codex还正式推出了“Record and Replay”功能，让用户可以直接在Mac上“做一次”给AI看，Codex会自动将整个流程打包成可重复使用的技能。

二、Codex安装与初始配置

系统要求

在使用Codex之前，需要确保你的系统满足以下要求：

项目	要求
操作系统	macOS 12+ / Ubuntu 20.04+ / Debian 10+ / Windows WSL2
运行时	Node.js ≥ 18
内存	至少4GB（推荐8GB）
账号	ChatGPT Plus/Pro/Team/Enterprise 或 OpenAI API Key

Windows用户建议通过WSL2使用Codex；macOS和Arm Linux用户安装过程更加顺畅。

桌面应用安装

对于大多数用户来说，桌面应用是最直观的入门方式：

访问OpenAI Codex官方网站：https://openai.com/zh-Hans-CN/codex/
下载对应操作系统版本（macOS或Windows）的安装包
按提示完成安装
打开Codex，使用ChatGPT账号登录

首次启动时，macOS可能会提示“无法验证开发者”，此时需要进入“系统设置→隐私与安全性”，点击“仍要打开”。

如果只是体验，优先使用账号登录，不建议一开始就研究API Key。免费账号的使用额度有限，长期使用建议准备Plus或更高套餐。

命令行CLI安装

对于习惯终端操作的开发者，Codex CLI是更高效的选择：

# npm全局安装（推荐，全平台通用）
npm install -g @openai/codex

# macOS还可以使用Homebrew
brew install --cask codex

# 验证安装
codex --version

国内用户如遇安装缓慢，可使用淘宝镜像：

npm i -g @openai/codex --registry=https://registry.npmmirror.com

安装完成后，执行登录验证：

codex login

浏览器会自动弹出授权页面，使用ChatGPT账号完成授权。

ChatGPT中的Codex入口

如果你已经订阅了ChatGPT Plus、Pro、Team或Enterprise方案，可以直接在ChatGPT左侧工具栏找到Codex入口。点击后会跳转到设置页面，完成以下步骤：

点击“Get Started”开始设置
完成多重身份验证（MFA），使用Google Authenticator或Authy扫描二维码
授权GitHub连接器
添加GitHub账户
选择要处理的仓库并创建环境

三、Codex基础操作

权限模式设置

Codex提供三种沙箱安全级别，在对话框底部可以切换权限模式：

模式	权限范围	适用场景
只读（read-only）	仅读取文件，只提供建议	审查代码、学习理解代码库
工作区写入（workspace-write）	可在工作目录内写文件	日常开发，推荐使用
完全访问（danger-full-access）	无沙箱限制，完整系统访问	在容器/VM中运行，高级用户使用

新手建议选择“自动审查”模式，既省时又省心。

模型选择

Codex支持多种模型，在会话中可以随时切换：

/model gpt-5-codex    # 生产级代码模型，适合复杂任务
/model gpt-5-mini     # 快速轻量模型，适合简单任务

自2026年6月起，Codex还支持接入DeepSeek、Claude、Gemini等第三方模型。

基本对话操作

安装好之后，Codex的使用方式与其他AI工具类似——在对话框里输入内容即可开始交互：

适合处理简单的日常工作，如查资料、总结内容、规划方案
Codex会自动联网搜索最新信息并整理总结

文件与项目操作

Codex最强大的能力在于操作本地文件和项目：

点击左侧的项目入口，选择一个本地文件夹作为工作空间
Codex能够在这个范围内读取和操作文件
通过自然语言描述任务，Codex会自动执行

例如，你可以让Codex分析文件夹的空间占用情况，它会自动执行终端命令来扫描文件，分析每个文件的名称和大小，最后生成清晰的报告。

CLI常用命令

在终端中使用Codex CLI时，掌握以下命令可以显著提升效率：

codex                      # 进入交互式TUI（推荐日常使用）
codex "explain this codebase"  # 带初始提示直接启动
codex exec "fix the CI failure" # 非交互模式，适合脚本/CI集成

在交互式TUI中，以下快捷键非常实用：

快捷键	作用
Ctrl+C	取消当前操作（连按两次退出）
Ctrl+D	退出Codex
Ctrl+L	清屏
Ctrl+G	在外部编辑器打开当前prompt

四、Codex核心功能详解

代码生成与编辑

Codex的核心能力是通过自然语言理解与代码生成技术，将开发者描述的业务需求直接转化为可运行的代码。它支持Python、JavaScript、Go、Ruby等数十种编程语言。

与传统编程工具不同，Codex不需要用户掌握完整的语法规则，只需用自然语言描述需求即可自动生成对应代码。例如，输入“创建一个Excel表格，统计A列数据并生成柱状图”，系统可直接输出Python脚本或VBA宏代码。

代码库理解与解释

Codex能够快速理解陌生的代码库。你只需提供仓库地址或本地项目路径，Codex会自动分析源码，生成涵盖项目概述、技术栈、目录结构、核心模块、数据流、设计模式等的完整分析报告。

沙盒化执行

Codex在隔离的沙盒环境中运行代码，这对安全与测试至关重要。代理可以在不影响本机的前提下执行可能具有破坏性的脚本或复杂的迁移操作。

并行任务处理

通过Codex CLI或桌面应用，你可以同时委派多个彼此独立、跨度较长的任务。Codex支持并行任务执行，能够同时处理多项工作。

上下文压缩与记忆

针对长时程任务，Codex会动态压缩上下文窗口，以在不超出Token限制的情况下保持聚焦。Chronicle功能可让代理在不同会话之间延续有用的上下文、开发者偏好与架构经验。

Computer Use能力

Codex拥有三种“电脑操作能力”：Computer Use、Chrome插件、应用内浏览器。

Computer Use是其中最强大的模式——Codex能看屏幕、操作几乎任何图形界面，使用键盘、菜单、剪贴板与授权的App打交道。即使没有API的软件，Codex也能通过“看着屏幕，自己判断该点哪”来操作。

这三种操作模式对应不同的权限层级：

能用插件就不要点网页
能直接调用API就别让AI用识屏操作界面
Computer Use更像一个兜底方案，用于那些只有图形界面、没有接口的场景

Record and Replay功能

2026年6月18日，OpenAI在Codex应用程式中正式推出了“Record and Replay”功能。这项功能让用户可以直接在Mac上“做一次”给AI看，Codex会观察完成任务的所需操作与视窗内容，等用户停止录制后，将整个流程整理成一个可重复使用的技能（Skill）。

这不是传统的宏录制或RPA脚本。Record and Replay背后是Computer Use模型在观察操作，理解每个步骤的意图，然后生成一份结构化的、可编辑的技能文件。OpenAI官方将其核心价值概括为：“Show Codex a workflow once. Reuse it as a skill.”

生成的Skill遵循标准的SKILL.md格式，包含使用时机、所需输入、执行步骤和验证方式，用户可以直接查看和编辑。

智能体插件

2026年6月3日，Codex更新了智能体插件功能。用户可以在ChatGPT中获得全新的Agent插件体验，实现智能办公一体化。插件可以通过Codex lifecycle hooks、后台reviewer等机制，把一次会话中的有效经验沉淀为下一次会话可以直接使用的上下文。

五、Codex与主流AI编程工具对比

Codex vs GitHub Copilot

Codex与GitHub Copilot的关系非常密切——Copilot最初就是基于Codex模型构建的。但到2026年，两者已经演变成了两种不同维度的AI编程工具。

对比维度	OpenAI Codex	GitHub Copilot
类型	自主编码代理	AI结对编程助手
界面	CLI、桌面应用、网页界面	原生IDE集成、CLI、网页界面
模型选择	支持多模型（GPT、DeepSeek、Claude等）	多模型选择器
独特优势	沙盒化执行与并行任务处理	零摩擦的IDE工作流
最适用场景	异步任务委派与大规模重构	实时代码建议与心流式编码
定价	$20/月（Plus），$8/月入门方案	$10/月与$39/月（个人）

Copilot更像是写代码时的智能补全工具，而Codex更像一个能够真正参与开发的AI工程师。Codex在PR接受率方面表现优异，而Copilot的PR触发的人工和自动化审查讨论量最高。

Codex vs Cursor

到2026年，Codex和Cursor都具备完整的代理能力——接受任务、做出决策，并跨多个步骤执行。差异在于代理运行的位置以及需要投入多少监督。

对比维度	OpenAI Codex	Cursor
运行环境	云端沙盒	本地IDE
工作方式	自主执行任务	实时协作
安全默认值	更强	更灵活
并行任务	支持	支持
Token效率	约为Cursor的1/3	标准

Cursor更适合主动的、迭代式的功能开发；Codex更适合并行任务执行和自动化CI/CD管道。大多数开发者最终会同时使用两者。

Codex vs Claude Code

Codex CLI基于Rust构建，拥有极快的响应速度（240+ tokens/s，比Claude Code快约2.5倍），并且原生支持并行任务执行。从成本角度看，Codex在完成同等任务时消耗的Token大约是Claude Code的三分之一。

与Claude Code偏重生产级系统与复杂代码库的风格不同，Codex更像一把锋利的瑞士军刀——轻量、快速、灵活，特别适合快速原型开发。

六、Codex实战案例

案例一：磁盘空间分析与清理

这是一个适合初学者的入门案例：

在Codex中打开目标文件夹作为工作空间
输入提示：“帮我分析这个文件夹的空间占用情况，找出所有超过500MB的大文件，逐个分析，最后按大小排序列出来，并给出清理建议”
Codex会自动执行终端命令扫描文件，分析每个文件的名称和大小
生成清晰的报告，列出大文件占用空间并给出清理建议
可以进一步让Codex执行删除操作

案例二：代码库理解与重构

对于陌生的代码库，Codex能够快速上手：

在项目根目录启动Codex，输入：

Refactor this entire auth module for clarity, add proper error handling, and write missing tests. Keep the public API unchanged.

Codex会在几分钟内读完整个目录、分析依赖、提出diff，等待批准。

案例三：自动化工作流录制

使用Record and Replay功能，可以让Codex学会重复性工作流程：

在Codex应用中打开Plugins，选择“Record a skill”
Codex请求录制权限后，正常执行需要自动化的工作流程
停止录制后，Codex分析录影内容并自动生成Skill
后续只需在对话中调用该Skill，Codex即可自动完成整个流程

案例四：客服自动化

一个真实的案例是：OpenAI的工程师让Codex每5分钟检查一次客服聊天窗口，如果客服上线则改为每分钟检查一次，最终成功完成了退款申请。整个过程没有编写一行代码。

七、Codex高级应用

AGENTS.md配置

AGENTS.md是给Codex看的项目指导文件，让Codex在修改代码前了解仓库的工程约定：

项目如何启动
修改代码后要运行什么测试
哪些目录不能动

在Codex交互会话中，可以使用/init命令自动生成基础的AGENTS.md文件。每次新项目先运行/init，然后在AGENTS.md里定义编码风格、架构决策、TODO列表，Codex会持续参考它。

Skills创建与使用

Codex提供两种创建自定义技能的方式：

方法A：使用CLI创建器

启动Codex，输入$
选择Skill Creator
输入技能名称
输入主指令

方法B：手动创建
一个Skill就是一个文件夹，包含SKILL.md文件（包含名称、描述和指令）。生成的Skill遵循标准的SKILL.md格式。

模型切换与第三方模型接入

自2026年6月18日起，Codex全面支持接入任意第三方大语言模型。开发者可自主选用DeepSeek、Claude、Gemini等不同厂商的模型。

所有第三方模型接入必须符合新版Responses API的技术规范。只要目标模型及其服务提供商支持Chat Completions或Responses API标准，即可无缝集成至Codex体系。

中文交互配置

Codex支持中文交互模式：

在IDE插件设置中添加："language": "zh-CN"
CLI版本通过环境变量设置：export CODEX_LANG=zh-CN
可以自定义指令集，如“优化代码”对应“请用更高效的算法重构以下代码”

最佳实践

从小任务开始：先完成3个小任务闭环，熟悉AGENTS.md与review流程，再进阶到skills与subagents
明确任务边界：小范围、目标明确的任务里最稳定。明确给出目标文件、完成标准和约束条件，产出质量更高
建立“编辑+验证”闭环：Codex的高价值在于不只“改代码”，而是“改完并验证”。把Codex固定在read→plan→edit→test→review闭环里
把重复要求写进AGENTS.md：避免Codex“健忘”
不要只让Codex写代码，也要让它验证代码：让Codex运行测试、检查lint、构建验证
在项目根目录启动Codex：它会自动感知.git、package.json、requirements.txt等，上下文加载更聪明
大型单体仓库使用worktree或子目录启动：避免token过载

FAQ帮助文档

Q1：Codex和GitHub Copilot有什么区别？

Codex是自主编码代理，在云端沙盒中独立完成任务并提交拉取请求；GitHub Copilot是IDE中的实时辅助工具，在你编码时提供行内建议。两者解决不同的问题，可以配合使用。

Q2：Codex免费吗？

Codex提供有限的免费体验额度，但长期使用需要ChatGPT Plus（$20/月）、Pro（$100/月或$200/月）或更高套餐。2026年还推出了$8/月的入门方案。

Q3：Codex支持哪些编程语言？

Codex支持Python、JavaScript、Go、Ruby等数十种编程语言。

Q4：如何让Codex理解我的项目规范？

在项目根目录创建AGENTS.md文件，定义编码风格、架构决策、测试要求等。使用/init命令可以自动生成基础模板。

Q5：Codex能在Windows上使用吗？

可以。Codex桌面应用支持Windows，CLI版本建议通过WSL2使用。

Q6：Codex的Record and Replay功能是什么？

2026年6月推出的功能，让你在Mac上“做一次”给AI看，Codex会自动学习操作流程并生成可重复使用的技能。

Q7：Codex能使用非OpenAI的模型吗？

可以。自2026年6月18日起，Codex全面开放模型接入，支持DeepSeek、Claude、Gemini等任意第三方大语言模型。

Q8：Codex CLI和桌面应用有什么区别？

CLI适合终端和仓库为中心的开发工作流，路径最短；桌面应用提供更强的差分审查、worktree并行任务和后台任务能力。

Q9：Codex的安全性如何？

Codex在隔离的沙盒环境中运行，提供只读、工作区写入、完全访问三种权限模式。Computer Use等高级功能需要明确授权。

Q10：Codex适合编程新手吗？

适合。Codex的一大优势是无需掌握完整语法规则，用自然语言描述需求即可生成代码。搭配完整的可视化界面，操作一目了然。

你的AIGC知识价值，正在被看见！塔猴AI达人星火计划，发布课程，赢现金激励！点击加入活动：https://www.tahou.com/article/206587263682970629

以上内容不代表本平台立场，仅供读者参考