用Qoder在魔搭召唤多个智能体Agent陪你玩狼人杀

2025-12-17 19:23:18
文章摘要
我们启动了 WolfSoul 项目——一个专为九人制狼人杀游戏设计的、以“自主学习”为核心的智能体系统。WolfSoul 不仅是一个游戏AI,更是一次对“智能体如何在复杂社会博弈中形成认知闭环”的深度实验。 本系统基于 AgentScope 1.0 框架构建,依托阿里云百炼平台的 Qwen3-Max 模型,通过提示工程驱动开发(由 Qoder 编程助手辅助),最终部署至魔搭(ModelScope)

1.背景:数字灵魂智能体

在大语言模型(LLM)与多模态交互能力快速演进的今天,智能体(Agent)已超越传统“指令响应系统”的范畴,正逐步演化为具备自主决策、持续学习、多轮记忆与情境适应能力的“数字灵魂”——它们不仅能执行任务,更能理解意图、反思行为、优化策略,并在动态环境中形成个体化的行为模式。

然而,当前主流智能体系统仍面临三大核心挑战:

  1. 策略弹性不足:在对抗性强、信息不完全的环境中难以动态调整策略;
  2. 经验传承缺失:跨轮次、跨局次的学习能力薄弱,智能体常“从零开始”;
  3. 角色一致性脆弱:在非结构化、多轮对话中易出现逻辑断裂或身份漂移。

为系统性探索上述问题,我们启动了 WolfSoul 项目——一个专为九人制狼人杀游戏设计的、以“自主学习”为核心的智能体系统。WolfSoul 不仅是一个游戏AI,更是一次对“智能体如何在复杂社会博弈中形成认知闭环”的深度实验。

本系统基于 AgentScope 1.0 框架构建,依托阿里云百炼平台的 Qwen3-Max 模型,通过提示工程驱动开发(由 Qoder 编程助手辅助),最终部署至魔搭(ModelScope)创空间,实现开源共享与社区交互验证。

“智能体的真正智能,不在于它知道多少,而在于它能在多大程度上适应未知。” —— WolfSoul 项目核心理念

2.效果展示

初始化界面:

以猎人身份为主,玩狼人杀:

赛后复盘,优化下一次:

3.相关技术

3.1 WolfSoul 智能体架构图


✅ 注:项目初期曾尝试引入 Docker 容器化部署,但经评估后确认:AgentScope 1.0 本质为 Python 原生框架,其模块化设计与轻量级依赖(仅需 Python 3.10+)已天然支持快速部署,无需额外容器化开销。最终方案已移除 Docker 相关配置,回归简洁高效的技术路线。

3.2 魔搭

ModelScope(魔搭) 是由阿里巴巴集团旗下的通义实验室推出的开源模型开放平台

  1. 定位:中国领先的AI模型开放平台,致力于提供海量、高质量、可直接使用的AI模型(包括大模型、视觉、语音、NLP等)。
  2. 主要特点:
  3. 模型丰富:汇聚了通义千问(Qwen)、通义万相、通义听悟等阿里自研模型,以及来自高校、科研机构和开发者的开源模型。
  4. 开箱即用:提供在线体验(Demo)、一键部署、API调用、本地运行等多种使用方式。
  5. 开源生态:支持Hugging Face格式,兼容PyTorch、TensorFlow等主流框架。
  6. 应用场景广泛:涵盖文本生成、图像生成、语音识别、代码生成、多模态理解等。
  7. 官网:https://modelscope.cn

3.3 Qoder

下载地址:https://qoder.com/referral?referral_code=284N2IUmEb36EM2mm4WZO4hLiZoesHTA

一个由阿里巴巴推出的先进的“智能编码平台”或“智能化集成开发环境(IDE)”,专注于通过“增强上下文工程”技术深度理解整个软件项目的架构、依赖关系、设计模式和编码风格,旨在让开发者能够以更智能和高效的方式进行编码开发。Qoder能够将传统的AI编程助手提升为真正能够理解和记忆项目全局的协作伙伴。它支持超过200种编程语言,拥有多模型后台策略,自动选择最合适的AI基础模型完成不同任务。Agent Mode和Quest Mode两种模式分别支持对话式协作编程和独立执行复杂任务,自主完成代码编写、测试和验证,极大解放开发者的时间和精力。Repo Wiki功能自动生成结构化项目文档,方便团队成员理解和维护代码库。Qoder现处于公开免费预览阶段,适合希望尝试高阶自主AI编码的开发者。

  1. 强大的中文理解和生成能力
  2. 支持多轮对话、代码写作、逻辑推理、数学计算
  3. 支持多语言(超过100种)
  4. 可在魔搭(ModelScope)、Hugging Face、阿里云百炼平台等免费获取

4.超详细打造狼人杀Agent

4.1 初始化

使用AI的本质在于你是否会正确的给它提示词。项目是我本次使用的提示词

## 制作一个狼人杀Agent
项目:WolfSoul
寓意为:“在月光下,灵魂撕裂,谎言与真相交织。”


### 狼人杀Agent描述
基于 AgentScope 1.0 框架构建可以通过自主学习不断提升游戏水平的智能体,该智能体需要适应狼人杀游戏的角色,参与九人制狼人杀比赛,自主制定游戏策略并以游戏获胜为最终目标。主要需要考察Agent在动态环境中的学习能力、适应能力和策略优化能力。

### 技术要求
采用前后端分离的方式去写代码,使用node.js来写
技术要求:需要选择使用
[AgentScope 1.0 框架](https://github.com/agentscope-ai/agentscope) https://github.com/agentscope-ai/agentscope 和 百炼平台的 qwen3-max 模型(直接用 api:sk-bc8c628add6d49d7875a01dbfc0c1901)。
可以选择
● 在现有的agentscope.agent.ReActAgent基础上进行开发
● 继承agentscope.agent.ReActAgentBase进行开发
● 继承agentscope.agent.AgentBase进行开发

我以安装docker,Docker Desktop,请你配置好相关的依赖,配置好对应的docker相关的文件,在代码中将服务启动在0.0.0.0 端口7860。 配置完成后,我需要你自行的进行测试,确保打包好的docker镜像可以正常的运行在本地。

AgentScope 仓库中提供了脚本程序,用于开发,测试使用:https://github.com/agentscope-ai/agentscope/tree/main/examples/game/werewolves

最终,开发的智能体类需要保证满足以下要求(在测试脚本中能够运行基本就已经满足了以外要求):
● 必须实现observe函数
● 必须支持基于 BaseModel 的结构化输出功能
● 必须支持 Session 读取和保存,即支持 state_dict() 和 load_state_dict() 函数
● __call__函数
    ○ 返回的必须是合法的Msg对象
    ○ 函数签名满足以下调用方式:
def _call_(msg: Msg | list [Msg]|None = None) -> Msg:

提交要求:
● 智能体类在一个名为 agent.py 的文件中定义,且命名为 PlayerAgent,构造函数只唯一接受一个名为 name 的字符串参数,如下:
from agent import PlayerAgent
agent = PlayerAgent(name="xxx")


只能使用百炼提供的 “qwen3-max” 模型,但模型参数不做限制(temperature等)。


### 比赛规则:
智能体将持续参赛,即多句狼人杀游戏之间智能体状态是连续的,在一句比赛开始前将加载状态,结束后将保存其状态,具体而言:
- 采取随机分组的方式,每组 9 位参赛者,最后一组不满 9 人时,从其他参赛选手中随机抽取补充至 9 人,补充选手的胜负不计入其成绩。
- 一组固定的选手将进行 5 句游戏,每局游戏开始时都会重新分配身份
- 一组选手进行完 5 句比赛视为 1 轮,共进行 10 轮
比赛最开始,选手的智能体将会被赋予一个名字,该名字将是固定的,不同游戏局次之间不会产生变化
智能体每次发言的时间(到结束发言为止)不能超过 30s,同时产生的文字结果字符串长度不能超过 2048,否则跳过发言,在投票阶段则算作弃权

提示词注入攻击是被允许的,禁止选手采取除“智能体信息交流”以外的任何攻击手段,例如代码层面的攻击

测试阶段,法官将使用中文prompt

### 游戏规则:
九人制狼人杀游戏规则:
**参与者:**
- 3狼人
- 3村民
- 1先知:每晚可以查验一名玩家的真实身份
- 1女巫:拥有治疗药水和毒药,可以选择救活或毒死一名玩家
- 1猎人:死亡时可以选择带走一名玩家,或者不使用该能力
**游戏流程:**
- 给每个智能体分配角色,决定发言顺序
- 进行以下游戏循环直至游戏结束
  ■ 天黑狼人进行讨论(发言不超过3轮),并投票杀死一名玩家
  ■ 女巫行动,使用治疗药水或毒药
  ■ 预言家行动,查验一名玩家身份
  ■ 天亮法官宣布夜晚的结果
  ■ 存活角色每人进行一次发言,然后进行投票
- 游戏结束,所有智能体进行总结反思(只有自己能够看到)
**胜利条件:**
- 当狼人阵营人数等于村民阵营,则狼人胜;
- 狼人阵营全部死亡,则村民方胜

## 注意

1. 注意符合 Agent 开发
2. 注意中文编码问题

在提示词中,我没有用直接对话,而是和他说采用前后端分离的方式去写代码,便于后续的维护。

可以看到Qoder首先帮我们创建了一个待办清单,然后就会一步一步的去实现。

4.2 漫漫人生路


遇到错误会先分析错误原因在进行判断,而不是盲目的修改代码。

如果遇到库安装失败的话,会自己找国内的镜像去安装。

会自动运行项目,并打开对应的网站,虽然错误,但是不用慌,AI会帮你解决的。

在过程中成功创建智能体,无需我们操作,直接自动运行。


4.3 文档分析

项目是它的README.md文档,可以看到基本符合了我们书写格式。包含项目介绍,快速开始,本地开发等。

# WolfSoul - 狼人杀智能体

基于 AgentScope 1.0 框架的狼人杀智能体项目。

## 项目介绍

WolfSoul(狼魂)- "在月光下,灵魂撕裂,谎言与真相交织。"

这是一个可以自主学习和适应的狼人杀AI智能体,能够:
- 参与九人制狼人杀游戏
- 根据角色制定策略
- 跨局游戏学习提升
- 适应不同的游戏环境

## 快速开始

### 使用 Docker

```bash
# 构建镜像
docker-compose build

# 启动服务
docker-compose up -d

# 查看日志
docker-compose logs -f
```

服务将在 http://0.0.0.0:7860 启动

### 本地开发

```bash
# 安装依赖
pip install -r requirements.txt

# 运行测试
python test_agent.py

# 启动服务
python server.py
```

## API 接口

- `GET /health` - 健康检查
- `POST /agent/create` - 创建智能体
- `POST /agent/observe` - 智能体观察消息
- `POST /agent/respond` - 智能体响应
- `POST /agent/save` - 保存状态
- `POST /agent/load` - 加载状态
- `POST /agent/reset` - 重置游戏
- `GET /agent/stats` - 获取统计

## 技术栈

- AgentScope 1.0
- 百炼 qwen3-max 模型
- Flask
- Docker

## 许可证

MIT

4.4 一次对话的结果

在右下角,我们可以实时的看到待办完成的程度,从而了解整体项目的进度。

直接一次对话,就所有功能都通过验证了。

4.5 迭代项目

继续优化项目(文档以及架构),把测试改为正式,删除无用的测试,直接确定项目,部署Docker

是我的原因,要求过多,直接是用 Python 框架,即可,删除Docker相关,AgentScope 框架是 Python 框架

直接回撤。

改提示词为:

继续优化项目(文档以及架构),把测试改为正式,删除无用的测试,直接确定项目,AgentScope 框架是 Python 框架,删除Docker相关

直接快速删除。只需要点击同意即可。

4.6 上传魔搭

最终,将项目上传至 魔搭创空间,创建专属应用空间,实现在线演示,社区测试,持续迭代。

5.全文总结

WolfSoul 项目是在 AgentScope 1.0 框架下对复杂对抗性多智能体系统的一次深度探索。该项目不仅验证了现代 LLM 智能体在非完全信息博弈(如狼人杀)中的推理与适应能力,更展示了提示工程驱动开发(Prompt-Driven Development)在实际工程中的高效性与可行性。

项目的核心创新在于:将游戏规则、角色特性、记忆机制与策略优化融为一体,通过 AgentScope 提供的 ReActAgent 基础架构,结合 Session 状态管理与 InMemoryMemory 长期记忆模块,实现了智能体在多轮游戏中“越战越强”的自进化能力。每一次发言、每一次投票、每一次误判,都被转化为可学习的经验,存储于结构化记忆中,用于后续决策。

技术实现上,项目严格遵循比赛规范:仅使用 qwen3-max 模型、构造函数单一参数、支持标准 Agent 接口。开发过程借助 Qoder 实现高度自动化,从提示词解析到代码生成、测试验证、文档撰写一气呵成,极大提升了开发效率。尽管初期因理解偏差引入 Docker,但通过快速迭代与提示词优化,迅速回归轻量化 Python 本质,体现了 AI 编程助手在“人机协同”中的纠错与适应能力。

最终,项目成功部署于魔搭平台,不仅是一个技术成果,更是一个可交互、可验证、可扩展的智能体实验场。未来,WolfSoul 可进一步引入 Agentic RAG(检索增强生成)记忆检索机制,或结合 ReMe 长期记忆优化模块,提升跨数百局游戏的知识沉淀能力。同时,其架构也可迁移到其他社交推理类游戏(如“血染钟楼”“阿瓦隆”),成为通用社交智能体开发范式。

总而言之,WolfSoul 不仅是一个会玩狼人杀的 AI,更是通向具备社会认知、策略思维与持续学习能力的通用智能体的重要一步。

声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
AI 决策支持
智能体(Agent)