用Qoder在魔搭召唤多个智能体Agent陪你玩狼人杀

2025-12-18 09:14:49

AI 决策支持

智能体（Agent）

文章摘要

我们启动了 WolfSoul 项目——一个专为九人制狼人杀游戏设计的、以“自主学习”为核心的智能体系统。WolfSoul 不仅是一个游戏AI，更是一次对“智能体如何在复杂社会博弈中形成认知闭环”的深度实验。本系统基于 AgentScope 1.0 框架构建，依托阿里云百炼平台的 Qwen3-Max 模型，通过提示工程驱动开发（由 Qoder 编程助手辅助），最终部署至魔搭（ModelScope）

1.背景：数字灵魂智能体

在大语言模型（LLM）与多模态交互能力快速演进的今天，智能体（Agent）已超越传统“指令响应系统”的范畴，正逐步演化为具备自主决策、持续学习、多轮记忆与情境适应能力的“数字灵魂”——它们不仅能执行任务，更能理解意图、反思行为、优化策略，并在动态环境中形成个体化的行为模式。

然而，当前主流智能体系统仍面临三大核心挑战：

策略弹性不足：在对抗性强、信息不完全的环境中难以动态调整策略；
经验传承缺失：跨轮次、跨局次的学习能力薄弱，智能体常“从零开始”；
角色一致性脆弱：在非结构化、多轮对话中易出现逻辑断裂或身份漂移。

为系统性探索上述问题，我们启动了 WolfSoul 项目——一个专为九人制狼人杀游戏设计的、以“自主学习”为核心的智能体系统。WolfSoul 不仅是一个游戏AI，更是一次对“智能体如何在复杂社会博弈中形成认知闭环”的深度实验。

本系统基于 AgentScope 1.0 框架构建，依托阿里云百炼平台的 Qwen3-Max 模型，通过提示工程驱动开发（由 Qoder 编程助手辅助），最终部署至魔搭（ModelScope）创空间，实现开源共享与社区交互验证。

“智能体的真正智能，不在于它知道多少，而在于它能在多大程度上适应未知。” —— WolfSoul 项目核心理念

2.效果展示

初始化界面：

以猎人身份为主，玩狼人杀：

赛后复盘，优化下一次：

3.相关技术

3.1 WolfSoul 智能体架构图

✅ 注：项目初期曾尝试引入 Docker 容器化部署，但经评估后确认：AgentScope 1.0 本质为 Python 原生框架，其模块化设计与轻量级依赖（仅需 Python 3.10+）已天然支持快速部署，无需额外容器化开销。最终方案已移除 Docker 相关配置，回归简洁高效的技术路线。

3.2 魔搭

ModelScope（魔搭）是由阿里巴巴集团旗下的通义实验室推出的开源模型开放平台

定位：中国领先的AI模型开放平台，致力于提供海量、高质量、可直接使用的AI模型（包括大模型、视觉、语音、NLP等）。
主要特点：
模型丰富：汇聚了通义千问（Qwen）、通义万相、通义听悟等阿里自研模型，以及来自高校、科研机构和开发者的开源模型。
开箱即用：提供在线体验（Demo）、一键部署、API调用、本地运行等多种使用方式。
开源生态：支持Hugging Face格式，兼容PyTorch、TensorFlow等主流框架。
应用场景广泛：涵盖文本生成、图像生成、语音识别、代码生成、多模态理解等。
官网：https://modelscope.cn

3.3 Qoder

下载地址：https://qoder.com/referral?referral_code=284N2IUmEb36EM2mm4WZO4hLiZoesHTA

一个由阿里巴巴推出的先进的“智能编码平台”或“智能化集成开发环境（IDE）”，专注于通过“增强上下文工程”技术深度理解整个软件项目的架构、依赖关系、设计模式和编码风格，旨在让开发者能够以更智能和高效的方式进行编码开发。Qoder能够将传统的AI编程助手提升为真正能够理解和记忆项目全局的协作伙伴。它支持超过200种编程语言，拥有多模型后台策略，自动选择最合适的AI基础模型完成不同任务。Agent Mode和Quest Mode两种模式分别支持对话式协作编程和独立执行复杂任务，自主完成代码编写、测试和验证，极大解放开发者的时间和精力。Repo Wiki功能自动生成结构化项目文档，方便团队成员理解和维护代码库。Qoder现处于公开免费预览阶段，适合希望尝试高阶自主AI编码的开发者。

强大的中文理解和生成能力
支持多轮对话、代码写作、逻辑推理、数学计算
支持多语言（超过100种）
可在魔搭（ModelScope）、Hugging Face、阿里云百炼平台等免费获取

4.超详细打造狼人杀Agent

4.1 初始化

使用AI的本质在于你是否会正确的给它提示词。项目是我本次使用的提示词

## 制作一个狼人杀Agent

项目：WolfSoul

寓意为：“在月光下，灵魂撕裂，谎言与真相交织。”

### 狼人杀Agent描述

基于 AgentScope 1.0 框架构建可以通过自主学习不断提升游戏水平的智能体，该智能体需要适应狼人杀游戏的角色，参与九人制狼人杀比赛，自主制定游戏策略并以游戏获胜为最终目标。主要需要考察Agent在动态环境中的学习能力、适应能力和策略优化能力。

### 技术要求

采用前后端分离的方式去写代码，使用node.js来写

技术要求：需要选择使用

[AgentScope 1.0 框架](https://github.com/agentscope-ai/agentscope) https://github.com/agentscope-ai/agentscope 和百炼平台的 qwen3-max 模型(直接用 api:sk-bc8c628add6d49d7875a01dbfc0c1901)。

可以选择

● 在现有的agentscope.agent.ReActAgent基础上进行开发

● 继承agentscope.agent.ReActAgentBase进行开发

● 继承agentscope.agent.AgentBase进行开发

我以安装docker，Docker Desktop，请你配置好相关的依赖，配置好对应的docker相关的文件，在代码中将服务启动在0.0.0.0 端口7860。配置完成后，我需要你自行的进行测试，确保打包好的docker镜像可以正常的运行在本地。

AgentScope 仓库中提供了脚本程序，用于开发，测试使用：https://github.com/agentscope-ai/agentscope/tree/main/examples/game/werewolves

最终，开发的智能体类需要保证满足以下要求（在测试脚本中能够运行基本就已经满足了以外要求）：

● 必须实现observe函数

● 必须支持基于 BaseModel 的结构化输出功能

● 必须支持 Session 读取和保存，即支持 state_dict() 和 load_state_dict() 函数

● __call__函数

○ 返回的必须是合法的Msg对象

○ 函数签名满足以下调用方式：

def _call_(msg: Msg | list [Msg]|None = None) -> Msg:

提交要求：

● 智能体类在一个名为 agent.py 的文件中定义，且命名为 PlayerAgent，构造函数只唯一接受一个名为 name 的字符串参数，如下：

from agent import PlayerAgent

agent = PlayerAgent(name="xxx")

只能使用百炼提供的 “qwen3-max” 模型，但模型参数不做限制（temperature等）。

### 比赛规则：

智能体将持续参赛，即多句狼人杀游戏之间智能体状态是连续的，在一句比赛开始前将加载状态，结束后将保存其状态，具体而言：

- 采取随机分组的方式，每组 9 位参赛者，最后一组不满 9 人时，从其他参赛选手中随机抽取补充至 9 人，补充选手的胜负不计入其成绩。

- 一组固定的选手将进行 5 句游戏，每局游戏开始时都会重新分配身份

- 一组选手进行完 5 句比赛视为 1 轮，共进行 10 轮

比赛最开始，选手的智能体将会被赋予一个名字，该名字将是固定的，不同游戏局次之间不会产生变化

智能体每次发言的时间（到结束发言为止）不能超过 30s，同时产生的文字结果字符串长度不能超过 2048，否则跳过发言，在投票阶段则算作弃权

提示词注入攻击是被允许的，禁止选手采取除“智能体信息交流”以外的任何攻击手段，例如代码层面的攻击

测试阶段，法官将使用中文prompt

### 游戏规则：

九人制狼人杀游戏规则：

**参与者：**

- 3狼人

- 3村民

- 1先知：每晚可以查验一名玩家的真实身份

- 1女巫：拥有治疗药水和毒药，可以选择救活或毒死一名玩家

- 1猎人：死亡时可以选择带走一名玩家，或者不使用该能力

**游戏流程：**

- 给每个智能体分配角色，决定发言顺序

- 进行以下游戏循环直至游戏结束

■ 天黑狼人进行讨论（发言不超过3轮），并投票杀死一名玩家

■ 女巫行动，使用治疗药水或毒药

■ 预言家行动，查验一名玩家身份

■ 天亮法官宣布夜晚的结果

■ 存活角色每人进行一次发言，然后进行投票

- 游戏结束，所有智能体进行总结反思（只有自己能够看到）

**胜利条件：**

- 当狼人阵营人数等于村民阵营，则狼人胜；

- 狼人阵营全部死亡，则村民方胜

## 注意

1. 注意符合 Agent 开发

2. 注意中文编码问题

在提示词中，我没有用直接对话，而是和他说采用前后端分离的方式去写代码，便于后续的维护。

可以看到Qoder首先帮我们创建了一个待办清单，然后就会一步一步的去实现。

4.2 漫漫人生路

遇到错误会先分析错误原因在进行判断，而不是盲目的修改代码。

如果遇到库安装失败的话，会自己找国内的镜像去安装。

会自动运行项目，并打开对应的网站，虽然错误，但是不用慌，AI会帮你解决的。

在过程中成功创建智能体，无需我们操作，直接自动运行。

4.3 文档分析

项目是它的README.md文档，可以看到基本符合了我们书写格式。包含项目介绍，快速开始，本地开发等。

# WolfSoul - 狼人杀智能体

基于 AgentScope 1.0 框架的狼人杀智能体项目。

## 项目介绍

WolfSoul（狼魂）- "在月光下，灵魂撕裂，谎言与真相交织。"

这是一个可以自主学习和适应的狼人杀AI智能体，能够：

- 参与九人制狼人杀游戏

- 根据角色制定策略

- 跨局游戏学习提升

- 适应不同的游戏环境

## 快速开始

### 使用 Docker

```bash

# 构建镜像

docker-compose build

# 启动服务

docker-compose up -d

# 查看日志

docker-compose logs -f

```

服务将在 http://0.0.0.0:7860 启动

### 本地开发

```bash

# 安装依赖

pip install -r requirements.txt

# 运行测试

python test_agent.py

# 启动服务

python server.py

```

## API 接口

- `GET /health` - 健康检查

- `POST /agent/create` - 创建智能体

- `POST /agent/observe` - 智能体观察消息

- `POST /agent/respond` - 智能体响应

- `POST /agent/save` - 保存状态

- `POST /agent/load` - 加载状态

- `POST /agent/reset` - 重置游戏

- `GET /agent/stats` - 获取统计

## 技术栈

- AgentScope 1.0

- 百炼 qwen3-max 模型

- Flask

- Docker

## 许可证

MIT

4.4 一次对话的结果

在右下角，我们可以实时的看到待办完成的程度，从而了解整体项目的进度。

直接一次对话，就所有功能都通过验证了。

4.5 迭代项目

继续优化项目（文档以及架构），把测试改为正式，删除无用的测试，直接确定项目，部署Docker

是我的原因，要求过多，直接是用 Python 框架，即可，删除Docker相关，AgentScope 框架是 Python 框架

直接回撤。

改提示词为：

继续优化项目（文档以及架构），把测试改为正式，删除无用的测试，直接确定项目，AgentScope 框架是 Python 框架，删除Docker相关

直接快速删除。只需要点击同意即可。

4.6 上传魔搭

最终，将项目上传至魔搭创空间，创建专属应用空间，实现在线演示，社区测试，持续迭代。

5.全文总结

WolfSoul 项目是在 AgentScope 1.0 框架下对复杂对抗性多智能体系统的一次深度探索。该项目不仅验证了现代 LLM 智能体在非完全信息博弈（如狼人杀）中的推理与适应能力，更展示了提示工程驱动开发（Prompt-Driven Development）在实际工程中的高效性与可行性。

项目的核心创新在于：将游戏规则、角色特性、记忆机制与策略优化融为一体，通过 AgentScope 提供的 ReActAgent 基础架构，结合 Session 状态管理与 InMemoryMemory 长期记忆模块，实现了智能体在多轮游戏中“越战越强”的自进化能力。每一次发言、每一次投票、每一次误判，都被转化为可学习的经验，存储于结构化记忆中，用于后续决策。

技术实现上，项目严格遵循比赛规范：仅使用 qwen3-max 模型、构造函数单一参数、支持标准 Agent 接口。开发过程借助 Qoder 实现高度自动化，从提示词解析到代码生成、测试验证、文档撰写一气呵成，极大提升了开发效率。尽管初期因理解偏差引入 Docker，但通过快速迭代与提示词优化，迅速回归轻量化 Python 本质，体现了 AI 编程助手在“人机协同”中的纠错与适应能力。

最终，项目成功部署于魔搭平台，不仅是一个技术成果，更是一个可交互、可验证、可扩展的智能体实验场。未来，WolfSoul 可进一步引入 Agentic RAG（检索增强生成）记忆检索机制，或结合 ReMe 长期记忆优化模块，提升跨数百局游戏的知识沉淀能力。同时，其架构也可迁移到其他社交推理类游戏（如“血染钟楼”“阿瓦隆”），成为通用社交智能体开发范式。

总而言之，WolfSoul 不仅是一个会玩狼人杀的 AI，更是通向具备社会认知、策略思维与持续学习能力的通用智能体的重要一步。

以上内容不代表本平台立场，仅供读者参考