NagaAgent

娜迦本地智能体，基于多智能体与多MCP兼容架构的通用型 AI 助手

Stars: 899

Visit

README:

NagaAgent 3.1

快速入门视频：https://www.pylindex.top/naga/intro.mp4

🐍 智能对话助手 | 多平台支持 | 丰富生态 | 易于扩展

功能特性 • 快速开始 • 安装指南 • API文档 • 配置说明 • 更新日志 • 更新历史

🎯 项目亮点

✅ 🧠 智能记忆: 基于 Neo4j 的 GRAG 知识图谱记忆系统
✅ 🔧 丰富生态: 支持多种 MCP 服务和 Agent 系统
✅ 🎤 语音交互: OpenAI 兼容的流式语音合成服务
✅ 🖥️ 现代界面: 基于 PyQt5 的独立对话框消息渲染系统
✅ 🎭 Live2D集成: 独立的Live2D模块，支持模型和图片的混合侧栏显示
✅ 🌐 完整 API: FastAPI RESTful API 和流式输出
✅ 📱 系统托盘: 完整的后台运行和自启动支持
✅ 🔍 智能代理: 动态服务发现和热插拔管理
✅ 🛡️ 安全可靠: 会话隔离和权限管理
✅ 🤖 多Agent协作: AgentManager 独立系统支持多Agent协作
✅ 🌳 深度思考: 基于遗传算法的多分支思考引擎
✅ 🔄 配置热更新: 实时配置变更，无需重启应用
✅ 💾 持久化上下文: 重启后自动恢复历史对话上下文
✅ 🔧 系统检测: 内置完整的系统环境检测和依赖验证功能

🚀 快速开始

📋 系统要求

操作系统: Windows 10/11, macOS 10.15+, Linux
Python: 3.10+ (推荐 3.11)
内存: 建议 4GB 以上
存储: 建议 2GB 以上可用空间

🔧 一键安装

Windows 用户

# 克隆项目
git clone https://github.com/Xxiii8322766509/NagaAgent.git
cd NagaAgent

# 一键配置
.\setup.ps1

macOS 用户

# 克隆项目
git clone https://github.com/Xxiii8322766509/NagaAgent.git
cd NagaAgent

# 一键配置
chmod +x setup_mac.sh
./setup_mac.sh

Linux 用户

# 克隆项目
git clone https://github.com/Xxiii8322766509/NagaAgent.git
cd NagaAgent

# 创建虚拟环境
python3 -m venv .venv
source .venv/bin/activate

# 安装依赖
pip install -r requirements.txt

🗄️ 启动 Neo4j 服务

# 启动 Neo4j 容器
docker run -d \
  --restart always \
  --publish=7474:7474 \
  --publish=7687:7687 \
  --env NEO4J_AUTH=neo4j/your_password \
  --volume=neo4j_data:/data \
  neo4j:latest

端口冲突解决: 如果端口被占用，可以使用其他端口：
--publish=8474:7474 --publish=8687:7687

⚙️ 配置文件

复制配置模板：
```
cp config.json.example config.json
```
编辑配置文件，设置API密钥和其他参数

🚀 启动应用

Windows 启动方式

# 普通模式
.\start.bat

# 托盘模式 (推荐)
.\start_with_tray.bat

macOS 启动方式

./start_mac.sh

Linux 启动方式

./start.sh

启动后将自动开启：

🖥️ PyQt5 图形界面
🌐 RESTful API 服务器
🎤 语音交互服务
🧠 GRAG 知识图谱记忆系统
🔄 配置热更新系统

📁 项目结构

NagaAgent 3.1 采用模块化架构设计，各功能模块独立且可扩展：

NagaAgent/
├── 📁 apiserver/              # API服务器模块
│   ├── api_server.py          # FastAPI服务器
│   ├── streaming_tool_extractor.py  # 流式工具调用提取器
│   └── tool_call_utils.py     # 工具调用工具类
├── 📁 system/                 # 系统核心模块
│   ├── system_checker.py      # 系统环境检测器
│   ├── config_manager.py      # 配置管理器
│   └── conversation_core.py   # 对话核心引擎
├── 📁 ui/                     # 用户界面模块
│   ├── live2d/                # Live2D集成模块
│   │   ├── renderer.py        # Live2D渲染器
│   │   ├── animator.py        # 动画系统
│   │   └── widget.py          # Live2D组件
│   ├── live2d_side_widget.py  # Live2D侧栏容器
│   ├── pyqt_chat_window.py    # 主聊天窗口
│   └── message_renderer.py    # 消息渲染器
├── 📁 voice/                  # 语音处理模块
│   ├── input/                 # 语音输入服务
│   │   ├── server.py          # ASR服务器
│   │   ├── vad_worker.py      # VAD端点检测
│   │   └── asr_client.py      # ASR客户端
│   └── output/                # 语音输出服务
│       ├── tts_handler.py     # TTS处理器
│       └── voice_integration.py # 语音集成
├── 📁 mcpserver/              # MCP服务模块
│   ├── agent_manager.py       # Agent管理器
│   ├── agent_*/               # 各种Agent服务
│   └── mcp_manager.py         # MCP管理器
├── 📁 thinking/               # 思考引擎模块
│   ├── tree_thinking.py       # 树形思考引擎
│   ├── genetic_pruning.py     # 遗传算法剪枝
│   └── thinking_node.py       # 思考节点
├── 📁 summer_memory/          # 记忆系统模块
│   ├── memory_manager.py      # 记忆管理器
│   ├── quintuple_extractor.py # 五元组提取器
│   └── graph.py               # 图数据库操作
├── 📁 logs/                   # 日志和存储
│   ├── knowledge_graph/       # 知识图谱数据
│   └── prompts/               # 提示词存储
├── 📁 mqtt_tool/              # MQTT通信工具
├── 📁 ui/tray/                # 系统托盘模块
└── 📄 main.py                 # 主程序入口

核心模块说明：

system/: 系统核心功能，包括环境检测、配置管理、对话引擎
ui/: 用户界面，支持Live2D、PyQt5、系统托盘等
voice/: 语音处理，分离输入/输出，支持ASR和TTS
mcpserver/: MCP服务生态，支持多种Agent和工具
thinking/: 智能思考引擎，支持多分支推理
summer_memory/: 知识图谱记忆系统，基于Neo4j

🛠️ 详细安装指南

🔍 系统环境检测

NagaAgent 3.1 内置了完整的系统环境检测功能，自动检测Python版本、虚拟环境、依赖包等：

# 运行系统环境检测
python -c "from system.system_checker import SystemChecker; SystemChecker().check_all()"

# 或者通过主程序自动检测
python main.py --check-env

检测项目包括：

✅ Python版本兼容性检查
✅ 虚拟环境状态检测
✅ 核心依赖包完整性验证
✅ 可选依赖包可用性检查
✅ 配置文件格式验证
✅ 目录结构完整性检查
✅ 文件权限和访问性测试
✅ 系统资源使用情况监控

📦 依赖说明

项目依赖主要包括：

类别	依赖包	用途
核心框架	`openai`, `mcp`, `fastapi`	AI对话和API服务
搜索工具	`langchain-community`	SearXNG搜索集成
GUI界面	`PyQt5`, `pygame`	图形用户界面
语音处理	`edge-tts`, `pyaudio`, `sounddevice`	语音合成和识别
知识图谱	`py2neo`, `pyvis`, `matplotlib`	Neo4j图数据库操作
浏览器自动化	`playwright`	网页操作自动化
MCP工具	`jmcomic`, `fastmcp`	多种扩展工具
系统控制	`pycaw`, `screen-brightness-control`	系统功能控制
通信协议	`paho-mqtt`, `websockets`	MQTT和WebSocket通信
数据处理	`numpy`, `pandas`, `scikit-learn`	数据处理和机器学习
文档处理	`python-docx`	Word文档处理

⚠️ 常见问题解决

Windows 安装问题

C++ 编译工具缺失：

# 下载并安装 Microsoft Visual C++ Build Tools
# https://visualstudio.microsoft.com/visual-cpp-build-tools/

Numpy 警告并且程序崩溃：

# 安装 Visual Studio 后，在 Developer Command Prompt 中执行
uv pip uninstall numpy
uv sync --no-cache --reinstall

权限问题：

# 以管理员身份运行 PowerShell
Set-ExecutionPolicy RemoteSigned -Scope CurrentUser

macOS 安装问题

Python 版本过低：

brew install [email protected]
echo 'export PATH="/usr/local/opt/[email protected]/bin:$PATH"' >> ~/.zshrc

PyAudio 安装失败：

brew install portaudio
pip install pyaudio

权限问题：

chmod +x *.sh

Linux 安装问题

系统依赖：

# Ubuntu/Debian
sudo apt update
sudo apt install python3-dev portaudio19-dev

# CentOS/RHEL
sudo yum install python3-devel portaudio-devel

Docker 权限：

sudo usermod -aG docker $USER
newgrp docker

⚙️ 配置说明

🔄 配置热更新系统

NagaAgent 3.1 引入了强大的配置热更新系统，支持实时配置变更而无需重启应用。

核心特性

实时更新: 配置变更立即生效，无需重启
配置快照: 支持配置的保存和恢复
自动监视: 自动检测配置文件变化
模块重载: 支持动态模块重新加载
错误处理: 完善的异常处理机制

使用方法

from config_manager import update_config, get_config_snapshot

# 更新配置
success = update_config({
    "system": {"debug": True},
    "api": {"temperature": 0.8}
})

# 获取配置快照
snapshot = get_config_snapshot()

# 恢复配置
restore_config_snapshot(snapshot)

详细文档

📖 配置热更新使用指南
📊 配置热更新测试报告

API 配置

修改 config.json 文件中的 api 部分：

{
  "api": {
    "api_key": "your-api-key-here",
    "base_url": "https://api.deepseek.com/v1",
    "model": "deepseek-chat",
    "temperature": 0.7,
    "max_tokens": 10000,
    "max_history_rounds": 10,
    "persistent_context": true,
    "context_load_days": 3,
    "context_parse_logs": true
  }
}

持久化上下文配置说明

persistent_context: 是否启用持久化上下文功能（默认：true）
context_load_days: 从最近几天的日志文件中加载历史对话（默认：3天）
context_parse_logs: 是否从日志文件解析上下文（默认：true）

前端历史记录显示: 启用持久化上下文后，重启应用时前端UI会自动加载并显示历史聊天记录，无需手动操作。

API服务器配置

{
  "api_server": {
    "enabled": true,
    "host": "127.0.0.1",
    "port": 8000,
    "auto_start": true,
    "docs_enabled": true
  }
}

在线搜索配置

{
  "online_search": {
    "searxng_url": "https://searxng.pylindex.top",
    "engines": ["google"],
    "num_results": 5
  }
}

GRAG知识图谱记忆系统配置

{
  "grag": {
    "enabled": true,
    "auto_extract": true,
    "context_length": 5,
    "similarity_threshold": 0.6,
    "neo4j_uri": "neo4j://127.0.0.1:7687",
    "neo4j_user": "neo4j",
    "neo4j_password": "your_password",
    "neo4j_database": "neo4j"
  }
}

Live2D集成配置

{
  "live2d": {
    "enabled": true,
    "model_path": "path/to/your/model.model3.json",
    "fallback_image": "ui/standby.png"
  }
}

Live2D模块特性

独立模块设计: 不依赖外部Live2D项目，完全自主实现
完整动画系统: 支持眨眼、眼球跟踪、身体摆动、呼吸、情绪等动画
自动回退机制: Live2D不可用时自动切换到图片模式
鼠标交互: 支持点击触发动作和眼球跟踪
资源管理: 完整的资源加载和清理机制

Live2D模块结构

ui/live2d/
├── __init__.py          # 模块初始化
├── renderer.py          # Live2D渲染器
├── animator.py          # 动画系统
├── widget.py            # Live2D Widget组件
└── README.md            # 详细文档

Live2D配置说明

enabled: 是否启用Live2D功能
model_path: Live2D模型文件路径（.model3.json格式）
fallback_image: 回退图片路径（Live2D不可用时使用）

获取 API 密钥

访问对应的LLM服务商官网（如DeepSeek、OpenAI等）
注册账号并创建 API 密钥
将密钥填入 config.json 文件的 api.api_key 字段

🌟 核心功能

🧠 智能对话系统

多模型支持: 兼容 OpenAI、DeepSeek、Anthropic 等主流 LLM 提供商
上下文记忆: 智能维护对话历史，支持多轮对话上下文
流式输出: 实时显示 AI 回复，提升交互体验
工具调用: 自动解析和执行 LLM 返回的工具调用指令
深度思考: 基于遗传算法的多分支思考引擎，提供更高质量的回答

🔍 在线搜索系统

SearXNG集成: 基于 SearXNG 的隐私保护搜索引擎
多引擎支持: 支持Google、Bing等多种搜索引擎
智能结果处理: 自动格式化搜索结果，提供AI友好的信息展示
灵活配置: 可配置搜索引擎列表、结果数量等参数

🔄 配置热更新系统

实时配置更新: 配置变更立即生效，无需重启应用
配置变更通知: 完善的监听器机制，支持配置变更回调
模块重新加载: 支持动态模块管理和热插拔
配置监视器: 自动文件变化检测和重新加载
配置快照: 安全的配置保存和恢复功能
错误处理: 完善的异常处理机制，确保系统稳定性

🔧 MCP 服务生态

动态服务发现: 自动扫描和注册所有 MCP 服务
即插即用: 新增服务无需重启系统
服务管理: 统一的服务池查询和管理接口
多服务协作: 支持多个 Agent 协同工作

🗺️ GRAG 知识图谱

五元组提取: 自动从对话中提取实体-关系-属性
智能检索: 基于相似度的上下文召回机制
可视化展示: 支持知识图谱的可视化展示
历史导入: 兼容旧版对话记录的批量导入

🎤 语音交互系统

流式合成: 基于 Edge-TTS 的实时语音合成
智能分句: 自动识别句子边界，优化播放体验
异步处理: 文本显示和音频播放完全分离
多引擎支持: 兼容多种 TTS 引擎

🖥️ 用户界面

现代化 GUI: 基于 PyQt5 的精美图形界面
独立对话框: 每个对话都是独立的对话框组件，采用直角设计，支持自动高度调整
工具调用对话框: 专门为工具调用设计的对话框，没有用户名标签，保持简洁的UI风格
透明背景: 主聊天区域使用透明背景，对话框保持原有样式
🎭 Live2D集成: 独立的Live2D模块，支持模型和图片的混合侧栏显示，自动回退机制
Markdown 支持: 完整的 Markdown 语法支持和代码高亮
主题定制: 支持界面主题、透明度等自定义
响应式设计: 自适应不同屏幕尺寸
流式更新: 实时流式消息更新和自动滚动

🌐 API 服务

RESTful API: 完整的 HTTP API 接口
流式支持: Server-Sent Events 流式输出
自动文档: 交互式 API 文档 (Swagger)
跨域支持: 完整的 CORS 配置

📱 系统托盘

后台运行: 支持最小化到系统托盘
自动隐藏: 启动后自动隐藏控制台窗口
快捷操作: 托盘图标右键菜单
自启动: 支持注册表方式的自启动功能

🔍 智能 Agent 系统

AgentManager: 独立的 Agent 注册和调用系统
配置管理: 统一的 Agent 配置和动态加载
会话隔离: 多用户会话完全隔离和TTL管理
占位符替换: 支持Agent配置、环境变量、时间信息等占位符
生命周期管理: 完整的 Agent 生命周期管理和热插拔
多Agent协作: 支持多个 Agent 协同工作和任务分配

🏗️ 技术架构

graph TB
    A[用户界面] --> B[PyQt5 GUI]
    A --> C[Web API]
    A --> D[语音交互]
    
    B --> E[对话核心]
    C --> E
    D --> E
    
    E --> F[工具调用循环]
    F --> G[MCP 服务管理器]
    F --> H[Agent 管理器]
    
    G --> I[各种 MCP 服务]
    H --> J[各种 Agent]
    
    E --> K[GRAG 记忆系统]
    K --> L[Neo4j 图数据库]
    
    E --> M[配置管理]
    M --> N[config.py]
    M --> O[config_manager.py]
    
    I --> O[文件/代码/浏览器等]
    J --> P[专业任务处理]

📊 核心模块

模块	功能	技术栈
对话核心	处理用户输入和AI响应	Python, OpenAI API
MCP 服务	工具调用和服务管理	MCP Protocol
Agent 系统	专业任务处理	多模型支持
记忆系统	知识图谱和上下文	Neo4j, Py2neo
用户界面	图形交互界面	PyQt5, Markdown
API 服务	HTTP 接口服务	FastAPI, Uvicorn
语音系统	语音合成和识别	Edge-TTS, PyAudio
配置管理	配置热更新和模块重载	ConfigManager, JSON

🗂️ 目录结构

NagaAgent3.1/
├── main.py                     # 主入口
├── config.py                   # 全局配置
├── config.json.example         # 配置文件模板
├── config_manager.py           # 配置热更新管理器
├── conversation_core.py        # 对话核心（含工具调用循环主逻辑）
├── apiserver/                  # API服务器模块
│   ├── api_server.py           # FastAPI服务器
│   ├── start_server.py         # 启动脚本
│   ├── message_manager.py      # 消息管理器
│   └── README.md               # API文档
├── mcpserver/                  # MCP服务和Agent系统
│   ├── mcp_manager.py          # MCP服务管理
│   ├── mcp_registry.py         # Agent注册与schema元数据
│   ├── agent_manager.py        # Agent管理器（独立系统）
│   ├── agent_xxx/              # 各类自定义Agent
│   │   └── agent-manifest.json # Agent配置文件
│   ├── agent_comic_downloader/ # 漫画下载Agent
│   ├── agent_device_switch/    # 设备控制Agent
│   ├── agent_memory/           # 记忆管理Agent
│   ├── agent_naga_portal/      # 娜迦门户Agent
│   ├── agent_playwright_master/ # 浏览器自动化Agent
│   ├── agent_weather_time/     # 天气时间Agent
│   └── Office-Word-MCP-Server-main/ # Word文档处理Agent
├── thinking/                   # 深度思考引擎
│   ├── tree_thinking.py        # 核心思考引擎
│   ├── difficulty_judge.py     # 问题难度评估
│   ├── genetic_pruning.py     # 遗传算法剪枝
│   ├── preference_filter.py   # 用户偏好过滤
│   └── thinking_node.py       # 思考节点结构
├── summer_memory/              # GRAG知识图谱记忆系统
│   ├── memory_manager.py       # 记忆管理器
│   ├── quintuple_extractor.py  # 五元组提取器
│   ├── quintuple_graph.py      # Neo4j图谱操作
│   ├── quintuple_rag_query.py  # 记忆查询
│   └── quintuple_visualize_v2.py  # 图谱可视化
├── voice/                      # 语音交互系统
│   ├── tts_handler.py          # TTS处理器
│   ├── voice_integration.py    # 语音集成
│   ├── server.py               # 语音服务器
│   └── start_voice_service.py  # 语音服务启动脚本
├── ui/                         # 前端UI
│   ├── pyqt_chat_window.py     # PyQt聊天窗口
│   ├── response_utils.py       # 响应解析工具
│   ├── message_renderer.py     # 消息渲染器
│   ├── elegant_settings_widget.py # 设置组件
│   └── tray/                   # 系统托盘模块
│       ├── console_tray.py     # 控制台托盘功能
│       ├── auto_start.py       # 自启动管理
│       └── README.md           # 托盘使用说明
├── mqtt_tool/                  # MQTT工具
├── logs/                       # 日志（含历史txt对话）
├── data/neo4j/                 # Neo4j数据库文件
├── requirements.txt             # 项目依赖
├── pyproject.toml             # 项目配置
├── CONFIG_HOT_RELOAD_GUIDE.md  # 配置热更新使用指南
├── CONFIG_HOT_RELOAD_TEST_REPORT.md # 配置热更新测试报告
├── setup.ps1                   # Windows配置脚本
├── start.bat                   # Windows启动脚本
├── start_with_tray.bat         # Windows托盘启动脚本
├── setup_mac.sh                # Mac配置脚本
├── start_mac.sh                # Mac启动脚本
├── check_env.py                # 跨平台环境检查
└── README.md                   # 项目说明

🔧 工具调用循环机制

系统概述

NagaAgent支持两种类型的工具调用：

MCP服务调用: 通过agentType: mcp调用MCP类型的Agent
Agent服务调用: 通过agentType: agent调用Agent类型的Agent

工具调用格式

MCP服务调用格式

{
  "agentType": "mcp",
  "service_name": "MCP服务名称",
  "tool_name": "工具名称",
  "参数名": "参数值"
}

Agent服务调用格式

{
  "agentType": "agent",
  "agent_name": "Agent名称",
  "prompt": "任务内容"
}

工具调用流程

LLM输出JSON格式: LLM根据用户需求输出工具调用请求
自动解析agentType: 系统首先解析agentType字段，确定调用类型
路由到对应管理器:
- mcp类型 → 路由到MCPManager处理
- agent类型 → 路由到AgentManager处理
执行工具调用: 调用对应的服务执行具体任务
结果返回LLM: 将工具执行结果返回给LLM
循环处理: 重复步骤2-5，直到LLM输出普通文本或无工具调用

配置参数

# config.py中的工具调用循环配置
MAX_handoff_LOOP_STREAM = 5      # 流式模式最大工具调用循环次数
MAX_handoff_LOOP_NON_STREAM = 5  # 非流式模式最大工具调用循环次数
SHOW_handoff_OUTPUT = False      # 是否显示工具调用输出

🌐 多Agent与MCP服务

动态服务池查询功能

核心查询方法

from mcpserver.mcp_registry import (
    get_all_services_info,      # 获取所有服务信息
    get_service_info,           # 获取单个服务详情
    query_services_by_capability, # 按能力搜索服务
    get_service_statistics,     # 获取统计信息
    get_available_tools         # 获取服务工具列表
)

API端点

GET /mcp/services - 获取所有服务列表和统计信息
GET /mcp/services/{service_name} - 获取指定服务详情
GET /mcp/services/search/{capability} - 按能力搜索服务
GET /mcp/services/{service_name}/tools - 获取服务工具列表
GET /mcp/statistics - 获取服务统计信息

典型用法示例

# 读取文件内容
await s.mcp.handoff(
  service_name="file",
  task={"action": "read", "path": "test.txt"}
)

# 运行Python代码
await s.mcp.handoff(
  service_name="coder",
  task={"action": "run", "file": "main.py"}
)

🤖 AgentManager 独立系统

系统概述

AgentManager是一个独立的Agent注册和调用系统，支持从配置文件动态加载Agent定义，提供统一的调用接口和完整的生命周期管理。

核心功能

1. 配置管理

动态配置加载: 从agent_configs/目录自动扫描和加载Agent配置文件
配置验证: 自动验证Agent配置的完整性和有效性
热重载: 支持运行时重新加载配置，无需重启系统
环境变量支持: 支持从环境变量和.env文件加载敏感配置

2. 会话管理

多会话支持: 每个Agent支持多个独立的会话上下文
历史记录: 自动维护对话历史，支持上下文召回
会话过期: 自动清理过期的会话数据，节省内存
会话隔离: 不同用户和不同Agent的会话完全隔离

3. 智能占位符替换

支持多种类型的占位符替换：

Agent配置占位符:

{{AgentName}} - Agent名称
{{Description}} - 描述信息
{{ModelId}} - 模型ID
{{Temperature}} - 温度参数
{{MaxTokens}} - 最大输出token数
{{ModelProvider}} - 模型提供商

环境变量占位符:

{{ENV_VAR_NAME}} - 系统环境变量

时间占位符:

{{CurrentTime}} - 当前时间 (HH:MM:SS)
{{CurrentDate}} - 当前日期 (YYYY-MM-DD)
{{CurrentDateTime}} - 完整时间 (YYYY-MM-DD HH:MM:SS)

配置文件格式

Agent配置文件示例

{
  "ExampleAgent": {
    "model_id": "deepseek-chat",
    "name": "示例助手",
    "base_name": "ExampleAgent",
    "system_prompt": "你是{{AgentName}}，一个专业的{{Description}}。\n\n当前时间：{{CurrentDateTime}}\n模型：{{ModelId}}\n温度：{{Temperature}}\n\n请用中文回答，保持专业和友好的态度。",
    "max_output_tokens": 8192,
    "temperature": 0.7,
    "description": "智能助手，擅长回答各种问题",
    "model_provider": "openai",
    "api_base_url": "https://api.deepseek.com/v1",
    "api_key": "{{DEEPSEEK_API_KEY}}"
  }
}

使用示例

基本调用

from mcpserver.agent_manager import get_agent_manager

# 获取AgentManager实例
agent_manager = get_agent_manager()

# 调用Agent
result = await agent_manager.call_agent(
    agent_name="ExampleAgent",
    prompt="请帮我分析这份数据",
    session_id="user_123"
)

便捷函数调用

from mcpserver.agent_manager import call_agent, list_agents, get_agent_info

# 便捷调用
result = await call_agent("ExampleAgent", "你好")

# 获取Agent列表
agents = list_agents()

📋 Agent Manifest标准化

标准化规范

所有Agent必须使用标准化的agent-manifest.json配置文件，确保一致性和可维护性。

必需字段

name: Agent唯一标识符
displayName: 显示名称
version: 版本号（x.y.z格式）
description: 功能描述
author: 作者或模块名称
agentType: Agent类型（mcp/agent）
entryPoint: 入口点配置（module和class）

创建新Agent

创建MCP类型Agent

在mcpserver/目录下创建新的Agent目录
复制AGENT_MANIFEST_TEMPLATE.json到Agent目录
修改manifest文件内容
创建Agent实现类
重启系统自动注册

创建Agent类型Agent

在agent_configs/目录下创建配置文件
定义Agent配置（模型、提示词等）
配置环境变量（API密钥等）
重启系统自动加载

🖥️ 系统托盘功能

功能特性

控制台托盘: 将终端窗口隐藏到系统托盘，支持自动隐藏
任务栏隐藏: 控制台窗口从任务栏完全隐藏
托盘图标: 系统托盘显示应用图标，支持右键菜单
自启动管理: 支持注册表方式的自启动功能
托盘消息: 支持状态通知和消息提示

使用方法

托盘模式启动

# Windows
.\start_with_tray.bat

托盘菜单功能

显示控制台: 从托盘恢复控制台窗口显示
隐藏控制台: 隐藏控制台窗口到托盘
开机自启动: 切换自启动状态
退出: 完全退出应用

技术实现

窗口钩子: 监听控制台窗口的关闭事件，拦截关闭操作
窗口样式: 使用WS_EX_TOOLWINDOW样式让窗口不在任务栏显示
自动隐藏: 启动后3秒自动隐藏控制台窗口
托盘集成: 使用PyQt5实现系统托盘功能

注意事项

权限要求: 自启动功能需要管理员权限
依赖安装: 需要安装PyQt5库
图标文件: 默认使用ui/window_icon.png作为托盘图标
启动方式: 使用start_with_tray.bat启动以启用托盘功能

🌐 RESTful API 服务

NagaAgent内置完整的RESTful API服务器，启动时自动开启，支持所有对话功能：

API接口说明

基础地址: http://127.0.0.1:8000 (可在config.py中配置)
交互式文档: http://127.0.0.1:8000/docs
OpenAPI规范: http://127.0.0.1:8000/openapi.json

主要接口

健康检查

GET /health

对话接口

# 普通对话
POST /chat
{
  "message": "你好，娜迦",
  "session_id": "optional-session-id"
}

# 流式对话 (Server-Sent Events)
POST /chat/stream
{
  "message": "请介绍一下人工智能的发展历程"
}

系统管理接口

# 获取系统信息
GET /system/info

# 切换开发者模式
POST /system/devmode

# 获取记忆统计
GET /memory/stats

MCP服务Agent化升级说明

所有MCP服务（如文件、代码、浏览器、应用启动、系统控制、天气等）已全部升级为标准Agent风格：
- 统一继承自agents.Agent，具备name、instructions属性和handle_handoff异步方法
- 变量全部走config.py统一管理，避免重复定义
- 注释全部中文，文件/类/函数注释一行，变量注释右侧#
- 支持多agent协作，ControllerAgent可智能分配任务给BrowserAgent、ContentAgent等
- 注册中心mcp_registry.py自动发现并注册所有实现了handle_handoff的Agent实例，支持热插拔
- 注册时自动输出所有已注册agent的名称和说明，便于调试
- 简化Agent类型：只支持mcp和agent两种类型
handoff机制全部通过handle_handoff异步方法调度，兼容JSON和handoff两种格式
新增/删除agent只需增删py文件，无需重启主程序
详细接口和参数请参考各Agent代码注释与config.py配置

更新日志

工具调用格式已优化，改为纯JSON格式，更加简洁规范，具体示例如下：

{
  "agentType": "mcp",
  "service_name": "MCP服务名称",
  "tool_name": "工具名称",
  "参数名": "参数值"
}

📝 前端UI与响应适配

所有后端返回均为结构化JSON: 前端通过ui/response_utils.py的extract_message方法自动适配多种返回格式
优先显示逻辑: 优先显示data.content，其次message，最后原样返回，兼容所有Agent
换行符自动适配: PyQt前端自动将所有\n和\\n换行符转为<br>，多行内容显示无障碍
UI动画: 侧栏点击切换时，侧栏宽度、主聊天区宽度、输入框高度均采用同步动画
主题自定义: UI动画、主题、昵称、透明度等全部可在config.py和pyqt_chat_window.py灵活配置

🔊 流式语音交互

支持语音输入: 流式识别，自动转文字
支持语音输出: 流式合成，边播边出
完全异步处理: 重构语音集成系统，文本显示和音频播放完全分离
消除重复播放: 移除流式分句和最终文本的重复播放问题
前端即时显示: 前端立即显示文本，不再等待音频处理完成
依赖与配置: 详见voice/voice_config.py和README相关章节

🌳 深度思考引擎

NagaAgent 3.1 引入了基于遗传算法的多分支思考引擎，提供更高质量的AI回答。

核心特性

多分支并行思考: 根据问题难度自动生成多条不同类型的思考路线
问题难度评估: 通过文本长度、关键词、句式结构等综合判断复杂度
用户偏好系统: 支持自定义偏好配置，对思考路线进行加权评分
遗传算法剪枝: 对思考路线进行适应度评估、交叉融合、精英保留
并发线程池: 思考与API调用分离，提升并发性能
可扩展架构: 支持自定义分支类型、评分权重、进化策略

思考分支类型

逻辑分支: 注重逻辑推理和事实分析
创新分支: 强调创意思维和独特见解
分析分支: 深入分析和多角度思考
实用分支: 关注实际应用和可操作性
哲学分支: 探讨深层含义和价值思考

使用方法

from thinking import TreeThinkingEngine

# 初始化引擎
engine = TreeThinkingEngine(api_client=your_api_client, memory_manager=your_memory_manager)

# 启用深度思考
result = await engine.think_deeply("请分析人工智能未来的发展趋势")
print(result["answer"])  # 输出综合后的最终答案

📝 其它亮点

记忆权重动态调整: 支持AI/人工标记important，权重/阈值/清理策略全部在config.py统一管理
主题归类自动化: 主题归类、召回、权重提升、清理等全部自动化
检索日志自动记录: 参数可调，GRAG配置示例见config.py
历史对话兼容升级: 支持将旧版txt对话内容一键导入GRAG知识图谱记忆系统
工具调用循环自动执行机制: 支持多轮递归调用，最大循环次数可配置
所有Agent的注册元数据已集中在mcpserver/mcp_registry.py: 主流程和管理器极简，扩展维护更方便
自动注册/热插拔Agent机制: 新增/删除Agent只需增删py文件，无需重启主程序
Agent Manifest标准化: 统一的agent-manifest.json格式，支持完整的字段验证和类型检查
动态服务池查询: 系统通过扫描agent-manifest.json文件自动发现和注册服务，无需手动配置静态服务列表
AgentManager独立系统: 支持Agent的配置加载、会话管理、消息组装和LLM调用，提供完整的Agent生命周期管理
智能占位符替换: 支持Agent配置、环境变量、时间信息等多种占位符，实现动态提示词生成
完整消息序列构建: 自动组装系统消息、历史消息和用户消息，确保对话上下文完整性
多模型提供商支持: 支持OpenAI、DeepSeek、Anthropic等多种LLM提供商，每个Agent可独立配置
会话隔离与TTL管理: 支持多用户多会话隔离，自动清理过期会话数据
统一工具调用接口: MCP和Agent类型服务通过统一的JSON格式调用，支持混合调用场景
配置热更新系统: 实时配置变更、配置快照、模块重载、自动监视等完整功能

📋 更新日志

v3.1.0 (2024-08-17)

🚀 新增功能

深度思考引擎: 基于遗传算法的多分支思考系统
AgentManager: 独立的Agent注册和调用系统
模块化UI渲染: 新的消息渲染系统，支持名字+消息框布局
🎭 Live2D集成: 独立的Live2D模块，支持模型和图片的混合侧栏显示，自动回退机制
MQTT通信支持: 新增MQTT工具模块
Word文档处理: 集成Office Word MCP服务
漫画下载Agent: 新增漫画下载功能Agent
配置热更新系统: 实时配置变更，无需重启应用

🔧 功能改进

语音服务升级: OpenAI兼容的TTS服务，支持多种音频格式
系统托盘增强: 完整的后台运行和自启动支持
配置管理优化: 统一的配置文件结构和环境变量支持
配置热更新: 支持实时配置变更和模块重新加载
依赖管理: 使用pyproject.toml进行现代化依赖管理
Agent热插拔: 支持运行时动态加载和卸载Agent

🐛 问题修复

内存泄漏: 修复会话管理中的内存泄漏问题
并发处理: 改进多线程并发处理的稳定性
配置验证: 增强配置文件的验证和错误处理
配置热更新: 修复配置快照序列化和更新延迟问题
UI响应: 优化UI界面的响应速度和用户体验

📚 文档更新

完善所有模块的README文档
更新安装和配置指南
添加API接口文档
增加故障排除指南
新增配置热更新系统使用指南和测试报告

🆙 历史对话兼容升级

支持将旧版txt对话内容一键导入GRAG知识图谱记忆系统: 兼容主题、分层、五元组等所有新特性
激活指令:
```
#夏园系统兼容升级
```
系统会自动遍历logs目录下所有txt日志: 列出所有历史对话内容并编号，输出到终端和summer_memory/history_dialogs.json
用户可查看编号后，选择导入方式:
- 全部导入：
```
python summer_memory/main.py import all
```
- 选择性导入（如第1、3、5-8条）：
```
python summer_memory/main.py import 1,3,5-8
```
兼容过程自动判重: 已入库内容不会重复导入，支持断点续跑
兼容内容全部走AI自动主题归类与分层: 完全与新系统一致
详细进度、结果和异常均有反馈: 安全高效

🔧 最新更新 (v3.0.5)

系统托盘功能增强

控制台托盘功能: 实现真正的"最小化到托盘"功能
窗口钩子: 监听控制台窗口的关闭事件，拦截关闭操作
任务栏隐藏: 使用WS_EX_TOOLWINDOW样式让窗口不在任务栏显示
自动隐藏: 启动后3秒自动隐藏控制台窗口
托盘消息: 支持托盘消息通知和状态提示

MCP工具依赖

新增依赖: 添加jmcomic和fastmcp依赖到requirements.txt
虚拟环境安装: 确保依赖安装到虚拟环境中
依赖验证: 提供依赖安装验证脚本

技术改进

窗口监控: 添加窗口状态监控线程，实时检测窗口显示/隐藏状态
样式管理: 保存和恢复原始窗口样式，确保功能稳定性
错误处理: 增强窗口操作和托盘功能的错误处理机制

❓ 常见问题

环境检查

python check_env.py

Windows 环境

Python版本/依赖/虚拟环境/浏览器驱动等问题: 详见setup.ps1与本README
IDE报import错误: 重启并选择正确解释器
语音依赖安装失败: 先装C++ Build Tools
MCP工具依赖缺失: 运行pip install jmcomic fastmcp

Mac 环境

Python版本过低: brew install [email protected]
PyAudio安装失败: brew install portaudio && pip install pyaudio
权限问题: chmod +x *.sh

API服务器问题

端口占用: 修改config.py中的API_SERVER_PORT
代理干扰: 临时禁用代理 unset ALL_PROXY http_proxy https_proxy
依赖缺失: 确保安装了FastAPI和Uvicorn pip install fastapi uvicorn[standard]
无法访问: 检查防火墙设置，确保端口未被阻塞

工具调用问题

工具调用循环次数过多: 调整config.py中的MAX_handoff_LOOP_STREAM和MAX_handoff_LOOP_NON_STREAM
工具调用失败: 检查MCP服务是否正常运行，查看日志输出
格式错误: 确保LLM输出严格遵循JSON格式

GRAG记忆系统问题

Neo4j连接失败: 检查Neo4j服务是否启动，确认连接参数正确
记忆查询无结果: 检查五元组是否正确提取和存储
性能问题: 调整config.py中的GRAG相关参数

系统托盘问题

托盘图标不显示: 检查图标文件是否存在，确认PyQt5安装正确
控制台托盘不工作: 确认使用start_with_tray.bat启动
自启动失败: 确认管理员权限，检查注册表权限
窗口最小化问题: 检查托盘集成是否正确，确认事件处理函数

AgentManager问题

Agent配置加载失败: 检查agent_configs/目录下的JSON文件格式是否正确
API调用失败: 确认API密钥配置正确，检查网络连接
会话历史丢失: 检查会话TTL配置，确认会话未过期
占位符替换失败: 确认环境变量已正确设置
内存占用过高: 调整max_history_rounds参数，减少历史消息数量

配置热更新问题

配置更新失败: 检查config.json文件格式是否正确，确认文件权限
配置快照恢复失败: 确认快照数据完整，检查JSON序列化问题
模块重新加载失败: 确认模块有reload_config方法，检查模块依赖
配置监视器不工作: 确认使用start_config_watcher()启动监视器
配置文件被损坏: 使用备份文件恢复，或重新生成配置文件

通用问题

浏览器无法启动: 检查playwright安装与网络
主题树/索引/参数/密钥全部在config.py统一管理
聊天输入#devmode进入开发者模式: 后续对话不写入GRAG记忆，仅用于工具调用测试

最佳实践

Agent配置最佳实践

使用环境变量: 敏感信息如API密钥应使用环境变量
合理设置参数: 根据任务需求调整temperature和max_output_tokens
优化提示词: 使用占位符实现动态内容，提高灵活性
会话管理: 合理设置会话TTL，避免内存泄漏

性能优化建议

缓存配置: 启用配置缓存，减少文件读取开销
并发控制: 合理控制并发Agent调用数量
资源清理: 定期清理过期会话和临时数据
监控日志: 启用调试模式监控系统性能
配置热更新: 使用批量更新减少重新加载次数，避免频繁配置变更

安全建议

API密钥管理: 使用环境变量或密钥管理服务
输入验证: 对用户输入进行验证和清理
错误处理: 避免在错误信息中泄露敏感信息
访问控制: 实现适当的访问控制机制
配置备份: 定期备份配置文件，使用配置快照功能

🤝 贡献指南

我们欢迎所有形式的贡献！请阅读以下指南：

📋 贡献方式

报告问题: 使用 GitHub Issues 提交 Bug 报告
功能建议: 提出新功能的需求和建议
代码贡献: 提交 Pull Request 改进代码
文档改进: 完善项目文档和使用说明

📝 开发规范

遵循 PEP 8 代码风格
添加适当的注释和文档
确保代码测试通过
更新相关文档

📞 联系方式

Issues: GitHub Issues
讨论: GitHub Discussions

🙏 致谢

感谢以下开源项目和贡献者：

OpenAI - 提供强大的 AI 模型
Neo4j - 图数据库支持
PyQt5 - GUI 框架
FastAPI - 现代 Web 框架
MCP - 模型上下文协议
所有贡献者和社区成员

📄 许可证

本项目采用 MIT 许可证 - 详见 LICENSE 文件

⭐ 如果这个项目对您有帮助，请考虑给我们一个 Star！

For Tasks:

Click tags to check more tools for each tasks

For Jobs:

Alternative AI tools for NagaAgent

Similar Open Source Tools

NagaAgent

github

: 899

py-xiaozhi

py-xiaozhi is a Python-based XiaoZhi voice client designed for learning through code and experiencing AI XiaoZhi's voice functions without hardware conditions. The repository is based on the xiaozhi-esp32 port. It supports AI voice interaction, visual multimodal capabilities, IoT device integration, online music playback, voice wake-up, automatic conversation mode, graphical user interface, command-line mode, cross-platform support, volume control, session management, encrypted audio transmission, automatic captcha handling, automatic MAC address retrieval, code modularization, and stability optimization.

github

: 2.5k

Snap-Solver

Snap-Solver is a revolutionary AI tool for online exam solving, designed for students, test-takers, and self-learners. With just a keystroke, it automatically captures any question on the screen, analyzes it using AI, and provides detailed answers. Whether it's complex math formulas, physics problems, coding issues, or challenges from other disciplines, Snap-Solver offers clear, accurate, and structured solutions to help you better understand and master the subject matter.

github

: 74

LLMAI-writer

LLMAI-writer is a powerful AI tool for assisting in novel writing, utilizing state-of-the-art large language models to help writers brainstorm, plan, and create novels. Whether you are an experienced writer or a beginner, LLMAI-writer can help you efficiently complete the writing process.

github

: 65

AIstudioProxyAPI

AI Studio Proxy API is a Python-based proxy server that converts the Google AI Studio web interface into an OpenAI-compatible API. It provides stable API access through Camoufox (anti-fingerprint detection Firefox) and Playwright automation. The project offers an OpenAI-compatible API endpoint, a three-layer streaming response mechanism, dynamic model switching, complete parameter control, anti-fingerprint detection, script injection functionality, modern web UI, graphical interface launcher, flexible authentication system, modular architecture, unified configuration management, and modern development tools.

github

: 1.6k

TrainPPTAgent

TrainPPTAgent is an AI-based intelligent presentation generation tool. Users can input a topic and the system will automatically generate a well-structured and content-rich PPT outline and page-by-page content. The project adopts a front-end and back-end separation architecture: the front-end is responsible for interaction, outline editing, and template selection, while the back-end leverages large language models (LLM) and reinforcement learning (GRPO) to complete content generation and optimization, making the generated PPT more tailored to user goals.

github

: 81

AI-Drug-Discovery-Design

AI-Drug-Discovery-Design is a repository focused on Artificial Intelligence-assisted Drug Discovery and Design. It explores the use of AI technology to accelerate and optimize the drug development process. The advantages of AI in drug design include speeding up research cycles, improving accuracy through data-driven models, reducing costs by minimizing experimental redundancies, and enabling personalized drug design for specific patients or disease characteristics.

github

: 77

MaiMBot

MaiMBot is an intelligent QQ group chat bot based on a large language model. It is developed using the nonebot2 framework, utilizes LLM for conversation abilities, MongoDB for data persistence, and NapCat for QQ protocol support. The bot features keyword-triggered proactive responses, dynamic prompt construction, support for images and message forwarding, typo generation, multiple replies, emotion-based emoji responses, daily schedule generation, user relationship management, knowledge base, and group impressions. Work-in-progress features include personality, group atmosphere, image handling, humor, meme functions, and Minecraft interactions. The tool is in active development with plans for GIF compatibility, mini-program link parsing, bug fixes, documentation improvements, and logic enhancements for emoji sending.

github

: 1.1k

Daily-DeepLearning

Daily-DeepLearning is a repository that covers various computer science topics such as data structures, operating systems, computer networks, Python programming, data science packages like numpy, pandas, matplotlib, machine learning theories, deep learning theories, NLP concepts, machine learning practical applications, deep learning practical applications, and big data technologies like Hadoop and Hive. It also includes coding exercises related to '剑指offer'. The repository provides detailed explanations and examples for each topic, making it a comprehensive resource for learning and practicing different aspects of computer science and data-related fields.

github

: 666

chatless

Chatless is a modern AI chat desktop application built on Tauri and Next.js. It supports multiple AI providers, can connect to local Ollama models, supports document parsing and knowledge base functions. All data is stored locally to protect user privacy. The application is lightweight, simple, starts quickly, and consumes minimal resources.

github

: 212

AI-CloudOps

AI+CloudOps is a cloud-native operations management platform designed for enterprises. It aims to integrate artificial intelligence technology with cloud-native practices to significantly improve the efficiency and level of operations work. The platform offers features such as AIOps for monitoring data analysis and alerts, multi-dimensional permission management, visual CMDB for resource management, efficient ticketing system, deep integration with Prometheus for real-time monitoring, and unified Kubernetes management for cluster optimization.

github

: 129

VCPToolBox

github

: 153

bella-openapi

Bella OpenAPI is an API gateway that provides rich AI capabilities, similar to openrouter. In addition to chat completion ability, it also offers text embedding, ASR, TTS, image-to-image, and text-to-image AI capabilities. It integrates billing, rate limiting, and resource management functions. All integrated capabilities have been validated in large-scale production environments. The tool supports various AI capabilities, metadata management, unified login service, billing and rate limiting, and has been validated in large-scale production environments for stability and reliability. It offers a user-friendly experience with Java-friendly technology stack, convenient cloud-based experience service, and Dockerized deployment.

github

: 120

nix-ai-tools

Exploring the integration between Nix and AI coding agents, this repository serves as a testbed for packaging, sandboxing, and enhancing AI-powered development tools within the Nix ecosystem. It provides a collection of AI tools with descriptions, versions, sources, licenses, homepages, and usage instructions. The repository also supports daily updates using GitHub Actions and offers a platform for experimental features like sandboxed execution, provider abstraction, and tool composition in Nix environments. Contributions are welcome, and the Nix packaging code in this repository is licensed under MIT.

github

: 112

NovelForge

NovelForge is an AI-assisted writing tool with the potential for creating long-form content of millions of words. It offers a solution that combines world-building, structured content generation, and consistency maintenance. The tool is built around four core concepts: modular 'cards', customizable 'dynamic output models', flexible 'context injection', and consistency assurance through a 'knowledge graph'. It provides a highly structured and configurable writing environment, inspired by the Snowflake Method, allowing users to create and organize their content in a tree-like structure. NovelForge is highly customizable and extensible, allowing users to tailor their writing workflow to their specific needs.

github

: 134

godoos

GodoOS is an efficient intranet office operating system that includes various office tools such as word/excel/ppt/pdf/internal chat/whiteboard/mind map, with native file storage support. The platform interface mimics the Windows style, making it easy to operate while maintaining low resource consumption and high performance. It automatically connects to intranet users without registration, enabling instant communication and file sharing. The flexible and highly configurable app store allows for unlimited expansion.

github

: 151

For similar tasks

No tools available

For similar jobs

No tools available