# DeepResearchAgent **Repository Path**: llm_4/DeepResearchAgent ## Basic Information - **Project Name**: DeepResearchAgent - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-05-23 - **Last Updated**: 2025-06-25 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # DeepResearchAgent [English](README.md) | 简体中文 ## 简介 **DeepResearchAgent** 是一个分层多智能体系统,设计目标是处理深度研究任务,同时也适用于通用任务求解。该框架通过顶层规划智能体协调多个专门的子智能体,实现了任务的自动分解与高效执行,适用于多样且复杂的任务场景。 ## 系统架构

Architecture

本系统采用两层结构: ### 1. 顶层规划智能体 * 负责理解任务、规划整体流程。 * 将任务分解为子任务并分配给合适的子智能体。 * 动态协调各智能体之间的协作,确保任务顺利完成。 ### 2. 专业子智能体 * **深度分析器(Deep Analyzer)** * 对输入信息进行深入分析,提取关键信息与潜在需求。 * 支持文本和结构化数据的分析。 * **深度研究者(Deep Researcher)** * 对指定主题或问题进行深度研究,自动获取并整合高质量信息。 * 可生成研究报告或知识总结。 * **浏览器操作(Browser Use)** * 自动化浏览器行为,支持网页搜索、信息提取与数据收集。 * 为研究者提供实时网页信息支持。 ## 主要特性 * 分层协作,适用于复杂和动态任务 * 易于扩展,可集成更多专业智能体 * 支持信息分析、研究与网页交互 ## 更新日志 * **2025.06.20**:支持 MCP 架构,包括本地MCP和远程MCP. * **2025.06.17**:更新技术报告https://arxiv.org/abs/2506.12508. * **2025.06.01**:升级 browser-use 至 v0.1.48 * **2025.05.30**:将子智能体调用方式改为函数调用,支持 GPT-4.1 和 Gemini-2.5-Pro 作为规划智能体 * **2025.05.27**:支持 OpenAI、Anthropic、Google LLM,以及本地 Qwen 模型(使用 vLLM) ## TODO 清单 * [x] 异步功能完成 * [ ] 图像生成智能体开发中 * [x] MCP 架构开发中 * [ ] AI4Research 智能体开发中 * [ ] 小说创作智能体开发中 ## 安装说明 ### 环境准备 ```bash conda create -n dra python=3.11 conda activate dra make install # 或者使用 requirements.txt 安装 conda create -n dra python=3.11 conda activate dra make install-requirements # 安装 playwright 以启用浏览器支持 pip install playwright playwright install chromium --with-deps --no-shell ``` ### 设置 `.env` 文件 `.env` 示例: ```bash PYTHONWARNINGS=ignore ANONYMIZED_TELEMETRY=false HUGGINEFACE_API_KEY=abcabcabc OPENAI_API_BASE=https://api.openai.com/v1 OPENAI_API_KEY=abcabcabc ANTHROPIC_API_BASE=https://api.anthropic.com ANTHROPIC_API_KEY=abcabcabc GOOGLE_APPLICATION_CREDENTIALS=/your/user/path/.config/gcloud/application_default_credentials.json GOOGLE_API_BASE=https://generativelanguage.googleapis.com GOOGLE_API_KEY=abcabcabc ``` 如需使用 Google 模型: * 获取 API Key:[https://aistudio.google.com/app/apikey](https://aistudio.google.com/app/apikey) * 获取 application\_default\_credentials.json: ```bash brew install --cask google-cloud-sdk gcloud init gcloud auth application-default login ``` ## 使用说明 ### 示例 1:研究 "AI Agent" 主题 ```bash python examples/run_example.py ``` ### 示例 2:评估 GAIA 数据集 ```bash mkdir data && cd data git clone https://huggingface.co/datasets/gaia-benchmark/GAIA python examples/run_gaia.py ``` ## 实验结果 我们在 GAIA 验证集上进行了评估,并于 5 月 10 日达到最先进性能:

GAIA Example Result

## 常见问题 ### 1. 如何使用本地 Qwen 模型? 支持以下模型: * qwen2.5-7b-instruct * qwen2.5-14b-instruct * qwen2.5-32b-instruct 配置: ```toml model_id = "qwen2.5-7b-instruct" ``` ### 2. 浏览器模块安装问题? ```bash pip install "browser-use[memory]"==0.1.48 pip install playwright playwright install chromium --with-deps --no-shell ``` ### 3. 子智能体函数调用不生效? 推荐使用 Claude-3.7-Sonnet 作为规划智能体,现已兼容 GPT-4.1 和 Gemini-2.5-Pro。 ### 4. 使用 vllm 进行本地模型部署 我们提供 huggingface 作为加载本地模型的快捷方式。我们还提供 vllm 作为启动服务的方式,以便提供并行加速。 ### 部署本地 Qwen 模型(使用 vLLM) #### 第一步:启动 vLLM 服务 ```bash nohup bash -c 'CUDA_VISIBLE_DEVICES=0,1 python -m vllm.entrypoints.openai.api_server \ --model /input0/Qwen3-32B \ --served-model-name Qwen \ --host 0.0.0.0 \ --port 8000 \ --max-num-seqs 16 \ --enable-auto-tool-choice \ --tool-call-parser hermes \ --tensor_parallel_size 2' > vllm_qwen.log 2>&1 & ``` `.env` 文件配置: ```bash QWEN_API_BASE=http://localhost:8000/v1 QWEN_API_KEY="abc" ``` #### 第二步:启动智能体服务 ```bash python main.py ``` 输入任务命令示例: ```bash Use deep_researcher_agent to search the latest papers on the topic of 'AI Agent' and then summarize it. ``` ## 致谢 DeepResearchAgent 主要借鉴了 smolagents 的架构设计,并在此基础上做出了以下改进: - 对 smolagents 的代码进行了模块化重构,使其结构更加清晰和易于维护。 - 将原有的同步执行框架改为异步执行框架。 - 优化了多智能体的初始化与部署流程,使其更加高效且易用。 我们由衷感谢以下开源项目对本项目的重要贡献: - [smolagents](https://github.com/huggingface/smolagents) - 轻量级智能体框架。 - [OpenManus](https://github.com/mannaandpoem/OpenManus) - 异步智能体框架。 - [browser-use](https://github.com/browser-use/browser-use) - 基于 AI 的浏览器自动化工具。 - [crawl4ai](https://github.com/unclecode/crawl4ai) - 面向 AI 应用的网页爬取库。 - [markitdown](https://github.com/microsoft/markitdown) - 文件转 Markdown 工具。 我们由衷感谢上述项目的所有贡献者和维护者,感谢他们推动 AI 技术进步并将其开放给社区使用。 ## 贡献 欢迎任何形式的贡献!欢迎提 issue 或提交 PR。 ## 引用 ```bibtex @misc{zhang2025agentorchestrahierarchicalmultiagentframework, title={AgentOrchestra: A Hierarchical Multi-Agent Framework for General-Purpose Task Solving}, author={Wentao Zhang, Ce Cui, Yilei Zhao, Rui Hu, Yang Liu, Yahui Zhou, Bo An}, year={2025}, eprint={2506.12508}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2506.12508}, } ```