本地AI深度研究助手Local Deep Research
简介
什么是 Local Deep Research ?
Local Deep Research是一个开源的AI深度研究助手,可以自动执行复杂的研究任务,支持多种本地和云端LLM,以及10+种搜索引擎。所有数据使用SQLCipher加密存储,确保隐私安全。
主要特点
- 本地优先:支持
Ollama、LM Studio、llama.cpp等本地LLM,数据完全不离开你的机器 - 多搜索引擎:支持
arXiv、PubMed、Semantic Scholar、SearXNG、Brave Search等10+种搜索引擎 - 智能研究策略:提供
20+种研究策略,从快速摘要到深度分析,包括自主决策的LangGraph Agent模式 - 知识库构建:自动下载、索引和嵌入研究资料,构建可搜索的个人知识库
- 加密存储:每个用户独立的
SQLCipher数据库,使用AES-256加密(Signal级别安全) - SimpleQA ~95%:在单张
RTX 3090上运行Qwen3.6-27B达到95.7%准确率 - MCP 服务器:支持
Claude Code等AI助手集成,但只支持STDIO传输 - 开源免费:基于
MIT协议开源,可免费使用和修改
应用场景
- 学术研究:自动搜索
arXiv、PubMed等学术数据库,快速了解研究前沿 - 技术调研:收集
GitHub、Stack Overflow等技术资源,生成技术方案对比报告 - 市场分析:搜索行业资讯、新闻报道,生成市场趋势分析报告
- 文献综述:批量下载和分析学术论文,自动生成文献综述
- 竞品分析:收集竞品信息、用户评价,生成竞品对比报告
- 个人知识管理:构建私有知识库,长期积累和检索研究资料

Local Deep Research 是一个功能强大的 AI 研究助手,让普通用户也能享受到类似 Perplexity 的深度研究能力,同时完全掌控自己的数据
安装
在群晖上以 Docker 方式安装。
在注册表中搜索 localdeepresearch ,选择第一个 localdeepresearch/local-deep-research,版本选择 latest。
本文写作时,
latest版本对应为1.7.0;

老苏的群晖性能有限,本地运行 LLM 会比较吃力,所以这里使用了第三方 OpenAI 兼容 API(如 SiliconFlow、OpenRouter 等),把推理压力交给云端。
目前硅基流动(SiliconFlow)注册就送 16 元的代金券
注册地址:
https://cloud.siliconflow.cn/i/NkUiXVhQ

而且 nex-agi/Nex-N2-Pro 模型现在限免中

项目包含 3个服务(LDR 主应用、Ollama、SearXNG),老苏简化成了 2 个,建议使用 docker-compose 进行部署,可以自动处理服务间的依赖关系。
docker-compose 安装
采用 docker-compose 安装,将下面的内容保存为 docker-compose.yml 文件
1 | services: |
环境变量的简单说明
| 变量名 | 值 | 说明 |
|---|---|---|
LDR_SEARCH_ENGINE_WEB_SEARXNG_DEFAULT_PARAMS_INSTANCE_URL |
http://searxng:8080 |
SearXNG 搜索引擎地址(Docker 内部网络) |
LDR_LLM_PROVIDER |
openai_endpoint |
LLM 提供商,使用 OpenAI 兼容接口 |
LDR_LLM_OPENAI_ENDPOINT_URL |
https://api.siliconflow.cn/v1 |
API 地址,填入你使用的平台地址,这里填了硅基流动的地址 |
LDR_LLM_OPENAI_ENDPOINT_API_KEY |
sk-or-v1-xxx |
API Key,替换为你的真实密钥 |
LDR_LLM_MODEL |
nex-agi/Nex-N2-Pro |
模型名称,根据平台支持填写,这里填了限免的模型 |
更多的环境变量说明,请参考官方文档:https://github.com/LearningCircuit/local-deep-research/blob/main/docs/env_configuration.md
然后通过 SSH 登录到您的群晖,执行下面的命令:
1 | # 新建文件夹 ldr 和 子目录 |

运行
在浏览器中访问 http://<群晖IP>:5772 即可看到登录界面。

第一次需要注册一个新账户

登录后的主界面

在 Research Query 中可以输入研究问题,例如: 什么是量子计算?

下拉可以看到默认的研究模式和大模型设置
- Quick Summary:
30秒到3分钟快速回答,适合简单问题 - Detailed Research:
5-15分钟深度分析,适合复杂研究 - Report Generation:
10-30分钟生成完整报告,适合正式输出

继续下拉找到 Start Research 启动研究

等待结果

可以看到处理过程

等完成之后

点 View Results 查看结果

其他的功能可以慢慢摸索
注意事项
- 模型选择:如果使用
Ollma,推荐使用Qwen3.6-27B或Gemma3:12B,需要至少16GB显存或32GB内存 - 存储空间:
Ollama模型需要5-15GB空间,确保群晖有足够存储 - GPU 加速:如有
NVIDIA GPU,并且使用了Ollama服务,可额外加载docker-compose.gpu.override.yml启用硬件加速 - 端口冲突:默认使用
5000端口,如需修改请在docker-compose.yml中调整ports配置 - 网络要求:首次使用需要联网下载模型,之后可以完全离线使用
- 安全建议:生产环境建议设置
LDR_APP_ALLOW_REGISTRATIONS=false禁止公开注册
参考文档
LearningCircuit/local-deep-research: AI-powered research assistant for deep, agentic research
地址:https://github.com/LearningCircuit/local-deep-researchlocaldeepresearch/local-deep-research - Docker Hub
地址:https://hub.docker.com/r/localdeepresearch/local-deep-research