# wenshudb
**Repository Path**: Koyfin/wenshudb
## Basic Information
- **Project Name**: wenshudb
- **Description**: 问数(WenshuDB)是新一代企业级智能数据分析SaaS平台,融合大语言模型与向量数据库技术,提供从数据接入、分析到可视化的一站式智能数据服务,助力企业实现数据驱动的智能决策
- **Primary Language**: Unknown
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 26
- **Forks**: 8
- **Created**: 2025-03-12
- **Last Updated**: 2025-09-23
## Categories & Tags
**Categories**: Uncategorized
**Tags**: 大模型, AI, llm, 大数据, 人工智能
## README
# 问数(WenshuDB)
## 项目介绍
问数(WenshuDB)是面向企业级智能数据分析的新一代SaaS平台,采用先进的云原生架构和前沿AI技术,为企业提供智能数据洞察与决策支持。平台深度融合大语言模型(LLM)与向量数据库技术,通过创新的语义理解引擎和多模态数据处理能力,将复杂的数据分析需求转化为直观的自然语言交互体验。作为Text2SQL技术的新一代演进,问数平台整合了分布式计算、知识图谱、机器学习等前沿技术,配备完整的企业级安全与治理框架,为用户提供从数据接入、清洗、分析到可视化的一站式智能数据服务。凭借独创的向量压缩算法和混合模型调优技术,问数在保持高性能的同时大幅降低企业数据分析成本,是新一代企业数据智能的标杆之作。
### 核心特性
- **多LLM模型支持**:支持多种大语言模型的无缝切换,满足不同场景需求
- **多数据源查询**:连接MySQL、PostgreSQL等多种数据库,统一查询接口
- **多向量库存储**:支持多种向量数据库的灵活切换
- **多向量模型切换**:适配不同的向量嵌入模型,优化语义理解
- **查询过程可观测**:全流程追踪,提供查询执行的透明度和可解释性
- **AI建表与取数**:智能创建数据表和提取数据,简化数据操作
- **数据管理与可视化**:直观的数据管理界面和丰富的可视化工具
- **多场景训练增强**:支持基于数据表训练、术语训练等多种增强方式
## 技术架构
## 部分截图

## 系统架构
问数采用前后端分离的架构设计:
- **前端**:基于Vue.js构建的现代化交互界面
- **后端**:基于Spring Boot的Java微服务架构
- **插件化设计**:模块化的插件系统,便于扩展和定制
## 环境要求
| 环境/组件 | 版本要求 | 说明 |
|--------|-----------|--------|
| Node.js | ≥18 | JavaScript运行环境 |
| JDK | 17 | Java环境 |
| Lombok | IDE插件 | 代码简化插件 |
| Maven | 最新版 | 包管理工具 |
| Redis | 最新版 | 缓存库 |
| MySQL | 8.0 / 5.7 | 数据库 |
## 快速开始
### 后端部署
1. 克隆项目到本地
```bash
git clone https://github.com/your-org/wenshudb.git
cd wenshudb
```
2. 配置数据库
- 创建MySQL数据库
- 修改`wenshu-web-app/src/main/resources/application.yml`中的数据库连接信息
3. 编译打包
```bash
mvn clean package -DskipTests
```
4. 运行应用
```bash
java -jar wenshu-web-app/target/wenshu-web-app.jar
```
### 前端部署
1. 进入前端目录
```bash
cd wenshu-admin-web
```
2. 安装依赖
```bash
npm install
```
3. 开发模式运行
```bash
npm run dev
```
4. 生产环境构建
```bash
npm run build
```
## 模块说明
### 核心模块
- **wenshu-common**:基础通用规则模块
- **wenshu-plugin**:插件模块,包含各种功能插件
- **wenshu-plugin-api**:插件API接口模块
- **wenshu-web-app**:主启动模块
- **wenshu-admin-web**:前端管理界面
### 插件模块
- **wenshu-plugin-ai**:AI模型集成与管理
- **wenshu-plugin-auth**:认证与授权管理
- **wenshu-plugin-biz**:业务逻辑处理
- **wenshu-plugin-client**:客户端接口
- **wenshu-plugin-dev**:开发工具插件
- **wenshu-plugin-gen**:代码生成工具
- **wenshu-plugin-mobile**:移动端支持
- **wenshu-plugin-sys**:系统管理功能
## 主要功能
### 🔮 智能语义理解引擎 (NL2SQL)
基于先进的语义解析技术和上下文理解算法,将自然语言精准转化为结构化SQL查询。支持多表关联、嵌套子查询、聚合函数等复杂查询模式,实现95%+的转换准确率。独特的查询优化引擎确保生成的SQL语句性能最优,为企业级数据分析提供坚实基础。
### 🔗 全域数据源集成平台
采用分布式连接池架构,支持30+种主流数据库系统无缝接入,包括关系型、NoSQL、时序数据库等。专利级数据源适配技术确保毫秒级响应,支持跨源数据融合查询,打破数据孤岛。内置智能连接健康监测与自动故障转移,保障企业数据访问的高可用性。
### 🧠 多模态向量知识库
基于新一代向量数据库技术,支持Milvus、Pinecone、Weaviate等主流向量存储系统。采用分层索引结构和语义缓存机制,实现亚毫秒级的相似度检索。独创的向量压缩算法减少90%存储空间,同时保持检索质量。支持多模态数据(文本、图像、结构化数据)的统一向量化管理。
### 🤖 AI模型编排与调优中心
支持OpenAI、Anthropic、百度文心、讯飞星火等20+种大语言模型的统一接入与动态切换。专业的模型性能评测体系,智能路由确保最佳性价比。提供模型参数精细调优界面,支持模型混合调用策略,根据不同业务场景自动选择最优模型组合。内置模型调用成本控制与用量分析。
### 📊 企业级数据可视化工作台
基于WebGL渲染引擎,支持60+种专业数据图表及定制化可视化组件。内置数据异常智能检测与标记功能。支持千万级数据实时渲染,毫秒级交互响应。提供拖拽式仪表盘设计器,支持多维度数据钻取、联动分析。一键生成数据洞察报告,提供决策支持。
### 🚀 领域知识增强训练系统
独创的小样本学习框架,仅需少量标注数据即可实现模型定向微调。支持行业术语表、业务规则、查询模板等多种知识注入方式。内置知识冲突检测与自动调和机制。提供持续学习能力,系统使用过程中不断积累经验并自我进化,查询准确率随使用时间持续提升。
## 贡献指南
欢迎贡献代码或提出建议,请参阅[贡献指南](CONTRIBUTING.md)了解详情。
## 许可证
本项目采用 [Apache License 2.0](LICENSE) 许可证。
## 联系我们
如有问题或建议,请通过以下方式联系我们:
- 问题反馈:[GitHub Issues](https://github.com/your-org/wenshudb/issues)
- 邮箱:support@wenshudb.org
## 特别鸣谢
感谢以下开源社区和组织对本项目的支持与帮助:
- [Dromara开源社区](https://dromara.org/)
- [蚂蚁开源社区](https://opensource.antgroup.com/)
- [小诺开源技术](https://xiaonuo.vip/)