# wenshudb

**Repository Path**: Koyfin/wenshudb

## Basic Information

- **Project Name**: wenshudb
- **Description**: 问数(WenshuDB)是新一代企业级智能数据分析SaaS平台，融合大语言模型与向量数据库技术，提供从数据接入、分析到可视化的一站式智能数据服务，助力企业实现数据驱动的智能决策
- **Primary Language**: Unknown
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 26
- **Forks**: 8
- **Created**: 2025-03-12
- **Last Updated**: 2025-09-23

## Categories & Tags

**Categories**: Uncategorized

**Tags**: 大模型, AI, llm, 大数据, 人工智能

## README

# 问数(WenshuDB)

## 项目介绍

问数(WenshuDB)是面向企业级智能数据分析的新一代SaaS平台，采用先进的云原生架构和前沿AI技术，为企业提供智能数据洞察与决策支持。平台深度融合大语言模型(LLM)与向量数据库技术，通过创新的语义理解引擎和多模态数据处理能力，将复杂的数据分析需求转化为直观的自然语言交互体验。作为Text2SQL技术的新一代演进，问数平台整合了分布式计算、知识图谱、机器学习等前沿技术，配备完整的企业级安全与治理框架，为用户提供从数据接入、清洗、分析到可视化的一站式智能数据服务。凭借独创的向量压缩算法和混合模型调优技术，问数在保持高性能的同时大幅降低企业数据分析成本，是新一代企业数据智能的标杆之作。
### 核心特性

- **多LLM模型支持**：支持多种大语言模型的无缝切换，满足不同场景需求
- **多数据源查询**：连接MySQL、PostgreSQL等多种数据库，统一查询接口
- **多向量库存储**：支持多种向量数据库的灵活切换
- **多向量模型切换**：适配不同的向量嵌入模型，优化语义理解
- **查询过程可观测**：全流程追踪，提供查询执行的透明度和可解释性
- **AI建表与取数**：智能创建数据表和提取数据，简化数据操作
- **数据管理与可视化**：直观的数据管理界面和丰富的可视化工具
- **多场景训练增强**：支持基于数据表训练、术语训练等多种增强方式
## 技术架构
<p align="center">
  <img src="./images/text2sql-architecture.svg" alt="问数架构图" width="700">
</p>

## 部分截图

![输入图片说明](images/%E6%88%AA%E5%9B%BE1.png)

## 系统架构

问数采用前后端分离的架构设计：

- **前端**：基于Vue.js构建的现代化交互界面
- **后端**：基于Spring Boot的Java微服务架构
- **插件化设计**：模块化的插件系统，便于扩展和定制

## 环境要求

| 环境/组件 | 版本要求 | 说明 |
|--------|-----------|--------|
| Node.js | ≥18 | JavaScript运行环境 |
| JDK | 17 | Java环境 |
| Lombok | IDE插件 | 代码简化插件 |
| Maven | 最新版 | 包管理工具 |
| Redis | 最新版 | 缓存库 |
| MySQL | 8.0 / 5.7 | 数据库 |

## 快速开始

### 后端部署

1. 克隆项目到本地
   ```bash
   git clone https://github.com/your-org/wenshudb.git
   cd wenshudb
   ```

2. 配置数据库
   - 创建MySQL数据库
   - 修改`wenshu-web-app/src/main/resources/application.yml`中的数据库连接信息

3. 编译打包
   ```bash
   mvn clean package -DskipTests
   ```

4. 运行应用
   ```bash
   java -jar wenshu-web-app/target/wenshu-web-app.jar
   ```

### 前端部署

1. 进入前端目录
   ```bash
   cd wenshu-admin-web
   ```

2. 安装依赖
   ```bash
   npm install
   ```

3. 开发模式运行
   ```bash
   npm run dev
   ```

4. 生产环境构建
   ```bash
   npm run build
   ```

## 模块说明

### 核心模块

- **wenshu-common**：基础通用规则模块
- **wenshu-plugin**：插件模块，包含各种功能插件
- **wenshu-plugin-api**：插件API接口模块
- **wenshu-web-app**：主启动模块
- **wenshu-admin-web**：前端管理界面

### 插件模块

- **wenshu-plugin-ai**：AI模型集成与管理
- **wenshu-plugin-auth**：认证与授权管理
- **wenshu-plugin-biz**：业务逻辑处理
- **wenshu-plugin-client**：客户端接口
- **wenshu-plugin-dev**：开发工具插件
- **wenshu-plugin-gen**：代码生成工具
- **wenshu-plugin-mobile**：移动端支持
- **wenshu-plugin-sys**：系统管理功能

## 主要功能

### 🔮 智能语义理解引擎 (NL2SQL)

基于先进的语义解析技术和上下文理解算法，将自然语言精准转化为结构化SQL查询。支持多表关联、嵌套子查询、聚合函数等复杂查询模式，实现95%+的转换准确率。独特的查询优化引擎确保生成的SQL语句性能最优，为企业级数据分析提供坚实基础。

### 🔗 全域数据源集成平台

采用分布式连接池架构，支持30+种主流数据库系统无缝接入，包括关系型、NoSQL、时序数据库等。专利级数据源适配技术确保毫秒级响应，支持跨源数据融合查询，打破数据孤岛。内置智能连接健康监测与自动故障转移，保障企业数据访问的高可用性。

### 🧠 多模态向量知识库

基于新一代向量数据库技术，支持Milvus、Pinecone、Weaviate等主流向量存储系统。采用分层索引结构和语义缓存机制，实现亚毫秒级的相似度检索。独创的向量压缩算法减少90%存储空间，同时保持检索质量。支持多模态数据（文本、图像、结构化数据）的统一向量化管理。

### 🤖 AI模型编排与调优中心

支持OpenAI、Anthropic、百度文心、讯飞星火等20+种大语言模型的统一接入与动态切换。专业的模型性能评测体系，智能路由确保最佳性价比。提供模型参数精细调优界面，支持模型混合调用策略，根据不同业务场景自动选择最优模型组合。内置模型调用成本控制与用量分析。

### 📊 企业级数据可视化工作台

基于WebGL渲染引擎，支持60+种专业数据图表及定制化可视化组件。内置数据异常智能检测与标记功能。支持千万级数据实时渲染，毫秒级交互响应。提供拖拽式仪表盘设计器，支持多维度数据钻取、联动分析。一键生成数据洞察报告，提供决策支持。

### 🚀 领域知识增强训练系统

独创的小样本学习框架，仅需少量标注数据即可实现模型定向微调。支持行业术语表、业务规则、查询模板等多种知识注入方式。内置知识冲突检测与自动调和机制。提供持续学习能力，系统使用过程中不断积累经验并自我进化，查询准确率随使用时间持续提升。


## 贡献指南

欢迎贡献代码或提出建议，请参阅[贡献指南](CONTRIBUTING.md)了解详情。

## 许可证

本项目采用 [Apache License 2.0](LICENSE) 许可证。

## 联系我们

如有问题或建议，请通过以下方式联系我们：

- 问题反馈：[GitHub Issues](https://github.com/your-org/wenshudb/issues)
- 邮箱：support@wenshudb.org

## 特别鸣谢

感谢以下开源社区和组织对本项目的支持与帮助：

- [Dromara开源社区](https://dromara.org/) 
- [蚂蚁开源社区](https://opensource.antgroup.com/) 
- [小诺开源技术](https://xiaonuo.vip/)