# wenshudb **Repository Path**: Koyfin/wenshudb ## Basic Information - **Project Name**: wenshudb - **Description**: 问数(WenshuDB)是新一代企业级智能数据分析SaaS平台,融合大语言模型与向量数据库技术,提供从数据接入、分析到可视化的一站式智能数据服务,助力企业实现数据驱动的智能决策 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 26 - **Forks**: 8 - **Created**: 2025-03-12 - **Last Updated**: 2025-09-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: 大模型, AI, llm, 大数据, 人工智能 ## README # 问数(WenshuDB) ## 项目介绍 问数(WenshuDB)是面向企业级智能数据分析的新一代SaaS平台,采用先进的云原生架构和前沿AI技术,为企业提供智能数据洞察与决策支持。平台深度融合大语言模型(LLM)与向量数据库技术,通过创新的语义理解引擎和多模态数据处理能力,将复杂的数据分析需求转化为直观的自然语言交互体验。作为Text2SQL技术的新一代演进,问数平台整合了分布式计算、知识图谱、机器学习等前沿技术,配备完整的企业级安全与治理框架,为用户提供从数据接入、清洗、分析到可视化的一站式智能数据服务。凭借独创的向量压缩算法和混合模型调优技术,问数在保持高性能的同时大幅降低企业数据分析成本,是新一代企业数据智能的标杆之作。 ### 核心特性 - **多LLM模型支持**:支持多种大语言模型的无缝切换,满足不同场景需求 - **多数据源查询**:连接MySQL、PostgreSQL等多种数据库,统一查询接口 - **多向量库存储**:支持多种向量数据库的灵活切换 - **多向量模型切换**:适配不同的向量嵌入模型,优化语义理解 - **查询过程可观测**:全流程追踪,提供查询执行的透明度和可解释性 - **AI建表与取数**:智能创建数据表和提取数据,简化数据操作 - **数据管理与可视化**:直观的数据管理界面和丰富的可视化工具 - **多场景训练增强**:支持基于数据表训练、术语训练等多种增强方式 ## 技术架构

问数架构图

## 部分截图 ![输入图片说明](images/%E6%88%AA%E5%9B%BE1.png) ## 系统架构 问数采用前后端分离的架构设计: - **前端**:基于Vue.js构建的现代化交互界面 - **后端**:基于Spring Boot的Java微服务架构 - **插件化设计**:模块化的插件系统,便于扩展和定制 ## 环境要求 | 环境/组件 | 版本要求 | 说明 | |--------|-----------|--------| | Node.js | ≥18 | JavaScript运行环境 | | JDK | 17 | Java环境 | | Lombok | IDE插件 | 代码简化插件 | | Maven | 最新版 | 包管理工具 | | Redis | 最新版 | 缓存库 | | MySQL | 8.0 / 5.7 | 数据库 | ## 快速开始 ### 后端部署 1. 克隆项目到本地 ```bash git clone https://github.com/your-org/wenshudb.git cd wenshudb ``` 2. 配置数据库 - 创建MySQL数据库 - 修改`wenshu-web-app/src/main/resources/application.yml`中的数据库连接信息 3. 编译打包 ```bash mvn clean package -DskipTests ``` 4. 运行应用 ```bash java -jar wenshu-web-app/target/wenshu-web-app.jar ``` ### 前端部署 1. 进入前端目录 ```bash cd wenshu-admin-web ``` 2. 安装依赖 ```bash npm install ``` 3. 开发模式运行 ```bash npm run dev ``` 4. 生产环境构建 ```bash npm run build ``` ## 模块说明 ### 核心模块 - **wenshu-common**:基础通用规则模块 - **wenshu-plugin**:插件模块,包含各种功能插件 - **wenshu-plugin-api**:插件API接口模块 - **wenshu-web-app**:主启动模块 - **wenshu-admin-web**:前端管理界面 ### 插件模块 - **wenshu-plugin-ai**:AI模型集成与管理 - **wenshu-plugin-auth**:认证与授权管理 - **wenshu-plugin-biz**:业务逻辑处理 - **wenshu-plugin-client**:客户端接口 - **wenshu-plugin-dev**:开发工具插件 - **wenshu-plugin-gen**:代码生成工具 - **wenshu-plugin-mobile**:移动端支持 - **wenshu-plugin-sys**:系统管理功能 ## 主要功能 ### 🔮 智能语义理解引擎 (NL2SQL) 基于先进的语义解析技术和上下文理解算法,将自然语言精准转化为结构化SQL查询。支持多表关联、嵌套子查询、聚合函数等复杂查询模式,实现95%+的转换准确率。独特的查询优化引擎确保生成的SQL语句性能最优,为企业级数据分析提供坚实基础。 ### 🔗 全域数据源集成平台 采用分布式连接池架构,支持30+种主流数据库系统无缝接入,包括关系型、NoSQL、时序数据库等。专利级数据源适配技术确保毫秒级响应,支持跨源数据融合查询,打破数据孤岛。内置智能连接健康监测与自动故障转移,保障企业数据访问的高可用性。 ### 🧠 多模态向量知识库 基于新一代向量数据库技术,支持Milvus、Pinecone、Weaviate等主流向量存储系统。采用分层索引结构和语义缓存机制,实现亚毫秒级的相似度检索。独创的向量压缩算法减少90%存储空间,同时保持检索质量。支持多模态数据(文本、图像、结构化数据)的统一向量化管理。 ### 🤖 AI模型编排与调优中心 支持OpenAI、Anthropic、百度文心、讯飞星火等20+种大语言模型的统一接入与动态切换。专业的模型性能评测体系,智能路由确保最佳性价比。提供模型参数精细调优界面,支持模型混合调用策略,根据不同业务场景自动选择最优模型组合。内置模型调用成本控制与用量分析。 ### 📊 企业级数据可视化工作台 基于WebGL渲染引擎,支持60+种专业数据图表及定制化可视化组件。内置数据异常智能检测与标记功能。支持千万级数据实时渲染,毫秒级交互响应。提供拖拽式仪表盘设计器,支持多维度数据钻取、联动分析。一键生成数据洞察报告,提供决策支持。 ### 🚀 领域知识增强训练系统 独创的小样本学习框架,仅需少量标注数据即可实现模型定向微调。支持行业术语表、业务规则、查询模板等多种知识注入方式。内置知识冲突检测与自动调和机制。提供持续学习能力,系统使用过程中不断积累经验并自我进化,查询准确率随使用时间持续提升。 ## 贡献指南 欢迎贡献代码或提出建议,请参阅[贡献指南](CONTRIBUTING.md)了解详情。 ## 许可证 本项目采用 [Apache License 2.0](LICENSE) 许可证。 ## 联系我们 如有问题或建议,请通过以下方式联系我们: - 问题反馈:[GitHub Issues](https://github.com/your-org/wenshudb/issues) - 邮箱:support@wenshudb.org ## 特别鸣谢 感谢以下开源社区和组织对本项目的支持与帮助: - [Dromara开源社区](https://dromara.org/) - [蚂蚁开源社区](https://opensource.antgroup.com/) - [小诺开源技术](https://xiaonuo.vip/)