69
Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用.
Java
8年多前
69
罗盘是一个大数据任务诊断平台,旨在提升用户排查问题效率,降低用户异常任务成本。 其主要功能特性如下: 非侵入式,即时诊断,无需修改已有的调度平台,即可体验诊断效果。 支持多种主流调度平台,例如DolphinScheduler、Airflow或自研等。 支持多版本Spark、Hadoop 2.x和3.x 任务日志诊断和解析。 支持工作流层异常诊断,识别各种失败和基线耗时异常问题。
3个月前
68
大数据实时流的计算框架
Scala
接近8年前
65
Apache Spark的性能表现受到配置参数的影响,这些参数的调优往往由人力完成,然而不适当的参数配置可能严重地降低系统的性能表现。 本工具能够根据历史记录自动调整Apache spark的参数设置
Java
接近6年前
1020923 bluejoe 1578938480
61
可配置图形化大数据流水线系统,包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能
Scala
接近8年前
59
云原生大数据分析 Lakehouse 是一个兼容主流云厂商对象存储的一站式 Serverless 融合大数据处理分析服务,帮助用户快速进行数据湖探索,洞察业务价值。
Java
3年前
49
一门面向大数据和AI的语言 一个真正整合数据管理,商业分析,机器学习的统一平台
Java
1年多前
6892317 apache 1605059459
48
Hive是一个基于Hadoop的数据仓库平台
Java
8小时前
12303739 baihai idp 1690958128
47
IDP 是一款面向数据科学家和大数据工程师的开源 AI IDE。
47
Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。
Java
接近5年前
319685 bboss 1578989326
47
hbase-elasticsearch数据同步工具 支持hbase到elasticsearch、hbase到数据库、hbase到kafka、hbase到excel文件、hbase到文本文件以及hbase到ftp/sftp文件数据采集、上报
Java
1个月前
44
LakeSoul 端到端实时湖仓框架 Github 官方镜像 https://github.com/lakesoul-io/LakeSoul
Scala
1个月前
6892317 apache 1605059459
44
Hudi 于 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题
Java
8小时前
43
OSSEAN是一个全球开源软件实时分析监测系统,通过对全球主流开源社区进行持续数据实时采集和跨社区深度关联分析,提供开源项目检索、评估和排行等服务。
Java
接近5年前
6892317 apache 1605059459
39
Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案
Java
3个月前

搜索帮助