溢之

@tonglai

溢之 暂无简介

组织

所有star的仓库都会放在这里。可以根据需求创建不同的星选集来管理它们。

    214 anolis/sysom

    致力于打造一个集主机管理、配置部署、监控报警、异常诊断、安全审计等一系列功能的自动化运维平台。 探索创新的sysAK、ossre诊断工具及高效的LCC(Libbpf Compiler Collection)开发编译平台和netinfo网络抖动问题监控系统等, 实现系统问题的快速上报、分析与解决,提升集群的全自动运维效率,构建大规模集群运维生态链。

    最近更新: 10个月前

    1.1K 科学大数据开源社区/PiFlow GVP

    混合型科学大数据流水线系统,包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能

    最近更新: 1年前

    910 jitamin/jitamin GVP

    Jitamin是一款免费、开源,使用PHP语言开发的项目管理系统。QQ群:656868

    最近更新: 1年多前

    3 HuaweiCloudDeveloper/huaweicloud-solution-build-an-ERP-based-on-odoo

    该解决方案可以帮助用户在华为云上基于开源Odoo 软件快速构建高可用架构的ERP系统,该方案具备跨可用区及流量分发的特性,并具备跨可用区故障容灾的能力,满足公司绝大多数应用需求。

    最近更新: 1年多前

    2 DaLake/Delta Lake

    Delta Lake是一个开源项目,可以在数据湖之上构建Lakehouse架构。Delta Lake 提供 ACID 事务、可扩展的元数据处理,并在现有数据湖(如 S3、ADLS、GCS 和 HDFS)之上统一流和批处理数据处理。 具体而言,Delta Lake提供: Spark 上的 ACID 事务:可序列化的隔离级别可确保读取器永远不会看到不一致的数据。 可扩展的元数据处理:利用 Spark 分布式处理能力轻松处理包含数十亿文件的 PB 级表的所有元数据。 流式处理和批处理统一:Delta Lake 中的表是批处理表以及流式处理源和接收器。流数据引入、批量历史回填、交互式查询都开箱即用。 架构强制:自动处理架构变体,以防止在引入期间插入不良记录。 时间旅行:数据版本控制支持回滚、完整的历史审计跟踪和可重现的机器学习实验。 更新插入和删除:支持合并、更新和删除操作,以实现复杂的用例,如更改数据捕获、缓慢更改维度 (SCD) 操作、流式更新插入等。

    最近更新: 接近2年前

    1 DaLake/Kyuubi

    数据湖上的 Serverless SQL Apache Kyuubi (Incubating),一个分布式和多租户网关,用于在 Lakehouse 上提供 Serverless SQL。

    最近更新: 接近2年前

    2 DaLake/Kylin

    Apache Kylin是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的表。Kylin 是一个开源的的分布式的,针对大数据场景下的高性能分析型数据仓库。在 Kubernetes 集群上部署 Kylin,可以减少 Kylin 集群维护和扩容的代价。

    最近更新: 接近2年前

    36 LinkTime-Cloud/big-data-on-k8s

    智领云研发团队在大数据平台云原生化的开发过程中,通过对开源大数据组件的扩展和集成,实现了传统大数据平台到K8s的平稳迁移。在这个项目中,我们将HDFS、Hive、Spark operator、和Kafka Operator这些大数据组件的部署方式共享出来,开发者可以基于这个项目部署一个实验的大数据集群来体验一下云原生大数据平台。

    最近更新: 接近2年前

    16 ACK Distro/ACK Distro

    ACK Distro作为完整的Kubernetes发行版,通过阿里巴巴开源的应用打包交付工具Sealer,可以简单、快速地交付到离线环境,帮助使用者更简单、敏捷地管理自己的集群。核心组件同时支持X86和ARM硬件架构,所包含的高性能网络插件Hybridnet,可以确保ACK Distro能够丝滑运行于多样化的基础设施之上。

    最近更新: 接近2年前

    3 DaLake/Hudi

    Apache Hudi(发音为“hoodie”)是下一代流数据湖平台。Apache Hudi将核心仓库和数据库功能直接引入数据湖。Hudi 提供表、事务、高效的更新插入/删除、高级索引、流式引入服务、数据聚类/压缩优化和并发性,同时以开源文件格式保留数据。 Apache Hudi不仅非常适合流工作负载,而且还允许您创建高效的增量批处理管道。阅读文档以获取更多用例描述,并查看谁在使用Hudi,以了解世界上一些最大的数据湖(包括Uber,Amazon,ByteDance,Robinhood等)如何通过Hudi改变其生产数据湖。 Apache Hudi可以很容易地在任何云存储平台上使用。Hudi的高级性能优化,使分析工作负载与任何流行的查询引擎,包括Apache Spark,Flink,Presto,Trino,Hive等更快。

    最近更新: 2年前

搜索帮助