Tag 大数据 search results

article

activity

member

department

organization

CPyUG社区

云计算大数据机器学习

是CPyUG在各个城市自发组织的一种本地Py爱好者线下进行的技术交流活动,主要在北京和上海已经进行了3年多,从08年起珠三角/南昌/安徽/武汉各地也相继开展

蟒营®社区

云计算大数据机器学习

开源网络课程框架, 以 Pythonic 式自学心理范式为根据, 拓展各种领域学习社区

ChunJun项目

大数据

ChunJun是一个基于Flink 提供易用、稳定、高效的批流统一的数据集成工具,既可以采集静态的数据,比如MySQL,HDFS等,也可以采集实时变化的数据,比如binlog,Kafka等。同时ChunJun也是一个支持原生FlinkSql所有语法和特性的计算框架。目前ChunJun在实际应用过程中已服务了上百家客户,经过多次迭代与沉淀,积累了大量的客户案例。 ChunJun主要应用于大数据开发平台的数据同步/数据集成模块,通常采用将底层高效的同步插件和界面化的配置方式相结合的方式,使大数据开发人员可简洁、快速的完成数据同步任务开发,实现将业务数据库的数据同步至大数据存储平台,从而进行数据建模开发,以及数据开发完成后,将大数据处理好的结果数据同步至业务的应用数据库,供企业数据业务使用。

Apache Linkis(Incubating)社区

大数据

Apache Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/Hive/Presto/Flink 等底层引擎,同时实现变量、脚本、函数和资源文件等用户资源的跨上层应用互通。 作为计算中间件,Linkis 提供了强大的连通、复用、编排、扩展和治理管控能力。通过计算中间件将应用层和引擎层解耦,简化了复杂的网络调用关系,降低了整体复杂度,同时节约了整体开发和维护成本。

JuiceFS项目

云计算大数据机器学习

Juicedata 是 JuiceFS 项目的主要维护者,成立于 2019 年。并组建了 JuiceFS 社区目前已有数千名开发者加入到社区,JuiceFS 社区每月都会组织或参与丰富的社区活动。

Taier项目

大数据

Taier是袋鼠云数栈大数据家族的开源项目之一 ,于2022年2月22日正式在github上开源,它是一个分布式可视化的DAG任务调度系统,旨在降低ETL开发成本、提高大数据平台稳定性,让大数据开发人员可以在Taier直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。

ChengYing项目

大数据

ChengYing(承影)作为一站式全自动化全生命周期大数据平台运维管家,提供大数据产品的一站式部署、运维、监控服务,其可实现产品部署、产品升级、版本回滚、扩缩节点、日志诊断、集群监控、实时告警等功能,致力于最大化节省运维成本,降低线上故障率与运维难度,为客户提供安全稳定的产品部署与监控。

OpenCT项目

大数据开源教育

OpenCT社区是由北师大教育学博士罗海风(现清华大学教育研究院助理研究员),以5C核心素养模型为理论框架,创立的指向学生核心素养的在线交互式学、练、评、测教育开源社区,是国内唯一的基础教育领域的开源社区,目前已在全国范围内拥有15万+的用户,在中国教育报、中国教师报、等媒体进行了报道。

语音之家社区

大数据微服务开源教育

语音之家是助力AI语音开发者学习和成长的社区,致力于为开发者打造专业技术交流与分享的平台,提供技术论坛、在线学习、资源下载、职业发展等全生命周期服务。

Apache Doris社区

数据库大数据

Apache Doris 是一款基于 MPP 的现代化、高性能、实时的分析型数据库。以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。 2022 年 6 月 16 日,Apache Doris 正式从 Apache 孵化器毕业,成为顶级项目。目前 Apache Doris 社区已经聚集了 340 余位贡献者,社区用户人数超过 5000+ 。在全球范围内获得超过 500+ 家企业的应用,在中国市值或估值排行前 50 的互联网公司中,有超过 80% 的公司长期使用 Apache Doris,同时在一些传统行业如金融、能源、制造、电信等领域也有着丰富的应用。