五步,三分钟搭建一个企业级大数据平台

2018-05-11 14:24:49 +08:00
 qingcloud

著名的 O'Reilly 公司断言:「数据是下一个 ‘ Intel Inside ’ ,未来属于利用数据并将其转换成产品的公司和人们。」

大数据隐含的巨大社会、经济价值已经引起了越来越多企业的关注,为了让用户获得更便捷、灵活、高效的大数据解决方案,减少海量数据分析、处理、查询的延迟,青云 QingCloud 基于 SparkMR 推出新一代可提供计算、存储、分析、查询一站式全方位的大数据服务 QingMR。

作为 SparkMR 的升级版本,QingMR 包含了 HDFS 分布式文件系统,Hadoop MapReduce 和 Spark 数据处理框架,YARN 集群资源调度系统和 Hive 数据仓库工具。同时,更近一步集成了极速海量数据 OLAP 引擎 Kyligence Analytics Platform (基于 Apache Kylin),实现海量数据极速分析及查询功能。

PS:当前支持的组件及版本如下:

QingMR 功能特点

灵活的计算模式选择

QingMR 在底层提供统一的 HDFS 作为数据存储引擎,在上层提供 Spark 及与 MapReduce 两种计算引擎,并提供 YARN 作为调度系统。用户可以轻松实现三种不同的计算模式,即 Spark Standalone、Spark on YARN 和 MapReduce on YARN 三者之间的切换。

极速海量数据查询

提供 PB 级数据集上的亚秒级查询能力。

与大数据及存储组件高可扩展性

QingMR 支持指定依赖服务的功能,即通过 AppCenter 2.0 框架内原生的应用感知机制,实现与其他大数据分析组件之间自动化的无缝集成。

QingMR 与 QingStor™ 对象存储平台也进行了预置集成,用户可以通过简单的配置即可开启对 QingStor™ 对象存储的支持,以应对海量大规模数据的存储问题。

定义调度器、代理用户等多租户功能的支持

QingMR 提供了 Spark 及 YARN 的自定义调度器的功能,开放了自定义 Hadoop 代理用户功能。

完善的服务级别监控

可视化展现整体服务的运行情况,提供监控告警、健康检查和服务自动恢复等功能。

强大的 AI 及数据科学开发环境

提供 **Python **及 R 两种语言的运行环境,支持 Python 2 和 Python 3 互相切换。 预置了多个 Anaconda 发行版的数据科学包,为数据科学和机器学习 /深度学习等 AI 开发场景。

QingMR 应用场景

流式数据处理

通过 QingMR Spark 计算引擎流数据处理能力,对企业实时数据流进行计算,满足对实效性要求较高计算,适用于实时监控、报警分析分等场景。

批量数据处理

通过 QingMR Hadoop MapReduce 提供强大的批量数据处理能力,帮助企业解决海量文件的分析处理问题,可用于日志分析等场景。

极速数据查询与分析

通过 QingMR 中集成的 Kyligence Analytics Platform,减少海量数据查询延迟,满足企业 OLAP 场景中极速分析查询的需求。

机器学习

基于 Spark 内存计算模型框架,利用 Mlib 提供的机器学习算法,实现个性化推荐、流失预测、精确营销、客户细分、客户研究、市场细分、价值评估等应用场景。

QingMR,企业大数据服务最佳选择

对企业来说,只需五步,即可在 3 分钟之内部署一套 QingMR 大数据服务来满足自身的各种需求,同时还可进行统一的数据管理,无论从成本还是效率来说,QingMR 都是企业大数据服务最佳选择。

未来,还会有更多基于 HDFS 的大数据应用被纳入到 QingMR 中,为用户提供功能更为强大、使用更加便捷的大数据服务。

2442 次点击
所在节点    推广
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/454062

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX