课程表

大数据/云/AI课程

工具箱
速查手册

大数据/云/AI教程

当前位置:免费教程 » 大数据/云/AI
Hadoop

Hadoop是一个用Java编写的Apache开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。

Hadoop框架工作的应用程序在跨计算机集群提供分布式存储和计算的环境中工作。

Hadoop旨在从单个服务器扩展到数千个机器,每个都提供本地计算和存储。

开始学习Hadoop!


Apache Pig

Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。

Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

开始学习Apache Pig!


Apache Kafka

Apache Kafka起源于LinkedIn,后来于2011年成为开源Apache项目,然后于2012年成为First-class Apache项目。

Kafka是用Scala和Java编写的。

Apache Kafka是基于发布订阅的容错消息系统。

开始学习Apache Kafka


Apache Storm

Apache Storm是一个分布式实时大数据处理系统。

Storm设计用于在容错和水平可扩展方法中处理大量数据。

它是一个流数据框架,具有最高的摄取率。

开始学习Apache Storm


Impala

Impala是Apache Hadoop的开源,本地分析数据库。

它由Cloudera,MapR,Oracle和Amazon等供应商提供。

本教程中提供的示例一直使用Cloudera Impala进行开发。

开始学习Impala


ZooKeeper是一种分布式协调服务,用于管理大型主机。

Zookeeper作为Hadoop和Hbase的重要组件,可以为分布式应用程序协调服务,同时还能使用Java和C的接口。

开始学习Zookeeper


SAS是商业分析的领导者。通过创新的分析它迎合了商业智能和数据管理软件和服务。SAS将数据转化为洞察力,可以给商业一个全新的视角。

不同于市面上其他BI工具,SAS需要一个广泛的编程方法,数据转换和分析,而不是一个纯粹的拖放和连接方式。这使得它在人群中脱颖而出,因为它给出了数据操作更精细的控制。

开始学习SAS!

转载本站内容时,请务必注明来自W3xue。
部分原创内容未经授权禁止转载,违者必究。