经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 大数据/云/AI » Hadoop » 查看文章
大数据及Hadoop的概述
来源:cnblogs  作者:给你一个公主抱  时间:2019/3/25 9:11:08  对本文有异议

一、大数据存储和计算的各种框架即工具

  1.存储:HDFS:分布式文件系统

        Hbase:分布式数据库系统

        Kafka:分布式消息缓存系统

  2.计算:Mapreduce:离线计算框架

        storm:实时流式计算

        spark:离线批处理/实时流处理计算框架(MR的二次封装)

  3.辅助类工具:hive:数据仓库工具

           flume:数据采集工具

           sqoop:数据迁移工具

 

二、大数据应用场景:

  典型应用:公司运营情况 =>典型网站:CNZZ、数据专家、友盟

  电商广告推荐系统:淘宝、京东、苏宁

    大量基于算法模型的运算,得出各种推荐结论

  天气预报等。。。

 

三、Hadoop的概述

  Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储。该库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,从而在计算机集群之上提供高可用性服务,每个计算机都可能容易出现故障。

  Hadoop中单个核心组件:

    分布式文件系统:HDFS =>实现存储在多台服务器之上

    分布式运行编程框架:Mapreduce=>实现在很多太机器的分布式并行计算框架

    分布式资源调度平台:Yarn=>帮助我们调度大量MR任务,并合理分配运算资源

原文链接:http://www.cnblogs.com/HelloBigTable/p/10578354.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号