学海网 文档下载 文档下载导航
设为首页 | 加入收藏
搜索 请输入内容:  
 导航当前位置: 文档下载 > 所有分类 > IT/计算机 > 互联网 > 百亿级实时大数据分析项目,为什么不用Hadoop?

百亿级实时大数据分析项目,为什么不用Hadoop?

百亿级实时大数据分析项目,为什么不用Hadoop?

百亿数量级的大数据项目,软硬件总体预算只有30万左右,需求是进行复杂分析查询,性能要求多数分析请求达到秒级响应。

遇到这样的项目需求,预算不多的情况,似乎只能考虑基于Hadoop来实施。 理论上Hadoop撑住百亿数量级没问题,但想要秒级响应各种查询分析就不行了。我们先大概分析一下Hadoop的优缺点。

Hadoop

Hadoop目前几乎是大数据的代名词,很多企业都基于Hadoop搭建自己的大数据业务。

以下是Hadoop的主要优点:

1. Hadoop集群的扩展性是其一大特点,Hadoop可以扩展至数千个节点,对数据持续增长,数据量特别巨大的需求很合适。

2. Hadoop的成本是其另一大优势,由于Hadoop是开源项目,而且不仅从软件上节约成本,硬件上的要求也不高。目前去IOE潮流风行,低成本的Hadoop也是一大推手。

3. Hadoop生态群活跃,其周边开源项目丰富,HBase, Hive,Impala等等基础开源项目众多。

那么Hadoop的不足有哪些呢?

Hadoop不适合做实时分析系统。

1. 从通讯层的技术上来说有如下原因:

任务分配Server不会将信息Push到计算Node,而是让计算Node通过心跳去Pull任务。

基于框架的通用性,MapReduce代码也会在HDFS中传送,在各计算Node展开,再通过启动新JVM进程装载并运行。

类似的JVM进程启停有5、6次之多。

Reduce Task只能在全部Map Task完成之后才能启动。

2. 缺乏专业的支持服务

因为是开源项目,缺少专业的商业支持服务,公司需要储备专业Hadoop知识的专家来保证系统的正常运转。

3. Hadoop可以支持百亿的数据量,但很难应对秒级响应的需求

即使是数亿的数据量,Hadoop也只适合做分钟级别的离线分析系统。

而百亿级别数据量,又需要秒级响应的案例,需要什么系统支持呢?下面介绍下大数据实时分析工具Yonghong Z-Suite。

Yonghong Z-Suite

除了提供优秀的前端BI工具之外,Yonghong Z-Suite让用户可以选购分布式数据集市来支持实时大数据分析。

对于这种百亿级的大数据案例,Yonghong Z-Suite有哪些技术可以保证大数据的实时响应呢?下面大致从技术上介绍下:

库内计算(In-Database Computing)

第1页

TOP相关主题

  • hadoop
  • hadoop权威指南
  • hadoop 安装
  • hadoop视频教程
  • hadoop实战
  • hadoop是什么
  • hadoop下载
  • apache hadoop

我要评论

相关文档

  • 不用Hadoop百亿级大数据方案

    不用Hadoop 的百亿级大数据方案_计算机软件及应用_IT/计算机_专业资料。百亿级实时大数据分析项目,为什么用 Hadoop? 百亿数量级的大数据项目,软硬件总体预算只有...

  • 大数据分析Hadoop工具应用

    的S4) Hadoop项目介绍 Hadoop最先是由Apache公司在2005年引入的,起源于google...为什么需要分布式文件系统? 高扩展能力:HDFS采用元数据中心化管理,然后通过客户端...

  • hadoop项目实例教程 hadoop大数据处理06.分布式数据库...

    基于Greenplum Hadoop 分布式平台的大数据解决方案 分布式数据库存储及查询处理 Greenplum Hadoop 讲师:迪伦(北风网版权所有) 课程目标 ? 分布存储 ? 表分布的策略-...

  • 福布斯:Hadoop—你不得不了解的大数据工具

    Hive 和 Pig 等技术也经常 被提到,但是他们都有什么功能,为什么会需要奇怪的...Hadoop 项目再从初期发展的成熟的 过程中同时吸纳了一些其他的组件,以便进一步...

  • 适合使用Hadoop的场景

    所以你需要问自己: 你的用户和分析人员期望的数据访问的交互性和实时性要求是...(译者注:Apache Hive 是 Hadoop 生态系统中的一个开源项目,其主要目的是在 ...

  • hadoop入门-详实步骤助力 it 经理充分利用大数据分析能力

    经理充分利用大数据分析能力 为何阅读本文档 本规划指南为 IT 经理提供了重要信息和实施步骤,以帮助他们对大数据分 析项目进行规划和实施,并着手开始使用 Hadoop*...

  • 大数据应用分析(Hadoop)

    大数据应用分析(Hadoop)_计算机硬件及网络_IT/...为138.3%的飞 跃,到2016年,整个市场规模逼近百亿...Hadoop项目的 总称,主要是由分布式存储(HDFS)、...

  • 吴朱华:如何实现秒级对大数据实时分析

    使用的工具:R,Hadoop Mahout。 为什么需要实时分析? ? 数据是有 ? 催生新的 ...? ? 一个 专注产品,专注核心技术的团队 一切从开源 小项目 开始 一起携手...

  • Hadoop高级编程__构建与实现大数据解决方案---部分

    他在Hadoop/Big Data环境中为 不同的公司和项目...我们以过去无法做到的方式,在进行复杂数据分析方面...那么,为什么 还要编写本书呢?当我们开始使用 Hadoop...

  • 基于Hadoop大数据应用分析

    为138.3%的飞 跃,到2016年,整个市场规模逼近百亿...Hadoop项目的 总称,主要是由分布式存储(HDFS)、...基于HADOOP大数据行业应用分析 5.东软基于HADOOP的...

站点地图 | 文档上传 | 侵权投诉 | 手机版
新浪认证  诚信网站  绿色网站  可信网站   非经营性网站备案
本站所有资源均来自互联网,本站只负责收集和整理,均不承担任何法律责任,如有侵权等其它行为请联系我们.
文档下载 Copyright 2013 doc.xuehai.net All Rights Reserved.  email
返回顶部