《Hadoop实战第2版》——1.1节什么是Hadoop

  • 时间:
  • 浏览:1

1.1.1 Hadoop概述

Hadoop是Apache软件基金会旗下的4个 开源分布式计算平台。以Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等优点允许用户将Hadoop部署在低廉的硬件上,形成分布式系统;MapReduce分布式编程模型允许用户在不了解分布式系统底层细节的状态下开发并行应用tcp连接池池。很多很多用户需用利用Hadoop轻松地组织计算机资源,从而搭建自己的分布式计算平台,否则需用充分利用集群的计算和存储能力,完成海量数据的补救。经过业界和学术界长达10年的锤炼,目前的Hadoop 1.0.1