hadoop

hadoop专题教程,深入浅出带你学习hadoop,让你快速入门学习hadoop,分享hadoop学习笔记实录。

视频教程 尚学堂_肖斌_hadoop经典视频教程

2016-11-07
尚学堂_肖斌_hadoop经典视频教程 Hadoop是一个能够对大量数据进行分布式处理的软件框架。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理。 Hadoop是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。
分类:hadoop 浏览次数(518)

视频教程 最新hadoop2.x视频教程下载

2015-08-18
网络上现在很多视频都是hadoop1.x的。 如果要下载1.x的可以点击以下链接下载,或者直接搜索 http://www.656463.com/search/?word=hadoop Hadoop实战清晰视频教程 本视频是尚学堂最新录制的hadoop2.x免费视频教程,希望对大家有所帮助 课程目录: 01_尚学堂_肖斌_hadoop_hdfs1分布式文件系统01 02_尚学堂_肖斌_hadoop
分类:hadoop 浏览次数(2847)

MapReduce与yarn的理解与区别

2015-07-28
一.Hadoop1.0中MapReduce的组成 1.从功能模块角度 客户端:提交MapReduce作业; JobTracker: 1.作业调度:将一个作业(Job)分成若干个子任务分发到taskTraker中去执行 2.任务监控:TaskTracker发送心跳给JobTracker报告自己的运行状态,以让JobTracker能够监控到他 3.资源管理:每个任务向JobTrac
分类:hadoop 浏览次数(2084)

视频教程 Hadoop实战清晰视频教程

2015-07-04
adoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。
分类:hadoop 浏览次数(1937)

视频教程 大数据及hadoop是什么? 有什么用?

2015-03-07
在云计算和大数据大行其道的今天,Hadoop及其相关技术起到了非常重要的作用,是这个时代不容忽视的一个技术平台。无论你身在互联网企业还是传统软件公司,都应该了解和学习这门技术
分类:hadoop 浏览次数(1102)

基于Oracle VM VirtualBox虚拟机配置-书生学习大数据系列教程

2014-12-15
创建3台虚拟机 master:192.168.56.101 slave1:192.168.56.102 slave2:192.168.56.103 1.设置虚拟机的(Oracle VM VirtualBox)的网卡 在这里,给每台机器添加了两个网卡 网卡1是仅主机(Host-Only)适配器,内网集群用 网卡2是网络地址转换(NAT),让虚拟机能访问外网 2.修改每台虚拟机的主机名 vim /et
分类:hadoop 浏览次数(1371)

hadoop2.2入门初步-hadoop2.x系列学习笔记一

2014-08-13
由于工作的原因,这个季度必须认真学习hadoop2.2了,自己的个人时间不是很多,学一点分享一点. 1.下载hadoop 2.2 下载地址:http://www.apache.org/dyn/closer.cgi/hadoop/common/ 2.2的下载地址:http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.2.0/ 我这里下载的是ha
分类:hadoop 浏览次数(1366)

使用Linux 和Hadoop 进行分布式计算[图文]

2013-09-28
人们每天都依赖搜索引擎以从 Internet 的海量数据中找到特定的内容,但您曾经想过这些搜索是如何执行的吗?一种方法是 Apache 的 Hadoop,它是一个能够对海量数据进行分布式处理的软件框架。Hadoop 的一个应用是并行索引 Internet Web 页面。Hadoop 是一个受到 Yahoo!、Google 和 IBM 等公司支持的 Apache 项目。本文将介绍 Hadoop 框架
分类:hadoop 浏览次数(1370)

用 Linux 和 Apache Hadoop 进行云计算

2013-09-28
IBM?、Google、VMWare 和 Amazon 等公司已经开始提供云计算产品和战略。本文讲解如何使用 Apache Hadoop 构建一个 MapReduce 框架以建立 Hadoop 集群,以及如何创建在 Hadoop 上运行的示例 MapReduce 应用程序。还将讨论如何在云上设置耗费时间/磁盘的任务。 云计算简介 近来云计算越来越热门了,云计算已
分类:hadoop 浏览次数(1202)

在Linux单机上运行Hadoop-0.20.0实例

2013-09-28
其实,Hadoop-0.20.0与Hadoop-0.19.0的入门运行非常相似,基本步骤都是相同的。不同的是:Hadoop-0.19.0的配置文件hadoop-site.xml中内容,在Hadoop-0.20.0的配置中进行了拆分,分别放在三个配置文件中,如下: 1、core-site.xml配置文件 内容配置如下所示: <?xml version="1.0"?
分类:hadoop 浏览次数(1239)

Linux单机运行hadoop平台

2013-09-28
Hadoop-0.19.2的代码可以到Apache上下载,使用的Linux机器是RHEL 5,Linux上安装的Java版本为1.6.0_16,并且JAVA_HOME=/usr/java/jdk1.6.0_16 实践过程 1、ssh无密码验证登陆localhost 保证Linux系统的ssh服务已经启动,并保证能够通过无密码验证登陆本机Linux系统。如果不能保证,可以按照如下的步骤去做: (1)
分类:hadoop 浏览次数(1368)

利用JavaAPI访问HDFS的文件

2013-09-28
1、重读配置文件core-site.xml 要利用Java客户端来存取HDFS上的文件,不得不说的是配置文件Hadoop-0.20.2/conf/core-site.xml了,最初我就是在这里吃了大亏,所以我死活连不上HDFS,文件无法创建、读取。 <?xml version="1.0"?> <?xml-stylesheet type="text/x
分类:hadoop 浏览次数(1129)

Linux CentOS下Hadoop伪分布模式安装笔记

2013-09-28
一. 概要 经过几天的调试,终于在Linux Cent OS 5.0下成功搭建Hadoop测试环境。本次测试在一台服务器上进行伪分布式搭建。Hadoop 伪分布式模式是在单机上模拟 Hadoop 分布式,单机上的分布式并不是真正的伪分布式,而是使用线程模拟分布式。Hadoop 本身是无法区分伪分布式和分布式的,两种配置也很相似,唯一不同的地方是伪分布式是在单机器上配置,数据节点和名
分类:hadoop 浏览次数(1258)

CentOS 5.5 下配置Hadoop 0.21单节点

2013-09-28
主要参考Apache官方文档http://hadoop.apache.org/common/docs/r0.21.0/single_node_setup.html 唯一注意的是对于CentOS默认安装后的主机名问题,默认主机名为bogon,需要在/etc/hosts中加入如下一行: 127.0.0.1 bogon.localdomain bogon 运行bin/Hadoop namenode
分类:hadoop 浏览次数(1182)

CentOS 5.5下scribe写入数据到HDFS配置方法

2013-09-28
1按照CentOS 5.5 下配置Hadoop 0.21单节点 一文中的方法配置Hadoop 2编译scribe,支持hdfs 2.1下载thrift,libevent,boost等库,可以都下载最新版本,基本上都是make & make install 2.2下载最新版scribe-2.2,之前在网上看到说scribe有很多bug,必须在当前开发版本才能写入HDFS,试了好久没成功,也以
分类:hadoop 浏览次数(1275)
1 2 3 4 5 6 7 8 9 10

专题教程

更多
  • hadoop教程

    hadoop教程

    hadoop专题主要是分享hadoop教程,hadoop学习笔记,hbase等,让你能快速入门hadoop编程,加入大数据行业。

  • hadoop、hbase、hive、spark、strom等视频教程

    hadoop、hbase、hive、spark、strom等视频教程

    本专题收集大数据相关的视频教程,包括hadoop视频教程、hbase视频教程、hive视频教程、spark视频教程、strom视频教程等

大家都在看

热门访问