課程目錄 :
(內容與授課時間) 授課總時數:
16:31:24
簡 介:
Hadoop是一個分佈式系統基礎架構,由Apache基金會開發。用戶可以在不瞭解分佈式底層細節的情況下,開發分佈式程序。充分利用集群的威力高速運算和存儲。Hadoop實現了一個分佈式文件系統(Hadoop
Distributed File System),簡稱HDFS。HDFS有著高容錯性的特點,並且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(high
throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data
set)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streaming
access)文件系統中的數據。
Hadoop 是一個能夠對大量數據進行分佈式處理的軟件框架。但是 Hadoop
是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop
是可靠的,因為它假設計算元素和存儲會失敗,因此它維護多個工作數據副本,確保能夠針對失敗的節點重新分布處理。Hadoop
是高效的,因為它以並行的方式工作,通過並行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop
依賴於社區服務器,因此它的成本比較低,任何人都可以使用。
Hadoop這個開源產品的出現,打破了對數據力量的壓制。Hadoop源於Nutch這個小型的搜索引擎項目。而Nutch則出自於著名的開源搜索引擎解決方案Lucene,而Lucene則來源於對Google的學習模仿。在Hadoop身上有著明顯的Google的影子。HDFS是GFS的山寨版,Map-Reduce的思想來源於Goolge對Page
rank的計算方法,HBase模仿的是Big Table,Zookeeper則學習了Chubby。Google巨人的力量儘管由於商業的原因被層層封鎖,但在Hadoop身上得到了完美的重生和發展。
課程大綱:
1、 Hadoop的源起與體系介紹
2、 實施Hadoop 1.x和2.x集群,基於win的部署
3、 分佈式文件系統HDFS原理與操作,HDFS API編程
4、 2.x下HDFS新特性,高可用,聯邦,快照
5、 Map-Reduce原理、體系架構和工作機制,Hadoop流,M-R編程實戰,eclipse與Hadoop集群連接
6、 Map-Reduce複雜應用案例
7、 新一代計算框架YARN
8、 Pig安裝與Pig Latin語言,應用案例
9、 Hive體系架構、安裝與HiveQL,應用案例
10、 數據挖掘神器Mahout
11、 HBase與Zookeeper體系架構
12、 HBase集群安裝,管理
13、 HBase數據模型,實戰案例建模剖析
14、 數據集成Sqoop,Flume,Chukwa,商業數據庫和Hadoop集群的連接
15、 與應用連接,REST和Thrift接口,UDF實戰,RHadoop
16、 進軍Hadoop源代碼
17、 企業級集群實施,Hadoop在互聯網企業中的應用案例
課程列表:
第01講 Hadoop的源起與體系介紹 →時長: 00:32:18
第02講 Hadoop的源起與體系介紹 →時長: 00:36:27
第03講 Hadoop的源起與體系介紹 →時長: 00:44:55
第04講 實施Hadoop集群 →時長: 00:22:56
第05講 實施Hadoop集群 →時長: 00:29:48
第06講 實施Hadoop集群 →時長: 00:25:31
第07講 分佈式文件系統HDFS,大數據存儲實戰 →時長: 00:28:05
第08講 分佈式文件系統HDFS,大數據存儲實戰 →時長: 00:32:44
第09講 分佈式文件系統HDFS,大數據存儲實戰 →時長: 00:30:10
第10講 Map-Reduce體系架構 →時長: 00:27:32
第11講 Map-Reduce體系架構 →時長: 00:14:16
第12講 Map-Reduce體系架構 →時長: 00:25:09
第13講 Map-Reduce數據分析之一,API實戰 →時長: 00:16:31
第14講 Map-Reduce數據分析之一,API實戰 →時長: 00:23:33
第15講 Map-Reduce數據分析之一,API實戰 →時長: 00:14:23
第16講 Map-Reduce數據分析之二,Hadoop流,應用案例 →時長: 00:25:20
第17講 Map-Reduce數據分析之二,Hadoop流,應用案例 →時長: 00:26:11
第18講 Map-Reduce數據分析之二,Hadoop流,應用案例 →時長: 00:15:46
第19講 Map-Reduce數據分析之二,Hadoop流,應用案例 →時長: 00:21:30
第20講 HBase體系架構與安裝 →時長: 00:17:29
第21講 HBase體系架構與安裝 →時長: 00:20:20
第22講 HBase體系架構與安裝 →時長: 00:26:16
第23講 HBase體系架構與安裝 →時長: 00:12:21
第24講 HBase數據分析與建模,實戰案例剖析 →時長: 00:21:33
第25講 HBase數據分析與建模,實戰案例剖析 →時長: 00:12:04
第26講 HBase數據分析與建模,實戰案例剖析 →時長: 00:27:18
第27講 Hive體系架構安裝與HiveQL,應用案例1 →時長: 00:29:37
第28講 Hive體系架構安裝與HiveQL,應用案例2 →時長: 00:29:41
第29講 Pig安裝與Pig Latin語言,應用案例1 →時長: 00:21:43
第30講 Pig安裝與Pig Latin語言,應用案例2 →時長: 00:26:06
第31講 Pig安裝與Pig Latin語言,應用案例3 →時長: 00:11:37
第32講 Pig安裝與Pig Latin語言,應用案例4 →時長: 00:09:30
第33講 hadoop高級介紹 →時長: 00:19:33
第34講 hadoop高級介紹 →時長: 00:15:57
第35講 hadoop高級介紹 →時長: 00:24:22
第36講 hadoop高級介紹 →時長: 00:23:02
第37講 hadoop高級介紹 →時長: 00:07:51
第38講 hadoop高級應用 →時長: 00:18:30
第39講 hadoop高級應用 →時長: 00:26:22
第40講 hadoop高級應用 →時長: 00:18:23
第41講 hadoop高級應用 →時長: 00:16:47
第42講 hadoop高級應用 →時長: 00:19:46
第43講 Hadoop集群安裝 →時長: 00:25:32
第44講 HBASE分佈式安裝 →時長: 00:16:16
|