Search Catalog > Book
Check-outs :

Hadoop技術手冊

  • Hit:57
  • Rating:0
  • Review:0
  • Trackback:0
  • Forward:0


轉寄 列印
第1級人氣樹(0)
人氣指樹
  • keepsite
  • Introduction
  • About Author
  • Collection(0)
  • Review(0)
  • Rating(0)

內容簡介

準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。針對Hadoop 2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。.學習基礎元件如MapReduce、HDFS及YARN。.更深入探索MapReduce,包含開發應用程式。.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。.學習兩種資料格式:Avro 的資料序列化和Parquet巢狀資料。.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。

作者介紹



■作者簡介Tom White自2007年起就是Apache Hadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章,並在商業研討會上發表多場演講。 ■譯者簡介林峰正王耀聰辜文元施赬陽周天穎

Must Login
Must Login
Must Login
Must Login