- 論壇徽章:
- 0
|
深入淺出Hadoop Mahout數(shù)據(jù)挖掘?qū)崙?zhàn)
適合人群:高級
課時(shí)數(shù)量:17課時(shí)
用到技術(shù):MapReduce并行分詞程序 Mahout
涉及項(xiàng)目:Hadoop綜合實(shí)戰(zhàn)-文本挖掘項(xiàng)目 Mahout數(shù)據(jù)挖掘工具
咨詢QQ:1840215592
課程介紹
本課程主要涉及以下內(nèi)容的講解:
1、Mahout數(shù)據(jù)挖掘工具
2、Hadoop實(shí)現(xiàn)推薦系統(tǒng)的綜合實(shí)戰(zhàn),涉及到MapReduce、Pig和Mahout的綜合實(shí)戰(zhàn)
課程大綱
Mahout數(shù)據(jù)挖掘工具(10課時(shí))
數(shù)據(jù)挖掘概念、系統(tǒng)組成
數(shù)據(jù)挖掘常用方法及算法(回歸分析、分類、聚類等)
數(shù)據(jù)挖掘分析工具
Mahout支持的算法
Mahout起源和特點(diǎn)
Mahout安裝、配置及測試
實(shí)戰(zhàn):Mahout K-means聚類分析
Mahout實(shí)現(xiàn)Canopy算法
Mahout實(shí)現(xiàn)分類算法
實(shí)戰(zhàn):Mahout邏輯回歸分類預(yù)測
實(shí)戰(zhàn):Mahout樸素貝葉斯分類
推薦系統(tǒng)的概念及分類
協(xié)同過濾推薦算法概念、分類及應(yīng)用
實(shí)戰(zhàn):實(shí)現(xiàn)基于Mahout的電影推薦系統(tǒng)
Hadoop綜合實(shí)戰(zhàn)-文本挖掘項(xiàng)目(7課時(shí))
文本挖掘的概念及應(yīng)用場景
項(xiàng)目背景
項(xiàng)目流程
中文分詞技術(shù)
庖丁分詞器的使用
MapReduce并行分詞程序的設(shè)計(jì)與實(shí)現(xiàn)
Pig劃分?jǐn)?shù)據(jù)集
Mahout構(gòu)建樸素貝葉斯文本分類器
模型應(yīng)用-計(jì)算用戶偏好類別 |
|