課程目錄 : (內容與授課時間) 授課總時數: 16:57:39
簡 介:
作為一門學科,數據挖掘對於世人來說在很大程度上是透明的。我們在大多數時間都從未注意到它的發生。但每當我們辦理商店購物卡、使用信用卡購物或在網上衝浪時,都在創建數據。這些數據以大數據集形式存儲在我們每天與之打交道的公司所擁有的功能強大的計算機上。存在於這些數據集之內的便是模式 - 表明我們的興趣、習慣和行為。數據挖掘可讓人們找到並解讀這些模式,從而幫助人們做出更明智的決策,並更好地為客戶服務。
本套教程介紹數據挖掘方面的常見概念和做法。 主要目標讀者除了大學生之外,還有希望通過挖掘數據,使用信息系統和技術解決業務問題,但在計算機科學方面沒有正式相關背景或教育經歷的業務專家。 儘管數據挖掘融合了應用統計、邏輯、人工智能、機器學習和數據管理系統,但您不需要在這些領域具有很強的背景即可參加本次培訓,來學會使用RapidMiner。 雖然學過統計學和數據庫方面的初級大學課程將會有所幫助,但本培訓中對成功學習如何挖掘數據需要瞭解的概念和技術進行了解釋。
適合人群:
本課程適合已經有一定的IT基礎,但對數據挖掘領域尚不瞭解的朋友進修學習。如果您具備統計學和數據庫方面的初級基礎技能會更好。課程同樣適用於數據分析師、IT系統架構設計及研發人員,通過簡單靈活的挖掘模型定制,帶領您探索發現隱藏在海量數據背後的新知識。
收穫預期:
算法有一定的瞭解,有一定的使用RapidMiner工具解決問題的能力,能夠熟練地使用RapidMiner提供的典型挖掘算法進行挖掘分析
課程大綱:
一、數據挖掘基本知識RapidMiner工具介紹
二、數據準備:導入、預處理、導出
三、數據挖掘模型和方法
四、K-Means 聚類與辨別分析
五、線性回歸與邏輯回歸
六、決策樹與神經網絡
七、文本挖掘
八、WEB挖掘
九、協同過濾、推薦
十、時間序列分析
十一、離群點分析
十二、模型評估-交叉驗證與模型優化
十三、過程控制
十四、數據轉換與執行命令
課程列表:
第01講 數據挖掘及工具簡介 →時長: 00:49:56 第02講 數據準備:導入、預處理、導出 →時長: 01:18:19 第03講 關聯分析 →時長: 00:34:05 第04講 關聯規則 →時長: 00:56:51 第05講 K-Means聚類、辨別分析 →時長: 01:01:08
第06講 線性回歸、邏輯回歸 →時長: 01:04:47 第07講 決策樹、神經網絡 →時長: 01:09:53 第08講 文本挖掘 →時長: 01:00:08 第09講 web挖掘 →時長: 01:12:24 第10講 web挖掘(下) →時長: 01:21:37
第11講 推薦系統 →時長: 00:52:02 第12講 模型評估、優化 →時長: 01:31:32 第13講 時間序列 →時長: 00:44:53 第14講 數宏、循環、數據集處理 →時長: 01:49:54 第15講 異常檢測 →時長: 01:30:04
|