課程概述
本課程主要介紹了數據挖掘概述、數據的組織與預處理、決策樹分類方法、貝葉斯分類方法、決策樹分類方法的性能評估、線性回歸方法、人工神經網絡模型、關聯挖掘、聚類分析等。其前導課程為《python程序設計》等,後續課程有《機器學習》、《數據分析與挖掘課程設計》等。
教學單元
1 第一章 緒論
1.1 數據挖掘的概念和任務
1.2 十大經典挖掘算法
1.3-1.4 開放數據獲取來源-數據挖掘常見誤區
1.5 數據挖掘中的隱私保護
2 第二章 數據
2.1 數據對像和數據屬性
2.2 數據的統計描述
2.3 數據可視化
2.4 數據相似性度量
3 第三章 數據預處理
3.1概述+ 數據清洗
3.2 數據集成與數據轉換
3.3 數據規約
3.4 數據離散化與概念分層
4 第四章 分類與預測
4.1-4.2 數據的分類與預測方法
4.3 決策樹分類方法
4.4 樸素貝葉斯分類方法
4.5 決策樹方法的分析比較
4.6 KNN分類算法
4.7 分類與預測算法的性能評價方法
5 第五章 回歸分析
5.1 基本概念
5.2 線性回歸編程案例
5.3 邏輯回歸
5.4 嶺回歸
5.5 線性回歸
5.6.1 線性回歸的延伸-人工神經網絡
5.6.2-5.6.3 神經網絡的訓練和設計原則
5.6.4-5.6.5-5.6.6 過擬合與正則化、交叉驗證和小結
6 第六章 關聯規則挖掘
6.1 基本概念
6.2 閉項集和極大頻繁項集
6.3-6.5 Apriori算法及其應用
6.6 關聯挖掘的常見誤區
6.7 FP-Growth算法
7 第七章 聚類
7.1 聚類概述
7.2 聚類的劃分方法
7.3 聚類的層次方法
7.4 聚類的密度方法
課程列表
名稱 時間長度
第01講1.1 數據挖掘的概念和任務 00:08:54
第02講1.2 十大經典挖掘算法 00:10:35
第03講1.3-1.4 開放數據獲取來源-數據挖掘常見誤區 00:09:52
第04講1.5 數據挖掘中的隱私保護 00:05:08
第05講2.1 數據對像和數據屬性 00:11:55
第06講2.2 數據的統計描述 00:06:39
第07講2.3 數據可視化 00:11:55
第08講2.4 數據相似性度量 00:09:14
第09講3.1 概述+ 數據清洗 00:10:48
第10講3.2 數據集成與數據轉換 00:11:46
第11講3.3 數據規約 00:16:40
第12講3.4 數據離散化與概念分層 00:14:34
第13講4.1-4.2 數據的分類與預測方法 00:13:26
第14講4.3 決策樹分類方法 00:13:17
第15講4.4 樸素貝葉斯分類方法 00:13:03
第16講4.5 決策樹方法的分析比較 00:14:47
第17講4.6 KNN分類算法 00:04:06
第18講4.7 分類與預測算法的性能評價方法 00:14:11
第19講5.1 基本概念 00:05:06
第20講5.2 線性回歸編程案例 00:06:19
第21講5.3 邏輯回歸 00:03:53
第22講5.4 嶺回歸 00:14:53
第23講5.5 線性回歸 00:15:36
第24講5.6.1 線性回歸的延伸-人工神經網絡 00:22:19
第25講5.6.2-5.6.3 神經網絡的訓練和設計原則 00:21:07
第26講5.6.4-5.6.5-5.6.6 過擬合與正則化、交叉驗證和小結 00:11:15
第27講6.1 基本概念 00:09:55
第28講6.2 閉項集和極大頻繁項集 00:03:48
第29講6.3-6.5 Apriori算法及其應用 00:13:41
第30講6.6 關聯挖掘的常見誤區 00:04:04
第31講6.7 FP-Growth算法 00:10:47
第32講7.1 聚類概述 00:04:29
第33講7.2 聚類的劃分方法 00:10:23
第34講7.3 聚類的層次方法 00:12:54
第35講7.4 聚類的密度方法 00:10:12
|