-->

回首頁 會員中心 我的購物車 線上留言 付款說明 常見問題 加入最愛 退出登入   

首次訂購請先參閱訂購說明〕 非會員可直接訂購

購物車   線上留言     免費課程  


課程(名稱.編號)簡索

 

  帳  號:  

  密  碼:  

 
    
            關於我們
            課程說明
            訂購說明
            付款說明

       領導藝術.綜合管理
       人力資源.企業培訓
       職務能力培訓系統班
       銷售實戰.市場行銷
       職場技能.個人成長
       Office白領辦公達人
       財經金融.投資理財
       語言學習.出國留學
       中國大陸證照培訓
       資格考試.考証培訓
       文化.生活.興趣.保健
       生產管理.採購物流
       移動開發
       前端開發
       後端開發
       數據庫.服務器
       網頁平面設計
       雲計算.大數據
       網絡營銷推廣
       自然學科
       工程技術學科
       經濟管理學科
       醫.藥.農.林學科
       法律 學科
       計算機工程學科
       哲學.歷史學科
       文學.藝術學科
       教育社會學科
       外語 學科
       醫藥農林
       哲學歷史
       文學藝術
       工程技術
       基礎科學
       經管法學

目前位置:首頁 > 【大學教育課程】 > 計算機工程學科 > 程序語言|數據庫|軟件


課程名稱:     深度強化學習導論
課程編號: MS_3342 系列: (大學)本科國家級課程
授課學校: 復旦大學

授時:

全 25 講

授課語言: 中文

光碟版:

 1   片教程光碟(mp4檔)

其他說明: ..........
簡      介: 課程從強化學習的基本概念談起,介紹了重要的Bellman方程。然後介紹經典的時序差分、SARSA、Q-Learning、深度Q網絡、Double DQN、Act..........
光碟版: NT$ 520 購 買:
訂購說明: ◎優惠期間中!各版本為均一價,請於結帳時註明
◎網路版→檔案複查中,暫不提供
◎光碟版→各國(地區)暫不提供光碟配送服務
下載版→由Google 雲端硬碟下載,(請備記 Gmail帳號)
      訂購多套另附--贈送課程
              喜歡這門課程嗎?按分享推薦給你的朋友吧!

      

   

     課程從強化學習的基本概念談起,介紹了重要的Bellman方程。然後介紹經典的時序差分、SARSA、Q-Learning、深度Q網絡、Double DQN、Actor-critic、A2C等常用的深度強化學習算法。此外,還通過典型的案例分析,以及騰訊開悟平台對上述算法進行實驗,方便理解,動手實踐。!
 

  ——   課程團隊

課程概述


      第1模塊概述強化學習的基本概念,包括agent(智能體)、環境及其之間的關係,還涵蓋了獎勵函數、折扣獎勵(discounted rewards)、價值函數和優勢函數(advantage functions)、策略函數、馬爾科夫過程、Bellman方程等內容。

第2模塊介紹時序差分、SARSA與Q-Learning等算法,還在經典的迷宮遊戲問題上進行訓練和測試。

第3模塊介紹深度Q網絡、深度強化學習算法DQN,還討論了新聞推薦案例。

第4模塊介紹Double DQN、競爭網絡結構。

第5模塊討論actor-critic算法,討論如何訓練actor(agent)的策略,解決基金定投策略問題。

最後結課測試。


教學單元

1 第一單元 強化學習基礎
2 第二單元 強化學習基本概念

2.1 強化學習概述
2.2 強化學習入門
2.3 馬爾科夫過程和貝爾曼方程
3 第三單元 深度強化學習常用算法
3.1 算法概述
3.2 基本算法
3.3 深度強化學習常用算法
4 第四單元 深度強化學習應用
5 深度強化學習導論結課


課程列表 

名稱 時間長度
第01講強化學習簡介 00:11:22
第02講2.1 強化學習概述 00:16:28
第03講智能體 00:07:22
第04講策略 00:07:34
第05講回合、軌跡和狀態轉移 00:13:16
第06講折扣獎勵 00:10:09
第07講價值函數 00:21:07
第08講最優策略與動作 00:08:33
第09講馬爾科夫過程 00:03:59
第10講貝爾曼方程 00:24:54
第11講深度強化學習算法概述 00:17:40
第12講SARSA算法 00:23:11
第13講Q-learning算法-1 00:19:12
第14講Q-learning算法-2 00:31:11
第15講Q-learning算法-3 00:08:57
第16講Q-learning算法補充 00:19:52
第17講DQN算法-1 00:07:20
第18講DQN算法-2 00:11:35
第19講DQN算法-3 00:07:24
第20講DDQN算法 00:19:08
第21講基於策略的強化學習 00:13:51
第22講Actor-critic算法 00:26:29
第23講A2C算法 00:10:32
第24講案例1:新聞推薦 00:29:33
第25講案例2:基金定投




 

 

課程編號 課 程 名 稱 集 數(全) 主講人(單位) 課程系列
  GS_6558  編譯原理  全 50  集  國防科學技術大學 本科國家級課程 
  GS_3979  電腦控制系統  全 24  集  長春工業大學 本科國家級課程 
  SR_7177  彙編語言程序設計  全 51  集  中山大學 遠距教育課程 
  SR_2611  彙編語言  全 34  集  遼寧石油化工大學 國家級課程 
  SR_7178  彙編語言  全 51  集  石油大學 遠距教育課程 
  SR_7168  軟體工程與軟體測試優化技術  全 40  集  上海交通大學 遠距教育課程 
  SR_7167  軟件工程  全 51  集  吉林大學 遠距教育課程 
  SR_7166  統一軟件開發過程  全 30  集  電子科技大學 遠距教育課程 
  MS_5196  現代科學運算—MATLAB語言與應用  全 102  集  東北大學) 國家級課程 
  MS_3342  深度強化學習導論  全 25  集  復旦大學 本科國家級課程 
  MS_3341  推薦系統  全 26  集  北京大學 本科國家級課程 
  SR_7104  面向對象 C++ 語言  全 38  集  電子科技大學 遠距教育課程 
  MS_2016  計算機輔助翻譯原理與實踐  全 197  集  北京大學 國家級課程 
  MS_5537  計算機程序設計(C++)  全 160  集  西安交通大學 本科國家級課程 
  SR_7169  計算機軟件技術基礎  全 44  集  電子科技大學 遠距教育課程 
  MS_3364  信息隱藏技術  全 58  集  南開大學 本科國家級課程 
  SR_7155  物件導向 C++ 程式設計  全 40  集  電子科技大學 遠距教育課程 
  GS_6803  用戶體驗與產品創新設計  全 130  集  浙江大學 本科國家級課程 
  SR_7121  Visual C++ 6.0 語言程式設計  全 56  集  哈爾濱工業大學 遠距教育課程 
  SR_7119  Visual Basic 編程與應用  全 64  集  吉林大學 遠距教育課程 
  SR_7123  Visual Basic 6.0程序設計基礎  全 36  集  上海交通大學 遠距教育課程 
  SR_7118  VB程序設計  全 40  集  電子科技大學 遠距教育課程 
  SR_7160  VB 高級語言程序設計  全 52  集  哈爾濱工業大學 遠距教育課程 
  SR_7117  TCP / IP協議原理  全 42  集  電子科技大學 遠距教育課程 
  MS_3339  SPSS數據分析與量化研究  全 65  集  北京師範大學 本科國家級課程 
  MS_5240  Python語言程序設計  全 258  集  北京理工大學 國家級課程 
  MS_5008  Python網絡爬蟲與信息提取  全 62  集  北京理工大學 國家級課程 
  SR_7220  Power Builder程序設計  全 24  集  哈爾濱工業大學 遠距教育課程 
  SR_7159  Pascal 高級語言程序設計  全 64  集  吉林大學 遠距教育課程 
  SR_7113  JSP動態網頁設計  全 35  集  電子科技大學 遠距教育課程 
  SR_7112  JAVA程序設計  全 50  集  吉林大學 遠距教育課程 
  SR_7157  JAVA 面向對像程序設計  全 51  集  吉林大學 遠距教育課程 
  SR_7111  J2EE軟件架構技術  全 32  集  吉林大學 遠距教育課程 
  SR_7110  Fortran語言  全 29  集  石油大學 遠距教育課程 
  SR_7109  EJB 技術及應用  全 26  集  東北大學 遠距教育課程 
  SR_7108  Delphi 面向對像程序設計  全 50  集  中山大學 遠距教育課程 
  MS_5005  C編程方法學  全 87  集  武漢理工大學 國家級課程 
  SR_7107  C語言程序設計  全 68  集  哈爾濱工業大學 遠距教育課程 
  GS_6491  CC++程序設計  全 52  集  成都理工大学 本科國家級課程 
  SR_7156  C++語言程序設計  全 37  集  吉林大學 遠距教育課程 
  SR_7103  C++程序語言設計(上.下集)  全 80  集  東南大學 遠距教育課程 
  SR_7102  ASP開發教程  全 35  集  哈爾濱工業大學 遠距教育課程 
  SR_7101  ASP程序設計  全 41  集  中山大學 遠距教育課程 
  SR_7153   C語言 程式設計基礎  全 33  集  石油大學 遠距教育課程 
table>

  易學族課程網    http://www.estu.com.tw/  
    易學族自學網   http://www.estucourse.com/
電子信箱:   estuLearn@gmail.com     
               Copyright © 2017 Estu. All Rights Reserved