【問題】網格交易程式?推薦回答

作者:Maxim Lapan

  實作現代強化學習方法:深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…   強化學習(RL)的最新發展,結合使用深度學習(DL),在訓練代理人「像人類一樣地」解決複雜問題這方面,取得了前所未有的進步。Google團隊利用演算法來玩知名的Atari街機遊戲,並擊敗了它們,這可以說是讓RL領域發光發熱的重要推手,而世界各地的研究人員正馬不停蹄地研發各種新的想法。   《...


常見投資理財問答


延伸文章資訊