近刊検索 デルタ

8月7日発売予定

翔泳社

現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御

AI & TECHNOLOGY
このエントリーをはてなブックマークに追加
内容紹介
注目の最新AI技術!深層強化学習の開発手法がわかる!
第一線で活躍する著者陣の書下ろしによる待望の1冊!

【本書の目的】
Alpha Go(アルファ碁)でも利用されている深層強化学習。
AIサービスのみならずロボティクス分野でもその応用が期待されています。
本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。

【本書の特徴】
第1部では、まず、深層強化学習の概要について説明します。
次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。
さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。
第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。
1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。
2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。
3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。

全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。

【読者が得られること】
深層強化学習による開発手法を学ぶことができます。

【対象読者】
深層強化学習を学びたい理工学生・エンジニア

目次
【目次】
第1部 基礎編
第1章 強化学習の有用性
第2章 強化学習のアルゴリズム
第3章 深層学習による特徴抽出
第4章 深層強化学習の実装

第2部 応用編
第5章 連続制御問題への応用
第6章 組合せ最適化への応用
第7章 系列データ生成への応用

※近刊検索デルタの書誌情報はopenBDのAPIを使用しています。

本日のピックアップ
大蔵財務協会:加藤千博 
大蔵財務協会:河合厚 石井邦明 
労働新聞社:労働新聞社 
にじゅういち出版:奧山雅治 渡邉輝男 

連載記事

発売してからどうです(仮)

>> もっと見る

※近刊検索デルタの書誌情報はopenBDのAPIを利用しています。