Reinforcement Learning, second edition: An Introduction (Adaptive Computation and Machine Learning series)
Thumbnail 1

Reinforcement Learning, second edition: An Introduction (Adaptive Computation and Machine Learning series)

Product ID: 745719043
Secure Transaction

Description

Reinforcement Learning, second edition: An Introduction (Adaptive Computation and Machine Learning series)

Reviews

羊**羊

実は深層強化学習について直接触れているわけでは無いですが…

・ドラフト版(2018年2月ぐらいのもの)のパート2までほとんど読み切っていたので購入しました(最後のパート3はほとんどが神経科学や応用のお話です).ざっと見てはドラフト版と大きくは変わっていないようです.・基本的な方針・雰囲気は初版と同じで図と文章での説明が中心ですが,数式が若干増えたかもしれません.適格度トレースの説明は若干分かりにくくなったかも.・英語は若干まどろっこしい感じがあって,コード本ほどスラスラとは読めない感じがしました.・数式の展開・擬似コードの記述は初版と同じく丁寧で分かりやすいと思います.・タイトルの通り,深層強化学習について直接触れているわけではありません,が,関数近似のパートを読むと,何故近年の深層強化学習においてベルマン方程式に基づくTDバックアップが直接は行われず,SGDを用いているかについて知見が得られるなど,近年の研究のモチベーションを理解するのに役立ちます(他には,ツリーバックアップを見れば,TRPOのVineに対して自然に理解できるようになります).また,n-stepバックアップ(A3Cで使用)・適格度トレース(PPOで使用されていたような…)についてやさしく説明している本が他にあまり見当たらないのでそこも貴重です.・TD学習の収束性の証明について,一応触れられているものの一箇所論文任せになっています.・方策ベースの方法,特にアクタークリティックに関してはもう少し詳しく説明があっても良かったかも.また,方策勾配定理の証明は割引率γ=1のケースのみですが,Webで探せば一般的なケースのものも見つかります.・個人的に,初版でイマイチ歯切れが悪かったように感じた箇所はかなりカットされています.

H**O

強化学習の基本を理解するのによい

本書の内容に沿ってPython Simulatorを作成しながら、また、関連の最近の論文も読みながら読んでいるが、説明の内容は現在の技術動向、研究動向に照らし合わせても適切な内容に見える。強化学習を効率的に理解するのに役に立つ。従来から研究している進化的方法との比較、融合などを、本書も参考にしながら行う予定。

K**様

ボロボロの中古本が届いた

新品の本を買ったはずがボコボコの中古本が届いた。新品と取替えて欲しい。内容に関してはこれから読むのでレビューできません。

A**N

The book is in good condition.

I have received the book in great shape. The content inside is great!

Common Questions

Yes, all products are sourced directly from authorized retailers in the US, UK, UAE and India. We maintain strict quality control processes and verify each product before shipping. All items come with applicable manufacturer warranties and are covered by our standard return policy.
Delivery times vary by destination country, typically ranging from 3-9 business days. Each order is fully trackable through our system. We handle all customs clearance and use reliable courier partners for last-mile delivery. You'll receive regular updates about your order status via email and our app.
Desertcart is an international e-commerce platform operating since 2014. We securely process thousands of orders globally each day. Every product goes through our quality verification process before delivery, and we provide end-to-end order tracking, 24/7 customer support, and a comprehensive returns policy to ensure a safe shopping experience.
Our prices include the product cost, international shipping, import duties, customs clearance, and local delivery charges. We handle all customs and import procedures, ensuring there are no hidden fees upon delivery. PRO members receive additional benefits including free shipping.

Trustpilot

TrustScore 4.5 | 7,300+ reviews

Fatima A.

Best international shipping I've ever tried. Worth every penny!

3 days ago

Anjali K.

The product quality is outstanding. Exactly what I needed for my work.

1 month ago

Shop Global, Save with Desertcart
Value for Money
Competitive prices on a vast range of products
Shop Globally
Serving millions of shoppers across more than 100 countries
Enhanced Protection
Trusted payment options loved by worldwide shoppers
Customer Assurance
Trusted payment options loved by worldwide shoppers.
Desertcart App
Shop on the go, anytime, anywhere.
43002 som

Duties & taxes incl.

Kyrgyzstanstore
1
Free Returns

30 daysfor PRO membership users

15 dayswithout membership

Secure Transaction

Ask AI about this Product

Trustpilot

TrustScore 4.5 | 7,300+ reviews

Abdullah B.

Great price for an authentic product. Fast international shipping too!

3 weeks ago

Meera L.

Smooth transaction and product arrived in perfect condition.

3 weeks ago

Reinforcement Learning Second Edition An Introduction Adaptive Computation And Machine | Desertcart Kyrgyzstan