논문 제목 : Maximum Entropy Inverse Reinforcement Learning(2008)
● 논문 저자 : Brian D. Ziebart, Andrew Maas, J. Andrew Bagnell, Anind K. Dey
● 논문 링크 : http://www.aaai.org/Papers/AAAI/2008/AAAI08-227.pdf
● 이전에 보면 좋은 논문 :
○ Apprenticeship Learning via Inverse Reinforcement Learning(2004)
● 함께 보면 좋은 논문 :
○ Modeling interaction via the principle of maximum causal entropy(2010)
Inverse Reinforcement Learning Travel
- Algorithms for Inverse Reinforcement Learning(2000)
- Apprenticeship Learning via Inverse Reinforcement Learning(2004)
- Maximum Margin Planning(2006)
- Maximum Entropy Inverse Reinforcement Learning(2008) - Selected
- Generative Adversarial Imitation Learning(2016)
- Variational Discriminator Bottleneck(2018)
이번 논문부터는 링크로 대체하고자 한다.
먼저 "Principle of maximum entropy"와 "Principle of maximum causal entropy"에 대해서 알고 이 논문을 보는 것이 좋다.
자료 : Modeling interaction via the principle of maximum causal entropy
리뷰 : https://www.dropbox.com/s/nnuxikrcdwc83so/pome.pdf?dl=0
그리고나서 논문을 리뷰하였다. 따로 정리하지는 않았고, 논문 pdf에 밑줄을 그어가면서 정리를 했다. 논문이 워낙 잘 써져있어서 따로 md로 정리할 필요가 없었다.
리뷰 : https://www.dropbox.com/s/jh9ivjgnu28623p
'Artificial Intelligence > Reinforcement Learning' 카테고리의 다른 글
Mujoco Setup (Mac OS version) (0) | 2019.01.07 |
---|---|
Generative Adversarial Imitation Learning (0) | 2018.12.26 |
Maximum Margin Planning (0) | 2018.11.29 |
Apprenticeship Learning via Inverse Reinforcement Learning (0) | 2018.11.12 |
Algorithms for Inverse Reinforcement Learning (2) | 2018.09.18 |