본문 바로가기

Artificial Intelligence/Reinforcement Learning

Maximum Entropy Inverse Reinforcement Learning

논문 제목 : Maximum Entropy Inverse Reinforcement Learning(2008)




●  논문 저자 : Brian D. Ziebart, Andrew Maas, J. Andrew Bagnell, Anind K. Dey

●  논문 링크 : http://www.aaai.org/Papers/AAAI/2008/AAAI08-227.pdf

●  이전에 보면 좋은 논문 : 

  Apprenticeship Learning via Inverse Reinforcement Learning(2004)

●  함께 보면 좋은 논문 :

  Modeling interaction via the principle of maximum causal entropy(2010) 




Inverse Reinforcement Learning Travel

  1. Algorithms for Inverse Reinforcement Learning(2000)
  2. Apprenticeship Learning via Inverse Reinforcement Learning(2004) 
  3. Maximum Margin Planning(2006)
  4. Maximum Entropy Inverse Reinforcement Learning(2008) - Selected
  5. Generative Adversarial Imitation Learning(2016)
  6. Variational Discriminator Bottleneck(2018)



이번 논문부터는 링크로 대체하고자 한다.


먼저 "Principle of maximum entropy"와 "Principle of maximum causal entropy"에 대해서 알고 이 논문을 보는 것이 좋다.


자료 : Modeling interaction via the principle of maximum causal entropy 

리뷰 : https://www.dropbox.com/s/nnuxikrcdwc83so/pome.pdf?dl=0


그리고나서 논문을 리뷰하였다. 따로 정리하지는 않았고, 논문 pdf에 밑줄을 그어가면서 정리를 했다. 논문이 워낙 잘 써져있어서 따로 md로 정리할 필요가 없었다.


리뷰 https://www.dropbox.com/s/jh9ivjgnu28623p