09. 인텐트 더보기 Mujoco Setup (Mac OS version) 1. gym 설치pip install gym 2 라이센스 구입 https://www.roboti.us/license.html 에 들어가서 license를 신청합니다. 여기서 신청할때 Computer id가 필요한데 mac os 같은 경우는 오른쪽에 OSX를 클릭하면 getid_osx라는 파일이 다운받아집니다. 이 때 이 파일을 클릭하면 이러한 창이 뜹니다. 그러면 터미널 창을 키고, $ cd Downloads$ chmod u+x getid_osx를 입력하면, 파일이이런식으로 아이콘이 바뀝니다. 다시 클릭해보면 똑같은 경고창이 뜹니다. 여기서 System Preferences - Security & Privacy 에 들어가면 이렇게 되어있습니다. 그러면 오른쪽에 Open Anyway를 클릭하고 Open을 .. 더보기 08. 화면 전환 더보기 07. 리스트뷰 더보기 06. 인플레이션 더보기 05. 비트맵 버튼 더보기 Generative Adversarial Imitation Learning 논문 제목 : Generative Adversarial Imitation Learning(2016) ● 논문 저자 : Jonathan Ho, Stefano Ermon● 논문 링크 : https://papers.nips.cc/paper/6391-generative-adversarial-imitation-learning.pdf● 이전에 보면 좋은 논문 : ○ Apprenticeship Learning via Inverse Reinforcement Learning(2004)○ Modeling interaction via the principle of maximum causal entropy(2010) ○ Maximum Entropy Inverse Reinforcement Learning(2008)○ Trust.. 더보기 Maximum Entropy Inverse Reinforcement Learning 논문 제목 : Maximum Entropy Inverse Reinforcement Learning(2008) ● 논문 저자 : Brian D. Ziebart, Andrew Maas, J. Andrew Bagnell, Anind K. Dey● 논문 링크 : http://www.aaai.org/Papers/AAAI/2008/AAAI08-227.pdf● 이전에 보면 좋은 논문 : ○ Apprenticeship Learning via Inverse Reinforcement Learning(2004)● 함께 보면 좋은 논문 :○ Modeling interaction via the principle of maximum causal entropy(2010) Inverse Reinforcement Learning Tr.. 더보기 04. 토스트와 대화상자 더보기 03. 다양한 위젯과 이벤트 처리 더보기 Maximum Margin Planning 논문 제목 : Maximum Margin Planning(2006) ● 논문 저자 : Nathan D. Ratliff, J. Andrew Bagnell, Martin A. Zinkevich● 논문 링크 : https://www.ri.cmu.edu/pub_files/pub4/ratliff_nathan_2006_1/ratliff_nathan_2006_1.pdf ● 이전에 보면 좋은 논문 : ○ Apprenticeship Learning via Inverse Reinforcement Learning(2004) Inverse Reinforcement Learning TravelAlgorithms for Inverse Reinforcement Learning(2000)Apprenticeship Learning v.. 더보기 Apprenticeship Learning via Inverse Reinforcement Learning 논문 제목 : Apprenticeship Learning via Inverse Reinforcement Learning(2004) ● 논문 저자 : Pieter Abbeel, Andrew Y. Ng● 논문 링크 : http://people.eecs.berkeley.edu/~russell/classes/cs294/s11/readings/Abbeel+Ng:2004.pdf● 이전에 보면 좋은 논문 : ○ Algorithms for Inverse Reinforcement Learning(2000)● 함께 보면 좋은 논문 :○ Maximum Margin Planning(2006) Inverse Reinforcement Learning TravelAlgorithms for Inverse Reinforcement L.. 더보기 02. 대표적인 레이아웃 더보기 01. 뷰의 속성 "android:" 이 붙은 것들은 다 외부 라이브러리를 가져온 속성들 android.supprot.constraint.ConstraintLayout 이렇게 외부 라이브러리에서 가져온 것은 전부 다 써줘야 함 더보기 CS231N - Lecture 7: Training Neural Networks II Today Fancier OptimizationOptimizationWe define some loss function. For each value of the network weights, the loss function tells us how good or bad is that value of the weights doing on our problem.Then we imagine that this loss function gives us some nice landscape over the weights.Three Problems with SGD1. Natsy zigzaggingQ: What if loss changes quickly in one direction and slowly in another.. 더보기 이전 1 2 3 다음