본문 바로가기

유니티 ML Agents/ML Agents 개념

(13)
5. ML Agents 기본 예제 - 실행 준비 UnitySDK 프로젝트 생성 유니티를 실행시키면 프로젝트 화면이 나온다. 상단에 Open 메뉴를 선택해서 ML 에이전트 파일을 다운로드 받아서 저장한 폴더를 선택한다. ML 에이전트 폴더(C:\ml-agents-master) 아래에 있는 UnitySDK 폴더를 선택하면 유니티에서 제공하는 ML 에이전트 예제 및 관련 파일을 모두 포함한 프로젝트를 생성할 수 있다. UnitySDK 프로젝트 확인 프로젝트가 정상적으로 생성됐으면 프로젝트 뷰에서 그림과 같은 내용을 확인할 수 있다. ML 에이전트 환경 설정 유니티에서 ML 에이전트를 사용할 수 있도록 환경 설정을 해보자. Edit 메뉴에서 Project Settings를 선택하고 Player 메뉴를 누르면 인스펙터 뷰에서 환경설정을 할 수 있다. 아래쪽으로..
4. ML Agents 설치 - ML-agents ML 에이전트 설치 파일 다운로드 ML Agent 사용에 필요한 다른 페키지를 다운로드 받아보자. 파일은 https://github.com/Unity-Technologies/ml-agents/archive/master.zip 에서 쉽게 다운로드 받을 수 있다. 다운로드 받은 파일의 압축을 풀어 파일 위치를 변경한다. 설치된 후에도 관련 파일은 자주 사용해야 하기 때문에 C:\ml-agents-matser 디렉토리에 파일을 모아 놓도록 하자. ml-agents 환경에서 디렉토리를 C:\ml-agents-matser\ml-agents 로 이동해 관련 패키지 설치를 시작한다. ML 에이전트 설치 ML agent 설치는 해당 디렉토리(C:\ml-agents-matser\ml-agents)로 이동 후 [pytho..
3. ML Agents 설치 - 텐서플로우 텐서플로우 설치 텐서플로우를 설치해보자. 파이썬에서 지원하는 pip 모듈을 활용하면 프로그램을 쉽게 다운로드 받고 설치할 수 있다. 먼저 pip을 최신 버전으로 유지하는 것이 좋다. (1) python -m pip install --upgrade pip 명령어를 사용해서 pip을 업그레이드 하자. 다음으로 텐서플로우를 설치하는데 ML Agent에서 권장하는 버전을 설치하는 것이 좋다. 현재(2018년 10월 30일) ML Agent 홈페이지에서는 1.7.1 버전 설치를 권장한다. (2) python -m pip install tensorflow==1.7.1 명령어를 사용해서 텐서플로우를 설치하자. 명령어가 실행되고 마지막에 (3) Successfully installed 메시지를 확인하면 설치가 정상적으..
2. ML Agents 설치 - 아나콘다 아나콘다 다운로드 및 설치 아나콘다는 데이터 사이언스와 머신러닝에 필요한 다양한 파이썬과 R 관련 모듈을 모아 놓은 무료 배포 패키지이다. 파이썬을 사용해서 머신러닝을 할 때 pandas, numpy, tensorflow 등 다양한 패키지가 필요하다. 하지만 아나콘다만 설치하면 이 모든 패키지들이 기본적으로 설치되어 있기 때문이 다른 프로그램을 추가로 설치할 필요가 없다. 아나콘다 리파지토리 페이지에 가면 다양한 아나콘다 버전을 다운로드할 수 있다. ML 에이전트를 실행하기 위해서는 호환되는 버전을 설치해야 하는데 ML 에이전트 0.5 버전과는 아니콘다 3 5.1 버전이 적합하다. 다음 사이트에서 https://repo.anaconda.com/archive/ 윈도우 64bits용 아나콘다 5.1 버전을 ..
1. ML Agents 개념 ○ ML 에이전트 개념 ML 에이전트의 학습 환경(Learning Environment)은 아카데미, 브레인 그리고 에이전트로 구성된다. 학습 환경이란 유니티 씬과 씬을 구성하고 있는 게임 캐릭터를 말한다. ML 에이전트 개념도 에이전트는 강화학습에 참여하는 게임 캐릭터를 말한다. 에이전트는 브레인 정책에 따라 행동(Action)을 하고 자신의 관점에서 환경을 이해(Observation)하고 그것을 숫자 또는 이미지로 변환해서 관찰 값으로 저장한다. 에이전트는 브레인에게 행동에 따른 보상 값을 계산해서 관찰 값과 같이 전달한다. 브레인은 관찰 값을 기반으로 정책에 따라 에이전트가 최적의 행동을 취할 수 있도록 정책 실행 결과 값을 반환한다. 학습을 통해 최적의 정책을 찾는 것이 강화학습의 목적이다. 최적..