https://www.gymlibrary.ml/content/environment_creation/
요거보고 따라 만들어 보겠습니다.
확실히 강화학습쪽으로 인력이 많이 필요하고, 가능성이 있어뵈나 뵙니다 ㅎㅎ
이렇게 사용하기 편하게 툴을 풀어주다니!
git clone https://github.com/Farama-Foundation/gym-examples
입력 해주면~ gym_examples 폴더를 얻을 수 있습니다잇~
그러면 envs 폴더안에 __init__.py와 grid_world.py 두개의 파이선 파일이 있는걸 확인 할수 있는데 __init__.py를 수정 하여 실제 플레이를 한번 해보겠습니다.
# from gym_examples.envs.grid_world import GridWorldEnv
from grid_world import GridWorldEnv
import numpy as np
env = GridWorldEnv(5)
num_ep = 10
for i in range(num_ep):
done = False
score = 0
observation = env.reset()
moves = 0
while not done:
env.render()
action = np.random.choice([0,1,2,3])
observation_, reward, done, info = env.step(action)
score += reward
moves +=1
print('episode: ', i,'moves: ', moves, 'score: ', score)
env.close()
요래 수정을 하면
요런 플레이화면을 얻을 수 있습니다
일단 실행은 되네요 이걸 발전 시켜보겠습니다 ㅎㅎ
'Have Done > Reinforcement Learning' 카테고리의 다른 글
[Markov Chain] 그럼 마르코프 연쇄는 뭔데? (0) | 2022.07.05 |
---|---|
[Markov Decision Process] MDP 가 도대체 뭐시냐 (0) | 2022.06.02 |
[강화학습] OPEN AI GYM issue (0) | 2022.05.24 |
[강화학습 GYM] env.render() (0) | 2022.05.23 |
[강화학습] CS 234 class 3 & class 4 (0) | 2022.05.02 |
댓글