강화학습이란?에이전트(Agent)가 환경(Environment)와 상호작용하면서 보상(Reward)를 극대화하는 행동 전략을 학습하는 과정 1. 강화 학습의 핵심 구성 요소1. 에이전트(Agent): 학습을 수행하는 주체, 주어진 환경에서 최적의 행동을 찾기 위해 노력2. 환경(Environment): 에이전트가 상호작용하는 외부세계3. 상태(State): 에이전트가 환경에서 인식하는 정보의 집합, 현재 처한 상황4. 행동(Action): 에이전트가 선택할 수 있는 다양한 옵션, 동작5. 보상(Reward): 에이전트가 특정 행동을 취했을 때 환경으로부터 받는 피드백, 점수6. 정책(Policy): 상태에 따른 행동 선택 전략7. 에피소드(Episode): 시작~종료까지의 학습 단위2. 강화 학습 핵심 ..