오디오 부분적으로 관찰 가능한 마르코프 결정 프로세스 (pomdp) 란 무엇입니까? -techopedia에서 정의

부분적으로 관찰 가능한 마르코프 결정 프로세스 (pomdp) 란 무엇입니까? -techopedia에서 정의

차례:

Anonim

정의-부분 관찰 가능한 Markov 의사 결정 프로세스 (POMDP) ​​란 무엇입니까?

부분적으로 관찰 가능한 Markov 의사 결정 프로세스 (POMPD)는 에이전트가 모델의 기본 상태를 직접 관찰 할 수없는 Markov 의사 결정 프로세스입니다. Markov 의사 결정 프로세스 (MDP)는 일련의 상태가있는 시스템을 표시하고 해당 상태를 기반으로 의사 결정자에게 조치를 제공하는 의사 결정을 모델링하는 수학적 프레임 워크입니다.

POMPD는이 개념을 바탕으로 시스템이 제한된 관측 문제를 처리 할 수있는 방법을 보여줍니다.

Techopedia는 부분적으로 관찰 가능한 Markov 의사 결정 프로세스 (POMDP)를 설명합니다

부분적으로 관찰 가능한 Markov 의사 결정 프로세스에서는 기본 상태가 에이전트에게 투명하지 않기 때문에 "믿음 상태"라는 개념이 도움이됩니다. 신념 상태는 모델에 내재 된 모호성을 처리하는 방법을 제공합니다.

POMPD는 시스템이 확률 결과의 명확한 그림을 구축하는 것으로 알려진 것을 사용하여 MPD 또는 POMPD 모델을 처리 할 수있는 강화 학습에 유용합니다.

부분적으로 관찰 가능한 마르코프 결정 프로세스 (pomdp) 란 무엇입니까? -techopedia에서 정의