Processus de décision de Markov (mdp)

Définition - Que signifie le processus décisionnel de Markov (MDP)?

Un processus de décision de Markov (MDP) est quelque chose que les professionnels appellent un «processus de contrôle stochastique en temps discret». Il est basé sur les mathématiques mises au point par l'universitaire russe Andrey Markov à la fin du 19e et au début du 20e siècle.

Definir Tech explique le processus décisionnel de Markov (MDP)

Une façon d'expliquer un processus de décision de Markov et les chaînes de Markov associées est qu'il s'agit d'éléments de la théorie des jeux moderne fondée sur une recherche mathématique plus simple menée par le scientifique russe il y a une centaine d'années. La description d'un processus de décision de Markov est qu'il étudie un scénario dans lequel un système se trouve dans un ensemble d'états donné et passe à un autre état sur la base des décisions d'un décideur.

Une chaîne de Markov en tant que modèle montre une séquence d'événements où la probabilité d'un événement donné dépend d'un état précédemment atteint. Les professionnels peuvent parler d'un «espace d'états dénombrables» pour décrire le processus de décision de Markov - certains associent l'idée du modèle de décision de Markov à un modèle de «marche aléatoire» ou à un autre modèle stochastique basé sur des probabilités (le modèle de marche aléatoire, souvent cité sur Wall Street, modélise le mouvement d'une action à la hausse ou à la baisse dans un contexte de probabilité de marché).

En général, les processus décisionnels de Markov sont souvent appliqués à certaines des technologies les plus sophistiquées sur lesquelles les professionnels travaillent aujourd'hui, par exemple dans les modèles de robotique, d'automatisation et de recherche.