Théorie De La Décision Causale

Table des matières:

Théorie De La Décision Causale
Théorie De La Décision Causale

Vidéo: Théorie De La Décision Causale

Vidéo: Théorie De La Décision Causale
Vidéo: PHILOSOPHY - Epistemology: Analyzing Knowledge #3 (Causal and Reliabilist Theories) [HD] 2024, Mars
Anonim

Navigation d'entrée

  • Contenu de l'entrée
  • Bibliographie
  • Outils académiques
  • Aperçu du PDF des amis
  • Informations sur l'auteur et la citation
  • Retour au sommet

Théorie de la décision causale

Publié pour la première fois le samedi 25 octobre 2008; révision de fond mar 15 novembre 2016

La théorie de la décision causale adopte des principes de choix rationnel qui prennent en compte les conséquences d'un acte. Il soutient qu'un exposé du choix rationnel doit utiliser la causalité pour identifier les considérations qui rendent un choix rationnel.

Étant donné un ensemble d'options constituant un problème de décision, la théorie de la décision recommande une option qui maximise l'utilité, c'est-à-dire une option dont l'utilité est égale ou dépasse l'utilité de toutes les autres options. Il évalue l'utilité d'une option en calculant l'utilité attendue de l'option. Il utilise les probabilités et les utilitaires des résultats possibles d'une option pour définir l'utilité attendue d'une option. Les probabilités dépendent de l'option. La théorie de la décision causale considère que la dépendance est causale plutôt que simplement probante.

Cet essai explique la théorie de la décision causale, passe en revue son histoire, décrit les recherches actuelles en théorie de la décision causale et examine les fondements philosophiques de la théorie. La littérature sur la théorie de la décision causale est vaste, et cet essai n'en couvre qu'une partie.

  • 1. Utilité attendue
  • 2. Histoire

    • 2.1 Le problème de Newcomb
    • 2.2 La solution de Stalnaker
    • 2.3 Variantes
    • 2.4 Théorèmes de représentation
    • 2.5 Objections
  • 3. Problèmes actuels

    • 3.1 Probabilité et utilité
    • 3.2 Invariance de partition
    • 3.3 Résultats
    • 3.4 Actes
    • 3.5 Généralisation de l'utilité attendue
    • 3.6 Ratification
  • 4. Thèmes connexes et remarques finales
  • Bibliographie
  • Outils académiques
  • Autres ressources Internet
  • Entrées connexes

1. Utilité attendue

Supposons qu'un étudiant envisage d'étudier pour un examen. Il raisonne que s'il réussit l'examen, étudier est un effort inutile. De plus, s'il ne réussit pas l'examen, étudier est un effort inutile. Il conclut que parce que quoi qu'il arrive, étudier est un effort inutile, il vaut mieux ne pas étudier. Ce raisonnement est erroné car étudier augmente la probabilité de réussir l'examen. Les délibérations devraient tenir compte de l'influence d'un acte sur la probabilité de ses résultats possibles.

L'utilité attendue d'un acte est une moyenne pondérée des probabilités des utilités de ses résultats possibles. Les états possibles du monde qui s'excluent mutuellement et conjointement exhaustifs, et forment ainsi une partition, génèrent les conséquences possibles d'un acte. Une paire acte-état spécifie un résultat. Dans l'exemple, l'acte d'étudier et l'état de réussite forment un résultat comprenant l'effort d'étudier et le bénéfice de réussir. L'utilité attendue des études est la probabilité de réussir si l'on multiplie l'utilité d'étudier et de réussir plus la probabilité de ne pas réussir si l'on étudie multiplié par l'utilité d'étudier et de ne pas réussir. En notation compacte,) textit {EU} (S) = P (P / mbox {if} S) util (S / amp P) + P ({ sim} P / mbox {if} S) util (S / amp { sim} P).)

Chaque produit spécifie la probabilité et l'utilité d'un résultat possible. La somme est une moyenne pondérée des probabilités des utilités des résultats possibles.

Comment la théorie de la décision doit-elle interpréter la probabilité d'un état (S) si l'on accomplit un acte (A), c'est-à-dire (P (S / mbox {si} A))? La théorie des probabilités offre une suggestion pratique. Il tient compte des probabilités conditionnelles que la théorie de la décision peut adopter. La théorie de la décision peut prendre (P (S / mbox {if} A)) comme la probabilité de l'état conditionnel à l'acte. Alors (P (S / mbox {si} A)) est égal à (P (S / mid A)), que la théorie des probabilités définit comme (P (S / amp A) / P (A)) quand (P (A) ne 0). Certains théoriciens appellent utilité attendue calculée à l'aide de probabilités conditionnelles utilité attendue conditionnelle. J'appelle cela l'utilité attendue tout court parce que la formule utilisant les probabilités conditionnelles généralise une formule plus simple pour l'utilité attendue qui utilise les probabilités non conditionnelles des états. Aussi,certains théoriciens appellent l'utilité attendue d'un acte son utilité tout court parce que l'utilité attendue d'un acte évalue l'acte et donne l'utilité de l'acte dans des cas idéaux. J'appelle cela une utilité attendue parce qu'une personne peut par erreur attacher plus ou moins d'utilité à un pari que son utilité attendue ne le justifie. L'égalité de l'utilité d'un acte et de son utilité attendue est normative plutôt que définitionnelle.

Les utilités attendues obtenues à partir des probabilités conditionnelles orientent les délibérations de l'élève dans la bonne direction.

) textit {EU} (S) = P (P / mid S) util (S / amp P) + P ({ sim} P / mid S) util (S / amp { sim} P),)

et

) textit {EU} ({ sim} S) = P (P / mid { sim} S) util ({ sim} S / amp P) + P ({ sim} P / mid { sim} S) util ({ sim} S / amp { sim} P).)

En raison de l'effet de l'étude sur la probabilité de réussite, (P (P / mid S) gt P (P / mid { sim} S)) et (P ({ sim} P / mid S) lt P ({ sim} P / mid { sim} S)). Donc (textit {EU} (S) gt / textit {EU} ({ sim} S)), en supposant que l'augmentation de la probabilité de réussite de l'étude compense l'effort d'étude. La maximisation de l'utilité attendue recommande d'étudier.

L'interprétation pratique de la probabilité d'un état si l'on accomplit un acte n'est cependant pas entièrement satisfaisante. Supposons que l'on lance une pièce avec un biais inconnu et obtient des têtes. Ce résultat est la preuve que le prochain tirage donnera des têtes, bien qu'il n'influence pas de manière causale le résultat du prochain tirage. La probabilité d'un événement conditionnelle à un autre événement indique la preuve que le deuxième événement fournit le premier. Si les deux événements sont corrélés, le second peut fournir des preuves pour le premier sans l'influencer causalement. La causalité implique une corrélation, mais la corrélation n'entraîne pas de causalité. Les délibérations devraient porter sur l'influence causale d'un acte sur un État plutôt que sur la preuve d'un acte pour un État. Une bonne décision vise à produire un bon résultat plutôt que la preuve d'un bon résultat. Il vise le bien et pas seulement les signes du bien. Souvent, efficacité et bon augure vont de pair. Lorsqu'ils se séparent, un agent doit accomplir un acte efficace plutôt qu'un acte de bon augure.

Prenons le dilemme du prisonnier, un exemple courant de théorie des jeux. Deux personnes isolées l'une de l'autre peuvent chacune agir de manière coopérative ou non. Chacun d'eux fait mieux s'ils agissent chacun de manière coopérative que s'ils agissent chacun de manière non coopérative. Cependant, chacun fait mieux s'il agit de manière non coopérative, quoi que fasse l'autre. Agir de manière non coopérative domine la coopération. Supposons, en plus, que les deux joueurs soient des jumeaux psychologiques. Chacun pense comme l'autre pense. De plus, ils savent ce fait d'eux-mêmes. Ensuite, si un joueur agit en coopération, il conclut que son homologue agit également en coopération. Son action coopérative est une bonne preuve que son homologue fait de même. Néanmoins, son action coopérative n'amène pas son homologue à agir en coopération. Il n'a aucun contact avec son homologue. Parce qu'il vaut mieux ne pas agir en coopération quoi que fasse son homologue, ne pas agir en coopération est la meilleure solution. Agir en coopération est de bon augure mais pas efficace.

Pour que l'utilité attendue suive l'efficacité plutôt que le bon augure, la théorie de la décision causale interprète la probabilité d'un état si l'on accomplit un acte comme un type de probabilité causale plutôt que comme une probabilité conditionnelle standard. Dans le dilemme du prisonnier avec des jumeaux, considérez la probabilité qu'un joueur agisse en coopération étant donné que l'autre joueur le fait. Cette probabilité conditionnelle est élevée. Ensuite, considérez la probabilité causale qu'un joueur agisse en coopération si l'autre joueur le fait. Parce que les joueurs sont isolés, cette probabilité est égale à la probabilité que le premier joueur agisse en coopération. Il est faible si ce joueur suit la domination. En utilisant des probabilités conditionnelles, l'utilité attendue d'agir en coopération dépasse l'utilité attendue d'agir de manière non coopérative. Cependant, en utilisant les probabilités causales,l'utilité attendue d'agir de manière non coopérative dépasse l'utilité attendue d'agir en coopération. Le passage des probabilités conditionnelles aux probabilités causales fait que la maximisation de l'utilité attendue produit un rendement non coopératif.

2. Histoire

Cette section parcourt l'histoire de la théorie de la décision causale et présente, en cours de route, diverses formulations de la théorie.

2.1 Le problème de Newcomb

Robert Nozick (1969) a présenté un dilemme pour la théorie de la décision. Il a construit un exemple dans lequel le principe standard de dominance entre en conflit avec le principe standard de maximisation de l'utilité attendue. Nozick a appelé l'exemple du problème de Newcomb après le physicien, William Newcomb, qui a d'abord formulé le problème.

Dans le problème de Newcomb, un agent peut choisir de prendre une boîte opaque ou de prendre à la fois la boîte opaque et une boîte transparente. La boîte transparente contient mille dollars que l'agent voit clairement. La boîte opaque contient soit rien, soit un million de dollars, selon une prédiction déjà faite. La prédiction concernait le choix de l'agent. Si la prédiction était que l'agent prendrait les deux boîtes, alors la boîte opaque est vide. D'un autre côté, si la prédiction était que l'agent ne prendra que la boîte opaque, alors la boîte opaque contient un million de dollars. La prédiction est fiable. L'agent connaît toutes ces caractéristiques de son problème de décision.

La figure 1 affiche les options de l'agent et leurs résultats. Une ligne représente une option, une colonne un état du monde et une cellule le résultat d'une option dans un état du monde.

Prédiction

one-boxing

Prédiction de

deux boxe

Prenez une boîte ($ M) ($ 0)
Prenez deux boîtes ($ M + / $ T) ($ T)

Figure 1. Problème de Newcomb

Parce que le résultat de la double boxe est meilleur par ($ T) que le résultat d'une boxe étant donné chaque prédiction, la double boxe domine la one-boxing. La double boxe est le choix rationnel selon le principe de la domination. Parce que la prédiction est fiable, une prédiction de one-boxing a une probabilité élevée étant donné la one-boxing. De même, une prédiction de la double boxe a une probabilité élevée étant donné la double boxe. Par conséquent, en utilisant des probabilités conditionnelles pour calculer les utilités attendues, l'utilité attendue de one-boxing dépasse l'utilité attendue de two-boxing. Le one-boxing est le choix rationnel selon le principe de la maximisation de l'utilité attendue.

La théorie de la décision doit aborder tous les problèmes de décision possibles et pas seulement les problèmes de décision réalistes. Cependant, si le problème de Newcomb semble peu inquiétant car les versions irréalistes et réalistes du problème sont nombreuses. La caractéristique essentielle du problème de Newcomb est la corrélation d'un acte inférieur avec un bon état qu'il ne favorise pas causalement. Dans les problèmes médicaux réalistes de Newcomb, une condition médicale et un symptôme comportemental ont une cause commune et sont corrélés bien que ni l'un ni l'autre ne provoque l'autre. Si le comportement est attractif, la dominance le recommande bien que la maximisation de l'utilité attendue l'interdise. De plus, Allan Gibbard et William Harper (1978: Sec. 12) et David Lewis (1979) observent que le dilemme d'un prisonnier avec des jumeaux psychologiques pose un problème de Newcomb pour chaque joueur. Pour chaque joueur,l'acte de l'autre joueur est un état affectant le résultat. Agir en coopération est un signe, mais non une cause, de l'action coopérative de l'autre joueur. La dominance recommande d'agir de manière non coopérative, alors que l'utilité attendue calculée avec des probabilités conditionnelles recommande d'agir en coopération. Dans certains cas réalistes du dilemme du prisonnier, la similitude de pensée anticipée des joueurs crée un conflit entre le principe de domination et le principe de maximisation de l'utilité attendue.la similitude de pensée anticipée des joueurs crée un conflit entre le principe de dominance et le principe de maximisation de l'utilité attendue.la similitude de pensée anticipée des joueurs crée un conflit entre le principe de dominance et le principe de maximisation de l'utilité attendue.

2.2 La solution de Stalnaker

Robert Stalnaker (1968) a présenté les conditions de vérité pour les conditionnelles subjonctives. Un conditionnel subjonctif est vrai si et seulement si dans le monde antécédent le plus proche, son conséquent est vrai. (Cette analyse est comprise de telle sorte qu'un conditionnel subjonctif est vrai si son antécédent n'est vrai dans aucun monde.) Stalnaker a utilisé l'analyse des conditionnels subjonctifs pour fonder leur rôle dans la théorie de la décision et dans une résolution du problème de Newcomb.

Dans une lettre à Lewis, Stalnaker (1972) a proposé un moyen de réconcilier les principes de décision dans le problème de Newcomb. Il a suggéré de calculer l'utilité attendue d'un acte en utilisant des probabilités conditionnelles à la place des probabilités conditionnelles. En conséquence,) textit {EU} (A) = / sum_i P (A / gt S_i) util (A / amp S_i),)

où (A / gt S_i) représente le conditionnel que si (A) était exécuté alors (S_i) obtiendrait. Ainsi, au lieu d'utiliser la probabilité d'une prédiction de one-boxing donné one-boxing, on devrait utiliser la probabilité du conditionnel que si l'agent ne choisissait qu'une seule case, alors la prédiction aurait été une boxing. Parce que l'acte de l'agent ne provoque pas la prédiction, la probabilité du conditionnel est égale à la probabilité que la prédiction soit une boxe. En outre, considérez le conditionnel que si l'agent avait choisi les deux cases, alors la prédiction aurait été une boxe. Sa probabilité est également égale à la probabilité que la prédiction soit une boxe. L'acte que l'agent accomplit n'affecte aucune probabilité de prédiction parce que la prédiction se produit avant l'acte. Par conséquent,en utilisant les probabilités des conditions pour calculer l'utilité attendue, l'utilité attendue de la boxe dépasse l'utilité attendue de la boxe. Par conséquent, le principe de maximisation de l'utilité attendue fait la même recommandation que le principe de dominance.

Gibbard et Harper (1978) ont élaboré et rendu public la résolution du problème de Newcomb par Stalnaker. Ils ont distingué la théorie de la décision causale, qui utilise les probabilités des conditionnelles subjonctives, de la théorie de la décision probante, qui utilise des probabilités conditionnelles. Parce que dans les problèmes de décision, les probabilités des conditions subjonctives suivent les relations causales, leur utilisation pour calculer l'utilité attendue d'une option rend la théorie de la décision causale.

Gibbard et Harper ont distingué deux types d'utilité attendue. Un type qu'ils ont appelé valeur et représenté par (V). Cela indique une valeur d'actualité ou de bon augure. L'autre type qu'ils ont appelé utilitaire et représenté par (U). Il indique l'efficacité dans la réalisation des objectifs. Un calcul de la valeur attendue d'un acte utilise des probabilités conditionnelles, et un calcul de son utilité attendue utilise des probabilités conditionnelles. Ils ont fait valoir que l'utilité attendue, calculée avec des probabilités conditionnelles, produit une véritable utilité attendue.

Comme Gibbard et Harper introduisent (V) et (U), les deux reposent sur une évaluation (D) (pour la désirabilité) de résultats spécifiques au maximum. Au lieu d'adopter une formule d'utilité attendue qui utilise une évaluation des résultats neutre par rapport à la théorie de la décision probante et causale, cet essai suit Stalnaker (1972) en adoptant une formule qui utilise l'utilité pour évaluer les résultats.

2.3 Variantes

Considérons une affirmation conditionnelle que si une option était adoptée, alors un certain État obtiendrait. Gibbard et Harper supposent, pour illustrer les idées principales de la théorie de la décision causale, que le conditionnel a une valeur de vérité et que, étant donné sa fausseté, si l'option était adoptée, l'État n'obtiendrait pas. Cette hypothèse peut être injustifiée si l'option lance une pièce de monnaie et que l'État concerné obtient des têtes. Il peut être faux (ou indéterminé) que si l’agent retournait la pièce, il obtiendrait des têtes. De même, le conditionnel correspondant à l'obtention de queues peut être faux (ou indéterminé). Alors les probabilités des conditions ne conviennent pas pour calculer l'utilité attendue de l'option. Les probabilités pertinentes ne totalisent pas une (ou n'existent même pas). Pour contourner de telles impasses,certains théoriciens calculent les utilités attendues causalement sensibles sans probabilités de conditionnelles subjonctives. La théorie de la décision causale a de nombreuses formulations.

Brian Skyrms (1980: Sec IIC; 1982) a présenté une version de la théorie de la décision causale qui dispense des probabilités de conditionnelles subjonctives. Sa théorie sépare les facteurs que l'acte de l'agent peut influencer des facteurs que l'acte de l'agent peut ne pas influencer. Il laisse (K_i) représenter une éventuelle spécification complète des facteurs qu'un agent ne peut pas influencer et laisse (C_j) représenter une spécification possible (mais pas nécessairement complète) des facteurs que l'agent peut influencer. L'ensemble de (K_i) forme une partition et l'ensemble de (C_j) forme une partition. La formule de l'utilité attendue d'un acte calcule d'abord son utilité attendue en utilisant des facteurs que l'agent peut influencer, en ce qui concerne chaque combinaison possible de facteurs hors de l'influence de l'agent. Ensuite, il calcule une moyenne pondérée par les probabilités de ces utilités attendues conditionnelles. L'utilité attendue d'un acte ainsi calculée est l'attente (K) - de l'acte, (textit {EU} _k (A)). Selon la définition de Skyrms,

) textit {EU} _k (A) = / sum_i P (K_i) sum_j P (C_j / mid K_i / amp A) util (C_j / amp K_i / amp A). )

Skyrms soutient qu'un agent devrait sélectionner un acte qui maximise l'attente (K).

Lewis (1981) a présenté une version de la théorie de la décision causale qui calcule l'utilité attendue en utilisant des probabilités d'hypothèses de dépendance plutôt que des probabilités de conditionnelles subjonctives. Une hypothèse de dépendance pour un agent à la fois est une proposition au maximum spécifique sur la façon dont les choses qui intéressent l'agent font et ne dépendent pas causalement de ses actes présents. L'utilité attendue d'une option est son utilité moyenne pondérée en probabilité par rapport à une partition d'hypothèses de dépendance (K_i). Lewis définit l'utilité attendue d'une option (A) comme

) textit {EU} (A) = / sum_i P (K_i) util (K_i / amp A))

et soutient qu'agir rationnellement, c'est réaliser une option qui maximise l'utilité attendue. Sa formule pour l'utilité attendue d'une option est la même que celle de Skyrms en supposant que (U (K_i / amp A)) peut être développé par rapport à une partition de facteurs que l'agent peut influencer, en utilisant la formule

[U (K_i / amp A) = / sum_j P (C_j / mid K_i / amp A) util (C_j / amp K_i / amp A).)

Les calculs d'utilité attendue de Skyrms et Lewis se dispensent des probabilités causales. Ils construisent la causalité dans les états du monde afin que les probabilités causales soient inutiles. Dans des cas tels que le problème de Newcomb, leurs calculs donnent les mêmes recommandations que les calculs d'utilité attendue utilisant des probabilités de conditionnelles subjonctives. Les différentes versions de la théorie de la décision causale font des recommandations équivalentes lorsque les cas répondent à leurs hypothèses de base.

2.4 Théorèmes de représentation

La théorie de la décision introduit souvent la probabilité et l'utilité avec les théorèmes de représentation. Ces théorèmes montrent que si les préférences entre les actes répondent à certaines contraintes, comme la transitivité, alors il existe une fonction de probabilité et une fonction d'utilité (étant donné un choix d'échelle) qui génèrent des utilités attendues en accord avec les préférences. David Krantz, R. Duncan Luce, Patrick Suppes et Amos Tversky (1971) offrent une bonne introduction générale aux objectifs et aux méthodes de construction des théorèmes de représentation. Dans la section 3.1, je discute de la fonction des théorèmes en théorie de la décision.

Richard Jeffrey ([1965] 1983) a présenté un théorème de représentation pour la théorie de la décision probante, en utilisant sa formule d'utilité attendue. Brad Armendt (1986, 1988a) a présenté un théorème de représentation pour la théorie de la décision causale, en utilisant sa formule d'utilité espérée. James Joyce (1999) a construit un théorème de représentation très général qui donne une théorie de la décision causale ou probante en fonction de l'interprétation de la probabilité adoptée par la formule de l'utilité attendue.

2.5 Objections

L'objection la plus courante à la théorie de la décision causale est qu'elle donne le mauvais choix dans le problème de Newcomb. Cela donne deux boxe, alors qu'une boxe est correcte. Terry Horgan (1981 [1985]) et Paul Horwich (1987: Chap. 11), par exemple, font la promotion de la one-boxing. La principale justification du one-boxing est que les one-boxers s'en sortent mieux que les two-boxers. Les théoriciens de la décision causale répondent que le problème de Newcomb est un cas inhabituel qui récompense l'irrationalité. Le one-boxing est irrationnel même si les one-boxers prospèrent.

Certains théoriciens soutiennent que le one-boxing est clairement rationnel si la prédiction est complètement fiable. Ils soutiennent que si la prédiction est certainement exacte, alors le choix se réduit à prendre ($ M) ou à prendre ($ T). Cette vue simplifie à l'extrême. Si un agent one-box, alors cet acte est certain de rapporter ($ M). Cependant, l'agent aurait quand même mieux fait en prenant les deux boîtes. Dominance recommande toujours la double boxe. Faire en sorte que la prédiction soit exacte ne change pas le caractère du problème. L'efficacité l'emporte toujours sur le bon augure, comme le soutient Howard Sobel (1994: chapitre 5).

Une façon de réconcilier les deux côtés du débat sur le problème de Newcomb reconnaît qu'une personne rationnelle doit se préparer au problème en cultivant une disposition à une boîte. Ensuite, chaque fois que le problème se pose, la disposition provoquera une prédiction de one-boxing et ensuite l'acte de one-boxing (toujours librement choisi). La théorie de la décision causale peut reconnaître la valeur de cette préparation. Il peut conclure que cultiver une disposition à une seule boîte est rationnel, bien que la one-boxing elle-même soit irrationnelle. Par conséquent, si dans le problème de Newcomb un agent à deux boîtes, la théorie de la décision causale peut admettre que l'agent ne s'est pas préparé rationnellement au problème. Il soutient néanmoins que la double boxe en elle-même est rationnelle. Bien que la double boxe ne soit pas l'acte d'un agent rationnel au maximum, elle est rationnelle étant donné les circonstances du problème de Newcomb.

La théorie de la décision causale peut également expliquer qu'elle avance une réclamation sur l'évaluation d'un acte compte tenu des circonstances de l'agent dans le problème de Newcomb. Il affirme la rationalité conditionnelle de la double boxe. La rationalité conditionnelle et non conditionnelle traite les erreurs différemment. Contrairement à la rationalité conditionnelle, la rationalité non conditionnelle n'autorise pas les erreurs du passé. Il évalue un acte en tenant compte de l'influence des erreurs passées. Cependant, la rationalité conditionnelle accepte les circonstances présentes telles qu'elles sont et ne discrédite pas un acte parce qu'il découle d'erreurs passées. La théorie de la décision causale soutient que la double boxe est rationnelle, accordant les circonstances de l'agent et ignorant ainsi toute erreur menant à ces circonstances, comme une préparation irrationnelle au problème de Newcomb.

Une autre objection à la théorie de la décision causale concède que la double boxe est le choix rationnel dans le problème de Newcomb, mais rejette les principes causaux de choix qui aboutissent à la double boxe. Il recherche des principes non causaux qui donnent lieu à une double boxe. Le positivisme est une source d'aversion pour les principes de décision intégrant la causalité. Certains théoriciens de la décision évitent la causalité parce qu'aucun récit positiviste n'en précise la nature. Sans définition de la causalité en termes de phénomènes observables, ils préfèrent que la théorie de la décision évite la causalité. La réponse de la théorie de la décision causale à cette objection est à la fois de discréditer le positivisme et aussi de clarifier la causalité afin que les énigmes la concernant ne donnent plus à la théorie de la décision une raison de l'éviter.

La théorie de la décision probante a des hypothèses métaphysiques plus faibles que la théorie de la décision causale, même si la causalité a des références métaphysiques impeccables. Certains théoriciens de la décision n'omettent pas la causalité à cause de scrupules métaphysiques mais pour l'économie conceptuelle. Jeffrey ([1965] 1983, 2004), par souci de parcimonie, formule des principes de décision qui ne reposent pas sur des relations causales.

Ellery Eells (1981, 1982) soutient que la théorie de la décision probante produit les recommandations de la théorie de la décision causale mais, plus économiquement, sans s'appuyer sur l'appareil causal. En particulier, la théorie de la décision probante donne lieu à une double boxe dans le problème de Newcomb. La réflexion d'un agent sur son témoignage fait que les probabilités conditionnelles soutiennent la double boxe.

Une élaboration non contentieuse du problème de Newcomb postule que le choix de l'agent et sa prédiction ont une cause commune. Le choix de l'agent est la preuve de la cause commune et la preuve de la prédiction du choix. Une fois qu'un agent a acquis la probabilité de la cause commune, il peut mettre de côté les preuves que son choix fournit au sujet de la prédiction. Cette preuve est superflue. Compte tenu de la probabilité de la cause commune, la probabilité d'une prédiction de one-boxing est constante par rapport à ses options. De même, la probabilité d'une prédiction de deux boxe est constante par rapport à ses options. Comme la probabilité d'une prédiction est la même conditionnelle à l'une ou l'autre des options, l'utilité attendue du two-boxing dépasse l'utilité attendue du one-boxing selon la théorie de la décision probante. Horgan (1981 [1985]) et Huw Price (1986) font des observations similaires.

Supposons qu'un événement (S) soit le signe d'une cause (C) qui produit un effet (E). Pour la probabilité de (E), savoir si (C) est vrai rend superflu de savoir si (S) est vrai. L'observation de (C) masque la preuve que (S) fournit (E). Autrement dit, (P (E / mid C / amp S) = P (E / mid C)). Dans le problème de Newcomb, en supposant que l'agent est rationnel, ses croyances et ses désirs sont une cause commune de son choix et de la prédiction. Son choix est donc un signe du contenu de la prédiction. Pour la probabilité d'une prédiction de one-boxing, connaître ses croyances et ses désirs rend superflu de connaître le choix qu'ils donnent. La connaissance de la cause commune écarte les preuves que le choix fournit au sujet de la prédiction. Ainsi, la probabilité d'une prédiction de one-boxing est constante par rapport à son choix,et la maximisation de l'utilité attendue de la preuve est conforme au principe de domination. Cette défense de la théorie de la décision probante est appelée la défense contre le chatouillement parce qu'elle suppose qu'une condition introspectionnée masque la corrélation entre le choix et la prédiction.

La défense d'Eells de la théorie de la décision probante suppose qu'un agent choisit en fonction de ses croyances et de ses désirs et connaît ses croyances et ses désirs. Certains agents peuvent ne pas choisir cette méthode et ne pas avoir cette connaissance. La théorie de la décision devrait prescrire un choix rationnel pour de tels agents, et la théorie de la décision probante peut ne pas le faire correctement, comme le soutiennent Lewis (1981: 10-11) et John Pollock (2010). Armendt (1988b: 326–329) et David Papineau (2001: 252–255) s'accordent à dire que le phénomène de filtrage ne permet pas dans tous les cas que la théorie de la décision probante donne les résultats de la théorie de la décision causale.

Horwich (1987: Chap. 11) rejette l'argument d'Eells parce que, même si un agent sait que son choix découle de ses croyances et de ses désirs, il se peut qu'elle ignore le mécanisme par lequel ses croyances et ses désirs produisent son choix. L'agent peut douter de son choix en maximisant l'utilité attendue. Ensuite, dans le problème de Newcomb, son choix peut offrir des preuves pertinentes sur la prédiction. Eells (1984a) construit une version dynamique de la défense contre le chatouillement pour répondre à cette objection. Sobel (1994: chap. 2) discute de cette version de la défense. Il soutient que cela ne donne pas lieu à l'accord de la théorie de la décision probante avec la théorie de la décision causale dans tous les problèmes de décision dans lesquels un acte fournit des preuves concernant l'état du monde. De plus, il n'établit pas qu'une théorie probante du désir rationnel s'accorde avec une théorie causale du désir rationnel. Il conclut que même dans les cas où la théorie de la décision probante donne la bonne recommandation, elle ne la donne pas pour les bonnes raisons.

Price (2012) propose un mélange de théorie de la décision probante et causale et le motive par une analyse de cas dans lesquels un agent a la prescience d'un événement survenu par hasard. La théorie de la décision causale à elle seule tient compte de ces cas, soutient Adam Bales (2016). Arif Ahmed (2014) défend la théorie de la décision probante et avance plusieurs objections à la théorie de la décision causale. Ses objections supposent certains points controversés sur le choix rationnel, y compris un principe controversé pour les séquences de choix.

Une vision commune distingue les principes d'évaluation des choix des principes d'évaluation des séquences de choix. Le principe de maximisation de l'utilité évalue le choix d'un agent comme une résolution d'un problème de décision uniquement si l'agent a le contrôle direct de chaque option dans le problème de décision, c'est-à-dire seulement si l'agent peut à volonté adopter immédiatement n'importe quelle option dans le problème de décision. Le principe n'évalue pas la séquence de choix multiples d'un agent parce que l'agent n'a pas le contrôle direct d'une telle séquence. Elle ne réalise une séquence de choix multiples qu'en faisant chaque choix dans la séquence au moment pour cela; elle ne peut pas à volonté réaliser immédiatement la séquence entière. La rationalité évalue une option dans le contrôle direct d'un agent en la comparant avec des alternatives, mais évalue une séquence dans le contrôle indirect d'un agent en évaluant les options directement contrôlées dans la séquence; une séquence de choix est rationnelle si les choix dans la séquence sont rationnels. L'adoption de cette méthode courante d'évaluation des séquences de choix permet de repousser les objections à la théorie de la décision causale qui suppose des méthodes rivales.

3. Problèmes actuels

La théorie de la décision est un domaine de recherche actif. Les travaux actuels abordent un certain nombre de problèmes. L'approche de la théorie de la décision causale à ces problèmes découle de sa méthodologie nonpositiviste et de son attention à la causalité. Cette section mentionne quelques sujets sur l'agenda de la théorie de la décision causale.

3.1 Probabilité et utilité

Les principes de la théorie de la décision causale utilisent des probabilités et des utilités. L'interprétation des probabilités et des utilités est une question de débat. Une tradition les définit en termes de fonctions que les théorèmes de représentation introduisent pour décrire les préférences. Les théorèmes de représentation montrent que si les préférences rencontrent certains axiomes structurels, alors si elles répondent également à certains axiomes normatifs, elles sont comme si elles suivaient l'utilité attendue. Autrement dit, les préférences suivent l'utilité attendue calculée à l'aide des fonctions de probabilité et d'utilité construites de sorte que les préférences suivent l'utilité attendue. L'utilité attendue calculée de cette manière diffère de l'utilité attendue calculée à l'aide d'attributions de probabilité et d'utilité fondées sur des attitudes à l'égard des résultats possibles. Par exemple,une personne confuse au sujet des paris concernant un tirage au sort peut avoir des préférences parmi ces paris qui sont comme si elle attribuait une probabilité de 60% aux têtes, alors qu'en fait, la preuve des lancers passés l'amène à attribuer une probabilité de 40% aux têtes. Par conséquent, lorsque les préférences rencontrent les axiomes structuraux d'un théorème de représentation, les axiomes normatifs du théorème ne justifient que la conformité à l'utilité attendue fabriquée pour s'accorder avec les préférences et ne justifient pas la conformité à l'utilité attendue au sens traditionnel. La définition de la probabilité et de l'utilité à l'aide des théorèmes de représentation affaiblit ainsi le principe traditionnel de l'utilité attendue. Cela devient simplement un principe de cohérence entre les préférences.lorsque les préférences rencontrent les axiomes structurels d'un théorème de représentation, les axiomes normatifs du théorème ne justifient que la conformité à l'utilité attendue fabriquée pour s'accorder avec les préférences et ne justifient pas la conformité à l'utilité attendue au sens traditionnel. La définition de la probabilité et de l'utilité à l'aide des théorèmes de représentation affaiblit ainsi le principe traditionnel de l'utilité attendue. Cela devient simplement un principe de cohérence entre les préférences.lorsque les préférences rencontrent les axiomes structurels d'un théorème de représentation, les axiomes normatifs du théorème ne justifient que la conformité à l'utilité attendue fabriquée pour s'accorder avec les préférences et ne justifient pas la conformité à l'utilité attendue au sens traditionnel. La définition de la probabilité et de l'utilité à l'aide des théorèmes de représentation affaiblit ainsi le principe traditionnel de l'utilité attendue. Cela devient simplement un principe de cohérence entre les préférences. Cela devient simplement un principe de cohérence entre les préférences. Cela devient simplement un principe de cohérence entre les préférences.

Au lieu d'utiliser les théorèmes de représentation pour définir les probabilités et les utilités, la théorie de la décision peut les utiliser pour établir la mesurabilité des probabilités et des utilités lorsque les préférences rencontrent des axiomes structurels et normatifs. Cet emploi des théorèmes de représentation permet à la théorie de la décision de faire progresser le principe traditionnel de l'utilité attendue et d'enrichir ainsi son traitement des décisions rationnelles. La théorie de la décision peut justifier ce principe traditionnel en le dérivant de principes généraux d'évaluation, comme dans Weirich (2001).

Un large compte rendu des probabilités et des utilités les prend pour indiquer les attitudes envers les propositions. Ce sont respectivement des degrés rationnels de croyance et des degrés rationnels de désir. Ce compte rendu des probabilités et des utilités reconnaît leur existence dans les cas où ils ne sont pas déductibles des préférences ou de leurs autres effets mais sont plutôt déductibles de leurs causes, telles que les informations d'un agent sur les probabilités objectives, ou ne sont pas du tout déductibles (sauf peut-être par introspection). Le récit repose sur des arguments selon lesquels les degrés de croyance et les degrés de désir, s'ils sont rationnels, sont conformes aux principes standard de probabilité et d'utilité. Renforcer ces arguments est un travail pour la théorie de la décision causale.

En plus de clarifier son interprétation générale de la probabilité et de l'utilité, la théorie de la décision causale recherche les probabilités et les utilités particulières qui donnent la meilleure version de son principe pour maximiser l'utilité attendue. Les probabilités causales dans sa formule d'utilité attendue peuvent être des probabilités de conditionnelles subjonctives ou de divers substituts. Les versions qui utilisent des probabilités de conditionnelles subjonctives doivent se contenter d'une analyse de ces conditions. Lewis (1973: Chap.1) modifie l'analyse de Stalnaker pour compter un subjonctif conditionnel vrai si et seulement si, à mesure que les mondes antécédents se rapprochent de plus en plus du monde réel, il y a un point au-delà duquel le conséquent est vrai dans tous les mondes du moins que proche. Joyce (1999: 161-180) propose des images probabilistes, comme Lewis (1976) les présente,comme substituts des probabilités de conditionnelles subjonctives. L'image de probabilité d'un état (S) sous supposition subjonctive d'un acte (A) est la probabilité de (S) selon une affectation qui décale la probabilité de ({ sim} A) - mondes à proximité (A) - mondes. Les relations causales entre un acte et les états possibles guident la réaffectation de la probabilité.

Une formule courante pour l'utilité attendue d'un acte prend l'utilité d'une paire acte-état, l'utilité du résultat de l'acte dans l'état, comme l'utilité de la conjonction de l'acte et de l'état:

) textit {EU} (A) = / sum_i P (A / gt S_i) util (A / amp S_i).)

La théorie de la décision causale a-t-elle besoin d'une utilité alternative, plus sensible à la causalité pour une paire acte-état? Weirich (1980) soutient que c'est le cas. Une personne qui envisage de parier que la capitale du Missouri est Jefferson City en éprouve les conséquences s'il devait faire le pari étant donné que Saint-Louis est la capitale du Missouri. Un délibérateur rationnel suppose subjonctivement un acte qui s'occupe des relations causales et suppose à titre indicatif un état s'occupant des relations de preuve, mais ne peut supposer la conjonction d'un acte et d'un état que dans un seul sens. De plus, l'utilisation de l'utilité de la conjonction d'un acte et d'un état empêche l'utilité attendue d'un acte d'être invariante par partition. La sous-section suivante élabore ce point.

3.2 Invariance de partition

L'utilité attendue d'un acte est invariante de partition si et seulement si elle est la même sous toutes les partitions d'états. L'invariance de partition est une propriété vitale de l'utilité attendue d'un acte. Si les utilitaires attendus des actes n'ont pas cette propriété, alors la théorie de la décision peut utiliser uniquement les utilitaires attendus calculés à partir de partitions sélectionnées. L'invariance de partition de l'utilité attendue rend l'utilité attendue d'un acte indépendante de la sélection d'une partition d'états et augmente ainsi le pouvoir explicatif de l'utilité attendue.

L'invariance de partition garantit que diverses représentations du même problème de décision donnent des solutions concordantes. Prenons le problème de Newcomb avec la représentation de la figure 2.

Bonne prédiction Mauvaise prédiction
Prenez une seule boîte ($ M) 0 $
Prenez deux boîtes ($ T) ($ M + / $ T)

Figure 2. Nouveaux états pour le problème de Newcomb

La dominance ne s'applique pas à cette représentation. Il règle néanmoins la solution du problème car il s'applique à un problème de décision s'il s'applique à une représentation précise du problème, telle que la représentation du problème dans la figure 1. Si les utilitaires attendus sont sensibles à la partition, alors les actions qui maximisent l'utilité attendue peuvent être sensibles à la partition. Cependant, le principe de l'utilité attendue ne permet pas de résoudre un problème de décision si les actes d'utilité attendue maximum changent d'une partition à l'autre. Dans ce cas, un acte n'est pas une solution à un problème de décision simplement parce qu'il maximise l'utilité attendue sous une représentation précise du problème. Trop d'actes ont le même titre.

Le principe d'utilité espérée, utilisant les probabilités de conditions, s'applique à la représentation du problème de Newcomb par la figure 2. En laissant (P1) une prédiction de one-boxing et (P2) une prédiction de two-boxing, les utilités attendues des actes sont:

) begin {align} textit {EU} (1) & = P (1 / gt R) util ($ M) + P (1 / gt W) 0 \& = P (P1) util ($ M) / \ textit {EU} (2) & = P (2 / gt R) util ($ T) + P (2 / gt W) util ($ M + / $ T) & = P (P2) util ($ T) + P (P1) util ($ M + / $ T) / \ end {align})

D'où (textit {EU} (1) lt EU (2)). Ce résultat est en accord avec le verdict de la théorie de la décision causale étant donné d'autres représentations précises du problème. À condition que la théorie de la décision causale utilise une formule invariante de partition pour l'utilité attendue, ses recommandations sont indépendantes de la représentation d'un problème de décision.

Lewis (1981: 12-13) observe que la formule

[EU (A) = / sum_i P (S_i) util (A / amp S_i))

n'est pas une partition invariante. Ses résultats dépendent de la partition des états. Si un état est un ensemble de mondes avec des utilités égales, alors par rapport à une partition de tels états, chaque acte a la même utilité attendue. Un élément (S_i) de la partition masque les effets de (A) que l'utilité d'un résultat devrait évaluer. Lewis surmonte ce problème en n'utilisant que des partitions d'hypothèses de dépendance. Cependant, la théorie de la décision causale peut élaborer une formule invariante de partition pour l'utilité attendue en adoptant un substitut pour (U (A / amp S_i)).

Sobel (1994: Chap.9) étudie l'invariance de partition. En mettant son travail dans la notation de cet essai, il procède comme suit. Premièrement, il prend un calcul canonique de l'utilité attendue d'une option pour utiliser des mondes comme états. Sa formule de base est

) textit {EU} (A) = / sum_i P (A / gt W_i) util (W_i).)

Un monde (W_i) absorbe un acte accompli en lui. Seuls les mondes dans lesquels (A) tient contribuent aux probabilités positives et affectent ainsi la somme. Ensuite, Sobel recherche d'autres calculs, en utilisant des états à gros grains, qui sont équivalents au calcul canonique. Une spécification appropriée des utilitaires réalise l'invariance de partition compte tenu de ses hypothèses. Selon un théorème qu'il prouve (1994: 185), [U (A) = / sum_i P (S_i) util (A / mbox {donné} S_i))

pour toute partition d'états.

Joyce (2000: S11) formule également pour la théorie de la décision causale une formule invariante de partition pour l'utilité attendue d'un acte. Il atteint l'invariance de partition, en supposant que

) textit {EU} (A) = / sum_i P (A / gt S_i) util (A / amp S_i),)

en stipulant que (U (A / amp S_i)) vaut

) sum_ {ij} P ^ A (W_j / mid S_i) util (W_j),)

où (W_j) est un monde et (P ^ A) représente l'image de probabilité de (A). Weirich (2001: Secs.3.2, 4.2.2), comme le fait Sobel, remplace (U (A / mbox {given} S_i)) pour (U (A / amp S_i)) dans la formule de l'utilité attendue et interprète (U (A / mbox {donné} S_i)) comme l'utilité du résultat que la réalisation de (A) produirait si (S) obtient. En conséquence, (U (A / mbox {donné} S_i)) répond aux conséquences causales de (A) dans les mondes où (S_i) est valable. Puis la formule

) textit {EU} (A) = / sum_i P (S_i) util (A / mbox {given} S_i))

est invariant par rapport aux partitions dans lesquelles les états sont probablement indépendants de l'acte. Une formule plus complexe,) textit {EU} (A) = / sum_i P (S_i / mbox {if} A) util (A / mbox {given} (S_i / mbox {if} A)),)

en supposant une interprétation causale de ses probabilités, assouplit toute restriction sur les partitions. (U (A / mbox {given} (S_i / mbox {if} A))) est l'utilité du résultat si (A) était réalisé, étant donné que c'est le cas où (S_i) obtenir si (A) ont été réalisés.

3.3 Résultats

Un problème concernant les résultats est leur exhaustivité. Les résultats d'un acte sont-ils des mondes possibles, des séquelles temporelles ou des conséquences causales? Gibbard et Harper ([1978] 1981: 166-168) mentionnent la possibilité de réduire les résultats aux conséquences causales, comme le préconise l'applicabilité pratique. La restriction doit cependant être judicieuse, car le principe de l'utilité attendue exige que les résultats incluent toutes les considérations pertinentes. Par exemple, si un agent est opposé au risque, chacun des résultats possibles d'un acte à risque doit inclure le risque que l'acte génère. Son inclusion tend à diminuer l'utilité de chaque résultat possible.

Dans la formule canonique de Sobel pour l'utilité attendue,) textit {EU} (A) = / sum_i P (A / gt W_i) util (W_i).)

La formule, d'un certain point de vue, omet les états du monde parce que les résultats eux-mêmes forment une partition. La distinction entre les états et les résultats se dissout parce que les mondes jouent le rôle à la fois des états et des résultats. Les États sont des moyens inutiles pour générer des résultats exclusifs et exhaustifs. Selon un principe de base, l'utilité attendue d'un acte est une moyenne pondérée par les probabilités des résultats possibles exclusifs et exhaustifs, comme les mondes vers lesquels l'acte peut conduire.

Supposons que l'utilité d'un monde vienne de la réalisation de désirs et d'aversions intrinsèques de base. En admettant que les utilités de leurs réalisations soient additives, l'utilité d'un monde est une somme des utilités de leurs réalisations. Ensuite, en plus d'être une moyenne pondérée par les probabilités des utilités des mondes auxquels elle peut conduire, l'utilité attendue d'une option est également une moyenne pondérée par les probabilités des réalisations des désirs et aversions intrinsèques de base. Dans cette formule de son utilité attendue, les États ne jouent aucun rôle explicite:

) textit {EU} (A) = / sum_i P (A / gt B_i) util (B_i),)

où (B_i) s'étend sur les réalisations possibles des désirs et aversions intrinsèques de base. La formule considère pour chaque désir et aversion de base la perspective de sa réalisation si l'acte était accompli. Il prend l'utilité attendue de l'acte comme la somme des utilités des prospects. La formule fournit une représentation économique de l'utilité attendue d'un acte. Il élimine les états et obtient l'utilité attendue directement à partir des résultats considérés comme des réalisations de désirs et d'aversions de base.

Pour illustrer le calcul de l'utilité attendue d'un acte en utilisant des désirs et des aversions intrinsèques de base, supposons qu'un agent n'ait pas d'aversions intrinsèques de base et juste deux désirs intrinsèques de base, l'un pour la santé et l'autre pour la sagesse. L'utilité de la santé est de 4 et l'utilité de la sagesse est de 8. Dans la formule de l'utilité attendue, un monde ne couvre que les matières dont l'agent se soucie. Dans l'exemple, un monde est une proposition précisant si l'agent a la santé et s'il a la sagesse. En conséquence, il existe quatre mondes:) begin {align} H / amp W, \\ H / amp { sim} W, \{ sim} H / amp W, \{ sim} H / amp { sim} W. \\ / end {align}) Supposons que (A) est également susceptible de générer n'importe quel monde. En utilisant des mondes,) begin {align} textit {EU} (A) & = P (A / gt (H / amp W)) util (H / amp W) & / qquad + P (A / gt (H / amp { sim} W)) util (H / amp { sim} W) &\ qquad + P (A / gt ({ sim} H / amp W)) util ({ sim} H / amp W) & / qquad + P (A / gt ({ sim} H / amp { sim} W)) util ({ sim} H / amp { sim} W) & = (0,25) (12) + (0,25) (4) + (0,25) (8) + (0,25) (0) & = 6. \\ / end {align}) En utilisant des attitudes intrinsèques de base,) begin {align} textit {EU} (A) & = P (A / gt H) util (H) + P (A / gt W) util (W) & = (0,5) (4) + (0,5) (8) & = 6. / end {align}) Les deux méthodes de le calcul de l'utilité d'une option est équivalent étant donné que, sous l'hypothèse de la réalisation d'un acte, la probabilité de réalisation d'un désir ou d'une aversion intrinsèque de base est la somme des probabilités des mondes qui le réalisent.\\ / end {align}) En utilisant des attitudes intrinsèques de base,) begin {align} textit {EU} (A) & = P (A / gt H) util (H) + P (A / gt W) util (W) & = (0.5) (4) + (0.5) (8) & = 6. / end {align}) Les deux méthodes de calcul de l'utilité d'une option sont équivalentes étant donné que, sous supposition de la réalisation d'un acte, la probabilité de réalisation d'un désir ou d'une aversion intrinsèque de base est la somme des probabilités des mondes qui le réalisent.\\ / end {align}) En utilisant des attitudes intrinsèques de base,) begin {align} textit {EU} (A) & = P (A / gt H) util (H) + P (A / gt W) util (W) & = (0.5) (4) + (0.5) (8) & = 6. / end {align}) Les deux méthodes de calcul de l'utilité d'une option sont équivalentes étant donné que, sous supposition de la réalisation d'un acte, la probabilité de réalisation d'un désir ou d'une aversion intrinsèque de base est la somme des probabilités des mondes qui le réalisent.la probabilité de réalisation d'un désir ou d'une aversion intrinsèque de base est la somme des probabilités des mondes qui le réalisent.la probabilité de réalisation d'un désir ou d'une aversion intrinsèque de base est la somme des probabilités des mondes qui le réalisent.

3.4 Actes

Dans les délibérations, une proposition d'action à la première personne représente un acte. La proposition a une structure sujet-prédicat et renvoie directement à l'agent, son sujet, sans l'intermédiaire d'un concept d'agent. Un monde centré représente la proposition. Un tel monde spécifie non seulement les individus, leurs propriétés et leurs relations, mais précise également quel individu est l'agent et où et quand se pose son problème de décision. La réalisation de l'acte est la réalisation d'un monde avec, en son centre, l'agent au moment et au lieu de son problème de décision.

Isaac Levi (2000) s'oppose à toute théorie de la décision qui attache des probabilités aux actes. Il soutient que la délibération évince la prédiction. Tout en délibérant, un agent n'a pas de croyances ou de degrés de croyance quant à l'acte qu'il va accomplir. Levi soutient que le problème de Newcomb, et les théories de décision probante et causale qui le traitent, impliquent des attributions erronées de probabilités aux actes d'un agent. Il rejette à la fois la théorie de la décision probante de Jeffrey ([1965] 1983) et la théorie de la décision causale de Joyce (1999) parce qu'elles permettent à un agent d'attribuer des probabilités à ses actes pendant la délibération.

En opposition aux vues de Levi, Joyce (2002) soutient que (1) la théorie de la décision causale n'a pas besoin de s'adapter à l'attribution de probabilités d'un agent à ses actes, mais (2) un agent délibérant peut légitimement attribuer des probabilités à ses actes. La théorie de la décision probante calcule l'utilité attendue d'un acte en utilisant la probabilité d'un état donné à l'acte, (P (S / mid A)), défini comme (P (S / amp A) / P (A)). Le dénominateur de la fraction attribue une probabilité à un acte. La théorie de la décision causale remplace (P (S / mid A)) par (P (A / gt S)) ou une probabilité causale similaire. Il n'est pas nécessaire d'attribuer une probabilité à un acte.

Un agent délibérant peut-il attribuer des probabilités à ses actes possibles? Oui, un délibérant peut raisonnablement attribuer des probabilités à tout événement, y compris ses actes. La théorie de la décision causale peut accepter de telles probabilités en renonçant à leur mesure avec des quotients de paris. Selon cette méthode de mesure, la volonté de faire des paris indique des probabilités. Supposons qu'une personne est disposée à prendre l'un ou l'autre côté d'un pari dans lequel l'enjeu de l'événement est (x) et l'enjeu contre l'événement est (y). Alors la probabilité que la personne attribue à l'événement est le quotient de pari (x / (x + y)). Cette méthode de mesure peut échouer lorsque l'événement est le propre acte futur d'un agent. Un pari sur la réalisation d'un acte peut influencer la probabilité de l'acte, car la température d'un thermomètre peut influencer la température d'un liquide qu'il mesure.

Joyce (2007: 552–561) examine si les problèmes de Newcomb sont de véritables problèmes de décision malgré de fortes corrélations entre les états et les actes. Il conclut que, oui, malgré ces corrélations, un agent peut considérer sa décision comme la cause de son acte. La décision d'un agent soutient une croyance sur son acte indépendamment des corrélations antérieures entre les états et son acte. Selon un principe d'autonomie de la preuve (2007: 557),

Un agent délibérant qui se considère comme libre n'a pas besoin de proportionner ses croyances sur ses propres actes aux preuves antérieures dont elle dispose pour penser qu'elle les exécutera.

Elle devrait proportionner ses croyances à ses preuves totales, y compris ses croyances autosuffisantes sur ses propres actes. Ces croyances fournissent de nouvelles preuves pertinentes sur ses actes.

Comment un agent qui délibère sur un acte devrait-il comprendre le contexte de son acte? Elle ne devrait pas adopter une supposition de retour en arrière de son acte. Debout au bord d'une falaise, elle ne devrait pas supposer que si elle sautait, elle aurait un parachute pour briser sa chute. De plus, elle ne doit pas imaginer des changements gratuits dans ses désirs fondamentaux. Elle ne devrait pas imaginer que si elle choisissait le chocolat au lieu de la vanille, bien qu'elle préfère actuellement la vanille, elle préférerait alors le chocolat. Elle doit imaginer que ses désirs fondamentaux sont constants lorsqu'elle imagine les divers actes qu'elle peut accomplir et, de plus, adopter au cours des délibérations le prétexte que sa volonté génère son acte indépendamment de ses désirs et aversions fondamentaux.

Christopher Hitchcock (1996) soutient qu'un agent devrait prétendre que son acte est libre de toute influence causale. Cela permet aux partitions d'états donnant des probabilités de décision de s'accorder avec les partitions d'états donnant des probabilités définissant la pertinence causale. En conséquence, les probabilités dans la théorie de la décision causale peuvent former une base pour les probabilités dans la théorie probabiliste de la causalité. La théorie de la décision causale, en particulier, la version utilisant les hypothèses de dépendance, fonde les théories de la causalité probabiliste.

3.5 Généralisation de l'utilité attendue

Des problèmes tels que le pari de Pascal et le paradoxe de Saint-Pétersbourg suggèrent que la théorie de la décision a besoin d'un moyen de gérer des utilités infinies et des utilités attendues. Supposons que les résultats possibles d'une option aient tous des utilités finies. Néanmoins, si ces utilitaires sont infiniment nombreux et illimités, alors l'utilité attendue de l'option peut être infinie. Alan Hájek et Harris Nover (2006) montrent également que l'option peut n'avoir aucune utilité attendue. L'ordre des résultats possibles, qui est arbitraire, peut affecter la convergence de la moyenne pondérée par les probabilités de leurs services publics et la valeur vers laquelle la moyenne converge si elle converge. La théorie de la décision causale devrait généraliser son principe de maximisation de l'utilité attendue pour traiter de tels cas.

En outre, les principes communs de la théorie de la décision causale font progresser des normes de rationalité trop exigeantes pour s'appliquer aux humains. Ce sont des standards d'agents idéaux dans des circonstances idéales (une formulation précise des idéalisations peut varier d'un théoricien à l'autre). Pour rendre la théorie de la décision causale réaliste, il faut assouplir les idéalisations que ses principes supposent. Une généralisation du principe de maximisation de l'utilité attendue, par exemple, peut relâcher les idéalisations pour s'adapter à des capacités cognitives limitées. Weirich (2004) et Pollock (2006) prennent des mesures dans ce sens. Des généralisations appropriées distinguent la prise de maximisation de l'utilité attendue comme une procédure pour prendre une décision et la prise comme norme pour évaluer une décision même après que la décision a été prise.

3.6 Ratification

Gibbard et Harper (1978: Sec. 11) présentent un problème pour la théorie de la décision causale en utilisant un exemple tiré de la littérature. Un homme à Damas sait qu'il a rendez-vous avec la mort à minuit. Il échappera à la Mort s'il parvient à minuit à ne pas être sur le lieu de son rendez-vous. Il peut être à Damas ou à Alep à minuit. Comme l'homme le sait, la mort est un bon indicateur de l'endroit où il se trouve. S'il reste à Damas, il a ainsi la preuve que la mort le cherchera à Damas. Cependant, s'il se rend à Alep, il a ainsi la preuve que la mort le recherchera à Alep. Partout où il décide d'être à minuit, il a la preuve qu'il serait mieux à l'autre endroit. Aucune décision n'est stable. L'instabilité de la décision survient dans les cas où un choix fournit des preuves de son issue,et chaque choix prouve qu'un autre choix aurait été préférable. Reed Richter (1984, 1986) utilise des cas d'instabilité décisionnelle pour argumenter contre la théorie de la décision causale. La théorie a besoin d'une résolution du problème de l'instabilité décisionnelle.

Une analyse commune du problème classe les options comme auto-ratifiantes ou non auto-ratifiées. Jeffrey ([1965] 1983) a introduit la ratification comme une composante de la théorie de la décision probante. Sa version de la théorie évalue une décision en fonction de l'utilité attendue de l'acte qu'elle sélectionne. La distinction entre un acte et une décision d'accomplir l'acte fonde sa définition de l'auto-ratification d'une option et son principe de rendre des décisions auto-ratifiantes ou ratifiables. Selon sa définition ([1965] 1983: 16),

Une décision ratifiable est une décision d'accomplir un acte de désirabilité estimée maximale par rapport à la matrice de probabilité que l'agent pense qu'il aurait s'il décidait finalement d'accomplir cet acte.

L'utilité estimée est l'utilité attendue. La matrice de probabilité d'un agent est un tableau de lignes et de colonnes pour les actes et les états, respectivement, chaque cellule étant formée par l'intersection de la ligne d'un acte et de la colonne d'un état contenant la probabilité de l'état étant donné que l'agent est sur le point d'accomplir l'acte. Avant d'accomplir un acte, un agent peut évaluer l'acte à la lumière d'une décision de l'accomplir. Les informations contenues dans la décision peuvent affecter l'utilité attendue de l'acte et son classement par rapport à d'autres actes.

Jeffrey a utilisé la ratification comme un moyen de faire en sorte que la théorie de la décision probante donne les mêmes recommandations que la théorie de la décision causale. Dans le problème de Newcomb, par exemple, la double boxe est la seule option auto-ratifiante. Cependant, Jeffrey (2004: 113n) admet que le fait que la théorie de la décision probante s'appuie sur la ratification ne la rend pas d'accord avec la théorie de la décision causale dans tous les cas. De plus, Joyce (2007) soutient que la motivation de la ratification fait appel aux relations causales, de sorte que même si elle donne des recommandations correctes en utilisant la formule de Jeffrey pour l'utilité attendue, elle ne donne toujours pas une théorie de la décision purement probante.

Le compte rendu de la théorie de la décision causale sur l'auto-ratification peut mettre de côté la méthode de Jeffrey pour évaluer une décision en évaluant l'acte qu'elle choisit. Parce que la décision et l'acte diffèrent, ils peuvent avoir des conséquences différentes. Par exemple, une décision peut ne pas générer l'acte qu'elle sélectionne. Par conséquent, l'utilité attendue de la décision peut différer de l'utilité attendue de l'acte. Conduire sur une section inondée de l'autoroute peut avoir une utilité attendue élevée car cela minimise le temps de trajet jusqu'à sa destination. Cependant, la décision de traverser la section inondée peut avoir une faible utilité attendue car, pour tous, on sait que l'eau peut être suffisamment profonde pour submerger la voiture. L'utilisation de l'utilité attendue d'un acte pour évaluer une décision d'accomplir l'acte conduit à des évaluations erronées des décisions. Il vaut mieux évaluer une décision en comparant son utilité attendue aux utilités attendues des décisions concurrentes. L'utilité attendue d'une décision dépend de la probabilité de son exécution ainsi que des conséquences attendues de l'acte qu'elle choisit.

Weirich (1985) et Harper (1986) définissent la ratification en termes d'utilité attendue d'une option compte tenu de sa réalisation plutôt que de la décision de la réaliser. Une option s'auto-ratifie si et seulement si elle maximise l'utilité attendue compte tenu de sa réalisation. Ce compte rendu de ratification tient compte des cas dans lesquels une option et une décision de la réaliser ont des utilités attendues différentes. Weirich et Harper supposent également la formule de la théorie de la décision causale pour l'utilité attendue. Dans le cas de la mort à Damas, la théorie de la décision causale conclut que l'homme menacé n'a pas d'option d'auto-ratification. Une option d'auto-ratification émerge, cependant, si l'homme peut lancer une pièce pour prendre sa décision. L'adoption de la distribution de probabilité pour les emplacements est appelée une stratégie mixte, tandis que les choix de l'emplacement sont appelés stratégies pures. En supposant que la mort ne peut pas prédire le résultat du tirage au sort, la stratégie mixte s'auto-ratifie.

Au cours des délibérations pour résoudre un problème de décision, un agent peut réviser les probabilités qu'il attribue à des stratégies pures à la lumière des calculs de leurs utilités attendues en utilisant des assignations de probabilité antérieures. Le processus de révision peut aboutir à une attribution de probabilité stable qui représente une stratégie mixte. Skyrms (1982, 1990) et Eells (1984b) étudient ces dynamiques de délibération. Certaines questions en suspens sont de savoir si l'adoption d'une stratégie mixte résout un problème de décision et si une stratégie pure issue d'une stratégie mixte qui constitue un équilibre des délibérations est rationnelle si la stratégie pure elle-même ne s'auto-ratifie pas.

Andy Egan (2007) soutient que la théorie de la décision causale produit la mauvaise recommandation dans les problèmes de décision avec une option qui fournit des preuves concernant son résultat. Il entretient le cas d'un assassin qui délibère d'appuyer sur la détente, sachant que la réalisation de l'option fournit la preuve d'une lésion cérébrale qui ruine sa visée. Egan soutient que la théorie de la décision causale ignore à tort les preuves fournies par l'option. Cependant, les versions de la théorie de la décision causale qui intègrent la ratification sont innocentes des accusations. La ratification tient compte des preuves fournies par une option concernant son résultat.

Toute version du principe d'utilité attendue, qu'elle utilise des probabilités conditionnelles ou des probabilités conditionnelles, doit spécifier les informations qui guident les attributions de probabilités et d'utilités. Les principes de maximisation de l'utilité attendue non conditionnelle utilisent les mêmes informations pour toutes les options et excluent donc les informations sur la réalisation d'une option. Le principe de ratification utilise pour chaque option des informations qui incluent la réalisation de l'option. C'est un principe de maximisation conditionnelle de l'utilité attendue. Les cas d'Egan comptent contre la maximisation non conditionnelle de l'utilité attendue et non contre la théorie de la décision causale. La maximisation conditionnelle de l'utilité attendue à l'aide de la formule de la théorie de la décision causale pour l'utilité attendue traite les cas qu'il présente.

Les exemples d'Egan ne réfutent pas la théorie de la décision causale mais présentent un défi pour elle. Supposons que dans un problème de décision, aucune option d'auto-ratification n'existe, ou qu'il existe plusieurs options d'auto-ratification. Comment un agent rationnel doit-il procéder, en accordant qu'un principe de décision doit tenir compte des informations fournies par une option? Il s'agit d'un problème ouvert dans la théorie de la décision causale (et dans toute théorie de la décision reconnaissant que la réalisation d'une option peut constituer une preuve concernant son résultat). La ratification analyse l'instabilité des décisions, mais ne constitue pas une réponse complète à celle-ci.

En réponse à Egan, Frank Arntzenius (2008) et Joyce (2012) soutiennent que, dans certains problèmes de décision, les délibérations rationnelles d'un agent utilisant des informations librement disponibles ne se règlent pas sur une seule option, mais plutôt sur une distribution de probabilité sur les options. Ils reconnaissent que l'agent peut regretter l'option issue de ces délibérations, mais diffèrent quant à l'importance du regret. Arntzenius soutient que le regret compte contre la rationalité de l'option, alors que Joyce le nie. Ahmed (2012) et Ralph Wedgwood (2013) rejettent les réponses d'Arntzenius et de Joyce à Egan parce qu'ils estiment que les délibérations devraient se prononcer sur une option. Wedgwood introduit un nouveau principe de décision pour tenir compte des problèmes de décision d'Egan. Ahmed soutient que l'analyse d'Egan de ces problèmes de décision a un défaut parce que lorsqu'elle est étendue à d'autres problèmes de décision, elle déclare chaque option irrationnelle.

Les points sur la ratification dans les problèmes de décision clarifient les points sur l'équilibre en théorie des jeux parce que dans les jeux de stratégie, le choix d'un joueur fournit souvent des preuves sur les choix des autres joueurs. La théorie de la décision sous-tend la théorie des jeux parce que la solution d'un jeu identifie des choix rationnels dans les problèmes de décision que le jeu crée pour les joueurs. Les solutions aux jeux distinguent corrélation et causalité, tout comme les principes de décision. Parce que dans les jeux à mouvements simultanés, les stratégies de deux agents peuvent être corrélées mais non liées en tant que cause et effet, les solutions à ces jeux n'ont pas les mêmes propriétés que les solutions aux jeux séquentiels. La théorie de la décision causale s'occupe des distinctions dont dépendent les solutions aux jeux. Il soutient le compte rendu de la théorie des jeux sur les décisions interactives.

L'existence de stratégies mixtes auto-ratifiantes dans des problèmes de décision tels que Mort à Damas suggère que la ratification, comme l'explique la théorie de la décision causale, soutient la participation à l'équilibre de Nash d'un jeu. Un tel équilibre attribue une stratégie à chaque joueur afin que chaque stratégie de la mission soit la meilleure réponse aux autres. Supposons que deux personnes jouent à Matching Pennies. Simultanément, chacun affiche un centime. Un joueur essaie de faire correspondre les côtés, et l'autre joueur essaie d'empêcher un match. Si le premier joueur réussit, il obtient les deux sous. Sinon, le deuxième joueur reçoit les deux centimes. Supposons que chaque joueur soit doué pour prédire l'autre joueur, et chaque joueur le sait. Ensuite, si le premier joueur affiche des têtes, il a des raisons de penser que le deuxième joueur affiche des queues. Aussi,si le premier joueur affiche des queues, il a des raisons de penser que le second joueur affiche des têtes. Parce que Matching Pennies est un jeu à mouvements simultanés, la stratégie des deux joueurs n'influence pas la stratégie de l'autre joueur, mais la stratégie de chaque joueur est la preuve de la stratégie de l'autre joueur. Des stratégies mixtes aident à résoudre l'instabilité de décision dans ce cas. Si le premier joueur retourne son sou pour régler le côté à afficher, alors sa stratégie mixte s'auto-ratifie. La situation du deuxième joueur est similaire, et elle atteint également une stratégie d'auto-ratification en retournant son centime. La combinaison de stratégies auto-ratifiantes est un équilibre de Nash du jeu. Joyce et Gibbard (1998) décrivent le rôle de la ratification dans la théorie des jeux. La stratégie d'aucun joueur n'influence la stratégie de l'autre joueur, mais la stratégie de chaque joueur est la preuve de la stratégie de l'autre joueur. Des stratégies mixtes aident à résoudre l'instabilité de décision dans ce cas. Si le premier joueur retourne son sou pour régler le côté à afficher, alors sa stratégie mixte s'auto-ratifie. La situation du deuxième joueur est similaire, et elle atteint également une stratégie d'auto-ratification en retournant son centime. La combinaison de stratégies auto-ratifiantes est un équilibre de Nash du jeu. Joyce et Gibbard (1998) décrivent le rôle de la ratification dans la théorie des jeux. La stratégie d'aucun joueur n'influence la stratégie de l'autre joueur, mais la stratégie de chaque joueur est la preuve de la stratégie de l'autre joueur. Des stratégies mixtes aident à résoudre l'instabilité de décision dans ce cas. Si le premier joueur retourne son sou pour régler le côté à afficher, alors sa stratégie mixte s'auto-ratifie. La situation du deuxième joueur est similaire, et elle atteint également une stratégie d'auto-ratification en retournant son centime. La combinaison de stratégies auto-ratifiantes est un équilibre de Nash du jeu. Joyce et Gibbard (1998) décrivent le rôle de la ratification dans la théorie des jeux.alors sa stratégie mixte s'auto-ratifie. La situation du deuxième joueur est similaire, et elle atteint également une stratégie d'auto-ratification en retournant son centime. La combinaison de stratégies auto-ratifiantes est un équilibre de Nash du jeu. Joyce et Gibbard (1998) décrivent le rôle de la ratification dans la théorie des jeux.alors sa stratégie mixte s'auto-ratifie. La situation du deuxième joueur est similaire, et elle atteint également une stratégie d'auto-ratification en retournant son centime. La combinaison de stratégies auto-ratifiantes est un équilibre de Nash du jeu. Joyce et Gibbard (1998) décrivent le rôle de la ratification dans la théorie des jeux.

Weirich (2004: Chap. 9) présente une méthode de sélection parmi plusieurs stratégies d'auto-ratification, et donc une méthode par laquelle un groupe d'acteurs peut se coordonner pour réaliser un équilibre de Nash particulier lorsqu'il en existe plusieurs. Bien que l'instabilité de la décision soit un problème ouvert, la théorie de la décision causale dispose de ressources pour y remédier. La résolution finale du problème par la théorie offrira à la théorie des jeux une justification de la participation à un équilibre de Nash d'un jeu.

4. Thèmes connexes et remarques finales

La théorie de la décision causale a des fondements dans divers domaines de la philosophie. Par exemple, il s'appuie sur la métaphysique pour rendre compte de la causalité. Il repose également sur la logique inductive pour un compte des inférences concernant la causalité. Une théorie de la décision causale complète traite non seulement les utilités attendues de la «génération d'options» des probabilités causales, mais également la génération des preuves des probabilités causales.

La recherche sur la causalité contribue aux fondements métaphysiques de la théorie de la décision causale. Nancy Cartwright (1979), par exemple, s'appuie sur des idées sur la causalité pour étoffer les détails de la théorie de la décision causale. En outre, certains récits de causalité distinguent les types de causes. L'oxygène et une flamme sont des causes métaphysiques de la combustion de l'amadou. Cependant, seule la flamme est causalement responsable, et donc normative, de la combustion. La responsabilité causale d'un événement revient uniquement aux principales causes métaphysiques de l'événement. La théorie de la décision causale s'intéresse non seulement aux événements dont un acte est causalement responsable, mais aussi à d'autres événements pour lesquels un acte est une cause métaphysique. Les utilitaires attendus qui guident les décisions sont complets.

Judea Pearl (2000) ainsi que Peter Spirtes, Clark Glymour et Richard Scheines (2000) présentent des méthodes pour déduire des relations causales à partir de données statistiques. Ils utilisent des graphiques acycliques dirigés et des distributions de probabilité associées pour construire des modèles causaux. Dans un problème de décision, un modèle causal permet de calculer l'effet d'un acte. Un graphe causal et sa distribution de probabilité expriment une hypothèse de dépendance et donnent l'influence causale de chaque acte étant donné cette hypothèse. Ils précisent la probabilité causale d'un état sous la supposition d'un acte. L'utilité attendue d'un acte est une moyenne pondérée selon les probabilités de son utilité attendue selon les hypothèses de dépendance que représentent les modèles causaux candidats, comme l'explique Weirich (2015: 225-236).

Le graphe orienté et la distribution de probabilité d'un modèle causal indiquent des relations causales entre les types d'événements. Comme Pearl (2000: 30) et Sprites et al. (2000: 11) expliquent qu'un modèle causal satisfait à la condition de Markov causale si et seulement si, par rapport à sa distribution de probabilité, chaque type d'événement dans son graphe orienté est indépendant de tous les non descendants du type d'événement, étant donné ses parents. Étant donné qu'un modèle remplissant la condition, la connaissance de toutes les causes directes d'un événement rend les autres informations statistiquement non pertinentes pour l'occurrence de l'événement, à l'exception des informations sur l'événement et ses effets. La connaissance des causes directes d'un événement écarte les preuves des causes indirectes et des effets indépendants de ses causes. Étant donné un modèle causal typique du problème de Newcomb,la connaissance de la cause commune d'une décision et d'une prédiction écarte la corrélation entre la décision et la prédiction.

Les graphes acycliques dirigés présentent clairement la structure causale et clarifient ainsi dans la théorie de la décision les points qui dépendent de la structure causale. Par exemple, Eells (2000) observe que le choix n'est authentique que si une décision écarte la corrélation d'un acte avec les états. Joyce (2007: 546) utilise un graphique causal pour décrire comment cela peut se produire dans un problème de Newcomb qui survient dans le dilemme d'un prisonnier avec un jumeau psychologique. Il montre que le problème de Newcomb est un véritable choix malgré la corrélation d'actes et d'états car une décision écarte cette corrélation. Wolfgang Spohn (2012) construit pour le problème de Newcomb un modèle causal qui distingue une décision et son exécution et soutient qu'étant donné le modèle, la théorie de la décision causale recommande la one-boxing. Un acte dans un problème de décision peut constituer une intervention dans le modèle causal du problème de décision,comme l'expliquent Meek et Glamour (1994). Hitchcock (2016) soutient que traiter un acte comme une intervention enrichit la théorie de la décision causale.

Timothy Williamson (2007: Chap. 5) étudie l'épistémologie des conditionnelles contrefactuelles ou subjonctives. Il souligne leur rôle dans la planification d'urgence et la prise de décision. D'après son récit, on apprend un subjonctif conditionnel si l'on obtient solidement son conséquent en imaginant son antécédent. Faites l'expérience de l'imagination des disciplines. L'expérience conduisant à un jugement qu'un conditionnel subjonctif tient peut être ni strictement habilitante ni strictement probante, de sorte que la connaissance du conditionnel n'est ni purement a priori ni purement a posteriori. Williamson affirme que la connaissance des conditions subjonctives est fondamentale, de sorte que la théorie de la décision fonde de manière appropriée la connaissance du choix d'un acte dans la connaissance de telles conditions.

La plupart des textes sur la théorie de la décision sont cohérents avec la théorie de la décision causale. Beaucoup ne traitent pas les cas particuliers, tels que le problème de Newcomb, qui motivent une distinction entre la théorie de la décision causale et probante. Par exemple, Leonard Savage (1954) analyse uniquement les problèmes de décision dans lesquels les options n'affectent pas les probabilités des états, comme son exposé de l'utilité le montre clairement (1954: 73). Les théories de la décision causale et probante aboutissent aux mêmes recommandations dans ces problèmes. La théorie de la décision causale est la forme dominante de théorie de la décision parmi ceux qui distinguent la théorie de la décision causale et probante.

Bibliographie

  • Ahmed, Arif, 2012, «Appuyez sur le bouton», Philosophie de la science, 79: 386–395.
  • –––, 2014, Evidence, Decision and Causality, Cambridge: Cambridge University Press.
  • Armendt, Brad, 1986, «A Foundation for Causal Decision Theory», Topoi, 5 (1): 3–19. doi: 10.1007 / BF00137825
  • –––, 1988a, «Préférence conditionnelle et utilité attendue causale», dans William Harper et Brian Skyrms (eds), Causation in Decision, Belief Change, and Statistics, vol. II, pp. 3–24, Dordrecht: Kluwer.
  • –––, 1988b, «Impartiality and Causal Decision Theory», in Arthur Fine et Jarrett Leplin (eds), PSA: Proceedings of Biennial Meeting of the Philosophy of Science Association 1988, Volume I, pp. 326–336, East Lansing, MI: Association de philosophie des sciences.
  • Arntzenius, Frank, 2008, «Pas de regret, ou: Edith Piaf révise la théorie de la décision», Erkenntnis, 68 (2): 277-297. doi: 10.1007 / s10670-007-9084-8
  • Bales, Adam, 2016, «Le problème du pauvre: le hasard, la connaissance préalable et la théorie de la décision causale», Philosophical Studies, 173 (6): 1497-1516. doi: 10.1007 / s11098-015-0560-8
  • Cartwright, Nancy, 1979, «Lois causales et stratégies efficaces», Noûs, 13 (4): 419–437. doi: 10.2307 / 2215337
  • Eells, Ellery, 1981, «Causalité, utilité et décision», Synthese, 48 (2): 295–329. doi: 10.1007 / BF01063891
  • –––, 1982, Rational Decision and Causality, Cambridge: Cambridge University Press.
  • –––, 1984a, «Newcomb's Many Solutions», Theory and Decision, 16 (1): 59–105. doi: 10.1007 / BF00141675
  • –––, 1984b, «Metatickles and the Dynamics of Deliberation», Theory and Decision, 17 (1): 71–95. doi: 10.1007 / BF00140057
  • –––, 2000, «Review: The Foundations of Causal Decision Theory, par James Joyce», British Journal for the Philosophy of Science, 51 (4): 893–900. doi: 10.1093 / bjps / 51.4.893
  • Egan, Andy, 2007, «Quelques contre-exemples à la théorie de la décision causale», Revue philosophique, 116 (1): 93–114. 10.1215 / 00318108-2006-023
  • Gibbard, Allan et William Harper, 1978 [1981], «Counterfactuals and Two Kinds of Expected Utility», dans Clifford Alan Hooker, James L. Leach et Edward Francis McClennan (éds), Foundations and Applications of Decision Theory (University of Western Ontario Series in Philosophy of Science, 13a), Dordrecht: D. Reidel, p. 125–162. doi: 10.1007 / 978-94-009-9789-9_5 Réimprimé dans Harper, Stalnaker et Pearce 1981: 153-190. doi: 10.1007 / 978-94-009-9117-0_8
  • Hájek, Alan et Harris Nover, 2006, «Perplexing Expectations», Mind, 115 (459): 703–720. 10.1093 / esprit / fzl703
  • Harper, William, 1986, «Stratégies mixtes et ratifiabilité dans la théorie de la décision causale», Erkenntnis, 24 (1): 25–36. doi: 10.1007 / BF00183199
  • Harper, William, Robert Stalnaker et Glenn Pearce (sous la direction de), 1981, Ifs: Conditionals, Belief, Decision, Chance, and Time (University of Western Ontario Series in Philosophy of Science, 15), Dordrecht: Reidel.
  • Hitchcock, Christopher Read, 1996, «Théorie de la décision causale et causalité théorique de la décision», Noûs, 30 (4): 508-526. doi: 10.2307 / 2216116
  • –––, 2016, «Conditionnement, intervention et décision», Synthese, 193 (4): 1157–1176. doi: 10.1007 / s11229-015-0710-8
  • Horgan, Terry, 1981 [1985], «Counterfactuals and Newcomb's Problem», The Journal of Philosophy, 78 (6): 331–356. doi: 10.2307 / 2026128 Réimprimé dans Richmond Campbell et Lanning Sowden (eds), 1985, Paradoxes of Rationality and Cooperation: Prisoner's Dilemma and Newcomb's Problem, Vancouver: University of British Columbia Press, pp. 159–182.
  • Horwich, Paul, 1987, Asymmetries in Time, Cambridge, MA: MIT Press.
  • Jeffrey, Richard C., [1965] 1983, The Logic of Decision, deuxième édition, Chicago: University of Chicago Press. [L'édition de poche de 1990 comprend quelques révisions.]
  • –––, 2004, Probabilité subjective: la vraie chose, Cambridge: Cambridge University Press.
  • Joyce, James M., 1999, The Foundations of Causal Decision Theory, Cambridge: Cambridge University Press.
  • –––, 2000, «Pourquoi nous avons encore besoin de la logique de la décision», Philosophie de la science, 67: S1 – S13. doi: 10.1086 / 392804
  • –––, 2002, «Levi sur la théorie de la décision causale et la possibilité de prédire ses propres actions», Philosophical Studies, 110 (1): 69–102. doi: 10.1023 / A: 1019839429878
  • –––, 2007, «Les problèmes de Newcomb sont-ils vraiment des décisions?» Synthese, 156 (3): 537–562. doi: 10.1007 / s11229-006-9137-6
  • –––, 2012, «Regret and Instability in Causal Decision Theory», Synthese, 187 (1): 123–145. doi: 10.1007 / s11229-011-0022-6
  • Joyce, James et Allan Gibbard, 1998, «Causal Decision Theory», in Salvador Barbera, Peter Hammond, and Christian Seidl (eds), Handbook of Utility Theory (Volume 1: Principles), pp. 627–666, Dordrecht: Kluwer Academic Éditeurs.
  • Krantz, David, R., Duncan Luce, Patrick Suppes et Amos Tversky, 1971, The Foundations of Measurement (Volume 1: Additive and Polynomial Representations), New York: Academic Press.
  • Levi, Isaac, 2000, «Essai de révision sur les fondements de la théorie de la décision causale, par James Joyce», Journal of Philosophy, 97 (7): 387–402. doi: 10.2307 / 2678411
  • Lewis, David, 1973, contrefactuels, Cambridge, MA: Harvard University Press.
  • –––, 1976, «Probabilités de conditions et probabilités conditionnelles», Revue philosophique, 85 (3): 297–315. doi: 10.2307 / 2184045
  • –––, 1979, «Le dilemme du prisonnier est un problème de Newcomb», Philosophie et affaires publiques, 8 (3): 235–240.
  • –––, 1981, «Théorie de la décision causale», Australasian Journal of Philosophy, 59 (1): 5–30. doi: 10.1080 / 00048408112340011
  • Meek, Christopher et Clark Glymour, 1994, «Conditionnement et intervention», British Journal for the Philosophy of Science, 45 (4): 1001-1021. doi: 10.1093 / bjps / 45.4.1001
  • Nozick, Robert, 1969, «Le problème de Newcomb et deux principes de choix», dans Nicholas Rescher (éd.), Essais en l'honneur de Carl G. Hempel, pp. 114–146, Dordrecht: Reidel.
  • Papineau, David, 2001, «Evidentialisme reconsidéré», Noûs, 35 (2): 239–259.
  • Pearl, Judea, 2000, Causality: Models, Reasoning, and Inference, Cambridge: Cambridge University Press. [Deuxième édition, 2009]
  • Pollock, John, 2006, Thinking about Acting: Logical Foundations for Rational Decision Making, New York: Oxford University Press.
  • –––, 2010, «Un agent limité par les ressources aborde le problème de Newcomb», Synthese, 176 (1): 57–82. doi: 10.1007 / s11229-009-9484-1
  • Price, Huw, 1986, «Contre la théorie de la décision causale», Synthese, 67 (2): 195-212. doi: 10.1007 / BF00540068
  • –––, 2012, «Causation, chance et signification rationnelle des preuves surnaturelles», revue philosophique, 121 (4): 483-538. doi: 10.1215 / 00318108-1630912
  • Richter, Reed, 1984, «Rationality Revisited», Australasian Journal of Philosophy, 62 (4): 392–403. doi: 10.1080 / 00048408412341601
  • –––, 1986, «Autres commentaires sur l'instabilité des décisions», Australasian Journal of Philosophy, 64 (3): 345–349. doi: 10.1080 / 00048408612342571
  • Savage, Leonard, 1954, The Foundations of Statistics, New York: Wiley.
  • Skyrms, Brian, 1980, Nécessité causale: une enquête pragmatique sur la nécessité des lois, New Haven, CT: Yale University Press.
  • –––, 1982, «Théorie de la décision causale», Journal of Philosophy, 79 (11): 695–711. doi: 10.2307 / 2026547
  • –––, 1990, La dynamique de la délibération rationnelle, Cambridge, MA: Harvard University Press.
  • Sobel, Jordan Howard, 1994, Taking Chances: Essays on Rational Choice, Cambridge: Cambridge University Press.
  • Spirtes, Peter, Clark Glymour et Richard Scheines, 2000, Causation, Prediction, and Search, deuxième édition, Cambridge, MA: MIT Press.
  • Spohn, Wolfgang, 2012, «Inverser 30 ans de discussion: Pourquoi les théoriciens de la décision causale devraient-ils une seule boîte», Synthese, 187 (1): 95–122. doi: 10.1007 / s11229-011-0023-5
  • Stalnaker, Robert C., 1968, «A Theory of Conditionals», dans Studies in Logical Theory (American Philosphical Quarterly Monograph series, 2), Oxford: Blackwell, 98–112. Réimprimé dans dans Harper, Stalnaker et Pearce 1981: 41–56. doi: 10.1007 / 978-94-009-9117-0_2
  • –––, 1972 [1981], «Lettre à David Lewis», 21 mai. Imprimé dans Harper, Stalnaker et Pearce 1981: 151–152. doi: 10.1007 / 978-94-009-9117-0_7
  • Wedgwood, Ralph, 2013, «La solution de Gandalf au problème de Newcomb», Synthese, 190 (14): 2643–2675. doi: 10.1007 / s11229-011-9900-1
  • Weirich, Paul, 1980, «Utilité conditionnelle et sa place dans la théorie de la décision», Journal of Philosophy, 77 (11): 702–715.
  • –––, 1985, «Decision Instability», Australasian Journal of Philosophy, 63 (4): 465–472. doi: 10.1080 / 00048408512342061
  • –––, 2001, Decision Space: Multidimensional Utility Analysis, Cambridge: Cambridge University Press.
  • –––, 2004, Théorie de la décision réaliste: règles pour les agents non idéaux dans des circonstances non idéales, New York: Oxford University Press.
  • –––, 2015, Models of Decision-Making: Simplifying Choices, Cambridge: Cambridge University Press.
  • Williamson, Timothy, 2007, The Philosophy of Philosophy, Malden, MA: Blackwell.

Outils académiques

icône de l'homme Sep
icône de l'homme Sep
Comment citer cette entrée.
icône de l'homme Sep
icône de l'homme Sep
Prévisualisez la version PDF de cette entrée à la Friends of the SEP Society.
icône inpho
icône inpho
Recherchez cette rubrique d'entrée sur le projet d'ontologie de philosophie Internet (InPhO).
icône de papiers phil
icône de papiers phil
Bibliographie améliorée pour cette entrée chez PhilPapers, avec des liens vers sa base de données.

Autres ressources Internet

  • Cours du MIT sur la théorie de la décision, offert par Robert Stalnaker.
  • Théorie de la décision, au moment de la rédaction de cet article (3 octobre 2016), le site Wikipedia propose une bonne introduction générale à la théorie de la décision et une liste de références.

Recommandé: