Probabilités de victoire au Tarot Africain avec la méthode de Monte Carlo

I help my clients acquire new users and make more money with their web businesses. I have ten years of experience with SaaS projects. If that’s something you need help with, we should get in touch!

< Back to article list

Probabilités de victoire au Tarot Africain avec la méthode de Monte Carlo

May 10, 2020

Pendant le confinement, on ressort les jeux de cartes et dans mon cas, on a ressorti le tarot africain, un jeu d’annonces qui se joue avec les atouts d’un jeu de tarot. Il y a beaucoup de variantes de ce jeu, j’ai mis les règles que je connais en annexe.

Un des éléments a attiré mon attention: le site du jeu en ligne propose une variante que je ne connaissais pas.

Le problème: calculer les probabilités de victoire

Lors de la dernière carte d’un tour, tout le monde pioche une carte parmi les atouts. Les atouts vont du 1 au 21, et une carte particulière, l’excuse, vaut au choix 0 ou 22. On ne voit que sa propre carte.

Dans quel cas faut-il parier qu’on va avoir la carte de rang le plus élevé ?

L’approche

On va s’en remettre à la puissance de calcul des ordinateurs et les laisser faire le boulot. C’est l’idée de la méthode de Monte Carlo:

On simule plein de jeux de cartes, où l’on pioche une carte donnée, et on la compare à celle des autres joueurs.
On compte le nombre de fois où on gagne, et on divise par le nombre d’itérations.
Grâce à la loi des grands nombres, si on a fait suffisament d’itérations, ce chiffre est notre probabilité de victoire.

Ca a l’air un peu trop simple, mais dans plein de situations, trouver une solution analytique du problème est difficile voir impossible. Dans plein de domaines (finance, biologie, météo ou intelligence artificielle…) les simulations numériques de ce genre sont le mieux qu’on ait.

…ou bien comme ici, quand on est face à un problème de maths niveau terminale, mais que le lycée c’est un peu loin.

Talk is cheap, show me the code

On va écrire ce programme en python mais on pourrait faire ça avec n’importe quoi (ou presque).

On commence par quelques imports pour se simplifier la vie, principalement:

argparse pour avoir des paramètres cli
numpy/pandas pour l’export csv et la manipulation de tableaux
matplotlib pour générer un graphe

import random
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import argparse

On continue par l’initialisation du programme:

on configure argparse pour aller chercher les paramètres de ligne de commande
on affecte quelques variables à partir de ça

# what we want to simulate:
# there are 3 to 5 players
# each player draws a card, whose value is between 0 and 22
# the player with the highest value of all 4 cards wins the hand
# what is the probability to win for each card value ?

ap = argparse.ArgumentParser()
ap.add_argument("-i", "--iterations", type=int, default=1000,
    help="the number of iterations we want to perform")
ap.add_argument("-p", "--players", type=int, default=4,
    choices=[3, 4, 5],
    help="the number of players")
args = vars(ap.parse_args())

nb_players = args["players"]
nb_iterations = args["iterations"]

nb_cards = 22

Le coeur de l’algorithme et de ce programme, c’est compute_card_probability.

Cette fonction prend en paramètre une valeur de carte. Elle va simuler autant de mains que nécessaire et regarder combien de fois la carte demandée est gagnante, et mettre à jour le tableau wins en conséquences.

wins = np.array([0 for i in range(0, nb_cards+1)])

def compute_card_probability(card_value):
    deck = [i for i in range(0, nb_cards+1)]
    deck.remove(card_value)
    # monte carlo loop: run many hands, the law of big
    # numbers will do the rest
    for _ in range(nb_iterations):
        # play a hand, look for the winner
        random.shuffle(deck)

        other_players = deck[0:nb_players-1]
        if card_value > max(other_players):
            wins[card_value]+=1

# run the simulation for all the cards
# (it's not very interesting for the first values and for the last one, since the values are known to be 0 and 1)
for card_value in range(0, nb_cards+1):
    compute_card_probability(card_value)

wins = wins/float(nb_iterations)

Fin du programme, on stocke les résultats:

une courbe au format PNG
un fichier CSV contenant les probabilités calculées

# draws the plot as an image, and save results as a csv file
freqs = pd.DataFrame(wins, index=range(0, nb_cards+1), columns=['probability'])
ax = freqs.plot.bar()
output_directory = 'output'
basename = "{}-p-{}-i-{}".format(os.path.splitext(os.path.basename(__file__))[0], nb_players, nb_iterations)
plt.axhline(y=0.5, linewidth=1, color='red', linestyle='--')
plt.suptitle('Winning probabilities for each card value', fontsize=12)
plt.title('{} players, {} iterations'.format(nb_players, nb_iterations), fontsize=10)
plt.yticks(np.arange(0, 1.1, 0.1))
plt.ylabel('Probability')
plt.xlabel('Card value')
plt.savefig("{}/{}.png".format(output_directory, basename))
freqs.to_csv('{}/{}.csv'.format(output_directory, basename))

on appelle le programme par exemple avec

$ python last-see1card.py -p 4 -i 10000

et on obtient des graphes dans le répertoire output.

Et alors, faut parier quand ?

Hé bien ça dépend du nombre de joueurs.

à 3 joueurs, on gagne le pli dans plus de 50% des cas à partir du 16
à 4 joueurs, à partir du 18
à 5 joueurs, à partir du 19

Je dois reconnaitre qu’avec quelques lignes de code on a pas mal bousillé l’intérêt du dernier pli.

Comment on sait que les chiffres sont bons ?

c’est à dire: comment sait-on qu’avec n iterations, les chiffres sont corrects et qu’il n’est pas nécessaire de prendre un nombre supérieur pour avoir des chiffres meilleurs, c’est à dire plus précis, et sans variation significative ?

Ça dépend.

Méthode rapide

Pour ce genre de programmes où on cherche à ne pas trop s’embêter, le plus simple, c’est de faire varier les paramètres, et de voir pifométriquement à partir de quand on arrête d’avoir des graphiques qui bougent. Pour n = 10, vous aurez des résultats très différents si vous faites tourner plusieurs fois le programme. À partir de n=10000, ça commence à ne plus trop bouger.

Ensuite, on peut voir si on gagne en précision. La courbe pour n=10000 est presque identique à celle qu’on a avec n=100000 (mais ça commence à prendre quelques secondes de calcul). C’est du au fait que la convergence des méthodes de Monte Carlo est proportionnelle à sqrt(n): pour gagner un facteur 10 en précision, il faut multiplier par 100 le nombre d’itérations. Il y a donc un arbitrage à faire entre précision souhaitée, et temps de calcul

Méthode rigoureuse

Si on veut une approche plus rigoureuse pour décider quand s’arrêter −c’est à dire pour constater qu’on a convergé au dela d’un seuil de précision à choisir−, il faut rentrer dans les méthodes statistiques.

C’est la loi des grands nombres qui indiquent que la moyenne des échantillons converge vers la valeur attendue (ici, la probabilité) au dela d’un certain nombre d’itérations. Et le théorème central limite nous dit que la distribution de l’erreur converge vers une distribution normale.

On peut ainsi calculer l’intervalle de confiance. Tant qu’on atteint pas le degré de confiance recherché, on augmente la taille de l’échantillon.

Et une solution analytique ?

C’est pas hyper carré, mais dans l’esprit on peut démontrer la relation par récurrence.

À 2 joueurs.

Supposons que je tire 2 cartes $c_{1}$ et $c_{2}$, $c_{1} \in [0;22]$, $c_{2} \in [0;22] \setminus c_{1}$

$P(\text{victoire de c1 à 2 joueurs}) = P(c_{1} > c_{2}) = \frac{c_{1}}{22}$

À 3 joueurs.

C’est pareil, on tire 3 cartes cartes $c_{1}$, $c_{2}$, $c_{3}$, $c_{1} \in [0;22]$, $c_{2} \in [0;22] \setminus c_{1}$, $c_{3} \in [0;22] \setminus [c_{1}, c_{2}]$

$\begin{eqnarray} P(\text{victoire de c1 à 3 joueurs}) &=& P(c_{1} > c_{2} \cap c_{1} > c_{3}) &=& P(c_{1} > c_{2}) \times P(c_{1} > c_{3}) &=& \frac{c_{1}}{22} \times \frac{c_{1}}{22} \end{eqnarray}$

À n joueurs

On peut généraliser la relation entre P(victoire de victoire de c1 à n+1 joueurs) et P(victoire de victoire de c1 à n joueurs), et on obtient:

$\begin{eqnarray} P(\text{victoire de c1 à n joueurs}) &=& P(\underset{i \ne 1}{\cap}{c_{1} > c_{i}}) &=& (\frac{c_{1}}{22})^{n-1} \end{eqnarray}$

C’était pas si compliqué et prendre une feuille avant de me lancer dans tout ce bazar m’aurait évité d’écrire 1600 mots sur le sujet. On a sensiblement les mêmes résultats que précedemment.

Allez, du code

Le code est presqu’identique au précédent, en remplaçant la partie du milieu par un calcul bien plus court.

# 
nb_players = args['players']
nb_cards = 22

wins = [0]*(nb_cards+1)
# we do not start at 0 in order to handle the boundary conditions
for card_value in range(nb_players-1, nb_cards+1):
    wins[card_value] = (float(card_value)/22.0) ** (nb_players - 1)

On génère les graphes comme avant:

python last-analytic.py -p 5

Pour aller plus loin

Parmi les conférences qui m’ont marqué, j’ai beaucoup aimé Statistics for Hackers (40mn) ou, plus court, Statistics without the agonizing pain (10mn) dont les titres sont explicites: il est question de faire des statistiques avec du code, sans s’embêter avec tout le (nécessaire et expliquable) formalisme mathématique. En raisonnant un peu, dans plein de situations, on peut facilement s’en sortir avec quelques boucles. Ca ressemble à ce qu’on a fait, mais ils proposent des outils un peu différents.

J’ai aussi commencé Thinking in statistics qui semble prometteur.

Annexe: les règles du tarot africain

Je ne trouve nulle part de règle précise de ce jeu dans la variante que je connais, donc les voici.

Préparation

Le jeu se joue à 3, 4 ou 5 joueurs avec les atouts du tarot de 1 à 21 et l’excuse. Les autres cartes servent à compter les «vies» des joueurs: tout le monde commence au Roi. À chaque fois qu’on échoue, on descend d’un rang. Le premier à l’As a perdu.

Pendant une phase de jeu, un seul joueur, toujours le même, distribue les cartes. On enchaine les phases de jeu

Le sens de jeu est le sens des aiguilles d’une montre. Le premier joueur à jouer est le joueur à gauche du distributeur. A la fin de chaque phase de jeu, c’est au premier joueur de devenir distributeur.

Déroulement d’une phase de jeu:

Au 1er tour:

on distribue 5 cartes à chaque joueur.
les cartes restantes sont mise de côté faces cachées.

Vient ensuite la phase d’annonces: Puis le joueur à gauche du distributeur annonce le nombre de pli qu’il pense faire. Puis c’est au joueur suivant, puis au troisième joueur. Quand on arrive au quatrième joueur, celui ci doit faire une annonce différente du nombre de plis possibles.

Exemple : Le premier joueur annonce qu’il gagnera 2 plis, le second 0, le 3ème 2. Le total faisant 4 et le nombre de plis possible étant 5, le 4ème joueur ne peut pas annoncer 1 seul pli.

On peut ensuite jouer les différentes levées.

En commençant par le joueur à gauche du distributeur, chaque joueur pose une carte de son choix. L’excuse est soit la meilleure carte , soit la moins bonne (mini). C’est le joueur qui le précise en annoncant maxi ou mini lorsqu’il pose la carte. La carte la plus forte remporte le pli, le joueur qui l’a posée démarre le pli suivant, et ainsi de suite pour toutes les cartes.

A la fin du tour, on fait le décompte des points. Ceux qui n’ont pas gagné le nombre de plis qu’ils ont annoncés perdent des vies en conséquence ( différence, en valeur absolu, entre le nombre de plis annoncés et le nombre de plis obtenus).

Exemple :

Un joueur annonce 2 plis et en fait 2: il ne perd pas de vie
Un joueur annonce 3 plis et en obtient 2: il perd 1 vie
Un joueur annonce 0 pli et en fait 1: il perd une vie

A la fin du tour, on mélange toutes les cartes (même les cartes qui avaient été mise de côté).

Au 2ème tour, 3ème, et 4ème tours, on distribue respectivement 4, 3 et 2 cartes et effectue les annonces et les levées comme au 1er tour.

Lors du 5ème tour, on distribue 1 carte à chaque joueur. Il y a 3 manières de faire le tour d’annonces:

on regarde sa carte, et on fait l’annonce comme à tous les autres tours
personne ne regarde de carte, et il faut faire l’annonce à l’aveugle
tout le monde met sa carte sur son front. le joueur ne voit donc pas sa propre carte, et doit donc annoncer en fonction des autres