Tout le monde a déjà peut être reçu des courriels annonçant le débarquement prochain d'un virus dans leur boîte au lettres. Le texte demande de ne pas ouvrir de courrier ayant un sujet particulier sous peine d'activer automatiquement un virus, toujours ultra-puissant de la dernière génération, qui va foudroyer le PC et toutes les données qu'il contient avec.
La plus part du temps, il s'agit d'un Hoax (un courriel relatant de fausses informations ou canular). Un petit tour sur www.hoaxbuster.com permet en général de s'en assurer. La meilleure réaction consiste simplement à ignorer le contenu et a surtout de ne pas propager plus loin le canular.
Sur Internet circulent donc énormément de ces canulars et très vite la question de savoir comment faire pour s'en débarasser se pose. Peut être un peu de mathématique peut nous aider à comprendre le phénomène.
Prenons un exemple concret. Pierre, Jaques et Jean lisent tous trois leurs nouveaux courriels. En reçevant un canular, deux choses peuvent se passer:
Ainsi le hoax continue de vivre une fois sur deux. Ensuite, Pierre et Jean suivant leur propre probabilité et vont eux aussi propager ou pas la fausse information. Suivant les cas, le canular peut continuer de vivre très longtemps.
Ce genre de processus s'appelle un processus de Markov ou chaine de Markov. On peut représenter tout le processus par une table ou matrice et un vecteur représentant l'état initial.
| Pierre | Jaques | Jean | Poubelle | |
| Pierre | 0 | 0.25 | ||
| Jaques | 0 | 0.25 | ||
| Jean | 0 | |||
| Poubelle | 0.5 | 1 |
Le vecteur initial représente la situation de départ et ne contient que des 0, sauf pour la personne qui reçoit le canular en premier. Dans ce cas, la valeur 1 est mise.
Qu'est ce que l'on peut apprendre maintenant ? On peut calculer ce qui se passe une fois le premier courriel reçu par la multiplication de la matrice et du vecteur initial. On obtient un nouveau vecteur qui correspond à un nouvel état probable. Par itération, on peut calculer les états suivants et ainsi voir qui a le plus de chance de reçevoir le canular ou pas.
La théorie nous dit aussi que suivant la matrice initiale, il peut y avoir un état stationnaire (qui ne bouge plus par la suite). En calculant cet état, il est possible de savoir si le canular va mourrir ou bien s'il va continuer de se propager indéfiniment.
L'idéal serait bien entendu que le vecteur converge le plus rapidement vers un état où la probabilité "poubelle" soit à 1.