Subscribe to the RSS feed (english)
En ces temps d'élections les sondages d'opinion fleurissent. On les critique, c'est de bonne guerre, mais y a-t-il des alternatives ?
C'est un dur métier, le sondage. Déjà, il faut apprendre la théorie des sondages, les statistiques. Puis il faut tout oublier ou presque.
Tous les sondages reposent sur un concept très difficile à obtenir : les sondés. Les statistiques ont pour but de représenter un grand nombre de personnes à partir d'un échantillion de taille gérable (ou au moins économiquement rentabilisable).
Alors, on construit l'échantillon selon des critères de représentativité. Dans de nombreux cas, on va chercher des critères socio-démographiques (sexe, age, profession, lieu de résidence, etc.). En France grâce à l'INSEE, on peut se targuer d'être les seuls au monde à utiliser une méthode appelée des quotas. Cela revient à sélectionner à l'avance des profils d'utilisateurs ("il me faut 150 hommes de 35-45 ans, cadres en région parisienne"). Dans les autres pays, on doit (en théorie) appeler aléatoirement (c'est le RDD pour Random Digital Dialing). S'il manque un homme de 35-45 ans cadre en région parisienne, hé bien, on appelle au hasard jusqu'à ce qu'on dégotte le profil recherché. Un échantillon qui ne serait pas représentatif ne pourrait pas être pris au sérieux. On dirait que ses résultats sont biaisés ("les hommes sont sous représentés"). Mais comme les échantillons ne sont jamais représentatifs, on peut tricher, enfin, une triche mathématiquement acceptée. Les individus sous-représentés se voient octroyer un poids supérieur à ceux qui sont sous-représentés. Vous avez deux hommes et trois femmes alors qu'il vous faut l'inverse, donnez à chaque réponse des hommes un poids de 1,5 et à chaque femme un poids de 0,67 et vos résultats seront représentatifs.
Donc, avec cette méthode, on s'écarte de la théorie, mais la théorie prouve que ça marche dans certains cas. Là où ça se corse, c'est lorsque les réponses elles-mêmes sont sujettes à caution. C'est le cas sur les questionnaires "chauds". Par exemple, essayez de savoir quelle proportion d'internautes font du téléchargement illégal. Il est probable que certains ne l'avoueront pas.
Dans le cas des sondages politiques, c'est encore pire. Tout le monde sait que les extrêmes sont sous représentés, surtout l'extrême droite, d'ailleurs. Et là, on quitte la théorie pour quelque chose qui s'apparente à de la bidouille. Les instituts de sondage comparent les résultats estimés et les résultats réels et en déduisent une méthode empirique pour remonter les extrêmes et même répartir les indécis. Donc rien d'étonnant à ce que les sondages ne soient pas toujours fiables. Demander à des gens ce qu'ils vont faire dans six mois est très alléatoire. Mais il n'y a pas grand chose de mieux à proposer aujourd'hui.
Pas grand chose ? Il y a l'intelligence collective. Et aujourd'hui, elle n'est pas utilisée alors que des travaux de recherche prouvent qu'elle donne de bons résultats et même en moyenne, meilleurs que les sondages !
Quant à son utilisation dans le cadre des sondages politiques, je vous en parlerai une prochaine fois…
Alors, on construit l'échantillon selon des critères de représentativité. Dans de nombreux cas, on va chercher des critères socio-démographiques (sexe, age, profession, lieu de résidence, etc.). En France grâce à l'INSEE, on peut se targuer d'être les seuls au monde à utiliser une méthode appelée des quotas. Cela revient à sélectionner à l'avance des profils d'utilisateurs ("il me faut 150 hommes de 35-45 ans, cadres en région parisienne"). Dans les autres pays, on doit (en théorie) appeler aléatoirement (c'est le RDD pour Random Digital Dialing). S'il manque un homme de 35-45 ans cadre en région parisienne, hé bien, on appelle au hasard jusqu'à ce qu'on dégotte le profil recherché. Un échantillon qui ne serait pas représentatif ne pourrait pas être pris au sérieux. On dirait que ses résultats sont biaisés ("les hommes sont sous représentés"). Mais comme les échantillons ne sont jamais représentatifs, on peut tricher, enfin, une triche mathématiquement acceptée. Les individus sous-représentés se voient octroyer un poids supérieur à ceux qui sont sous-représentés. Vous avez deux hommes et trois femmes alors qu'il vous faut l'inverse, donnez à chaque réponse des hommes un poids de 1,5 et à chaque femme un poids de 0,67 et vos résultats seront représentatifs.
Donc, avec cette méthode, on s'écarte de la théorie, mais la théorie prouve que ça marche dans certains cas. Là où ça se corse, c'est lorsque les réponses elles-mêmes sont sujettes à caution. C'est le cas sur les questionnaires "chauds". Par exemple, essayez de savoir quelle proportion d'internautes font du téléchargement illégal. Il est probable que certains ne l'avoueront pas.
Dans le cas des sondages politiques, c'est encore pire. Tout le monde sait que les extrêmes sont sous représentés, surtout l'extrême droite, d'ailleurs. Et là, on quitte la théorie pour quelque chose qui s'apparente à de la bidouille. Les instituts de sondage comparent les résultats estimés et les résultats réels et en déduisent une méthode empirique pour remonter les extrêmes et même répartir les indécis. Donc rien d'étonnant à ce que les sondages ne soient pas toujours fiables. Demander à des gens ce qu'ils vont faire dans six mois est très alléatoire. Mais il n'y a pas grand chose de mieux à proposer aujourd'hui.
Pas grand chose ? Il y a l'intelligence collective. Et aujourd'hui, elle n'est pas utilisée alors que des travaux de recherche prouvent qu'elle donne de bons résultats et même en moyenne, meilleurs que les sondages !
Quant à son utilisation dans le cadre des sondages politiques, je vous en parlerai une prochaine fois…