La plupart des sondages d’opinion publique ont correctement prédit le candidat gagnant de l’élection présidentielle américaine de 2020 – mais en moyenne, ils ont surestimé la marge par laquelle le démocrate Joe Biden battrait le titulaire républicain Donald Trump.
Nos recherches sur les méthodes de sondage ont révélé que les prédictions des sondeurs peuvent être plus précises s’ils vont au-delà des questions traditionnelles. Les sondages traditionnels demandent aux gens pour qui ils voteraient si l’élection avait lieu aujourd’hui, ou pour le pourcentage de chances qu’ils pourraient voter pour des candidats particuliers.
Mais nos recherches sur les attentes et les jugements sociaux des gens nous ont conduits, ainsi que nos collaborateurs, Henrik Olsson à l’Institut Santa Fe et Drazen Prelec au MIT, à nous demander si des questions différentes pourraient donner des résultats plus précis.
Spécifiquement, nous voulions savoir si le fait d’interroger les gens sur les préférences politiques des autres dans leurs cercles sociaux et dans leurs États pouvait aider à dresser un portrait plus complet de l’électorat américain. La plupart des gens en savent assez long sur les expériences de vie de leurs amis et de leur famille, y compris sur leur bonheur et leur santé, ainsi que sur le montant approximatif de leur revenu. Nous avons donc conçu des questions de sondage pour voir si cette connaissance des autres s’étendait à la politique – et nous avons constaté que c’est le cas.
Les sondeurs, avons-nous déterminé, pourraient en apprendre davantage s’ils tiraient parti de ce type de connaissances. Demander aux gens comment les autres autour d’eux vont voter et agréger leurs réponses à travers un grand échantillon national permet aux sondeurs de puiser dans ce qu’on appelle souvent « la sagesse des foules ».
Quelles sont les nouvelles questions de « sagesse des foules » ?
Depuis la saison des élections présidentielles américaines de 2016, nous avons demandé aux participants à divers sondages électoraux : « Quel pourcentage de vos contacts sociaux votera pour chaque candidat ? »
Lors de l’élection américaine de 2016, cette question a prédit la victoire de Trump, et l’a fait de manière plus précise que les questions portant sur les propres intentions de vote des répondants au sondage.
La question sur les contacts sociaux des participants était de même plus précise que la question traditionnelle pour prédire les résultats de l’élection présidentielle française de 2017, de l’élection parlementaire néerlandaise de 2017, de l’élection parlementaire suédoise de 2018 et de l’élection américaine de 2018 pour la Chambre des représentants.
Dans certains de ces sondages, nous avons également demandé : « Quel pourcentage de personnes dans votre État votera pour chaque candidat ? » Cette question fait également appel aux connaissances des participants sur ceux qui les entourent, mais dans un cercle plus large. Des variantes de cette question ont bien fonctionné lors d’élections précédentes.
Comment les nouvelles questions de sondage ont-elles fonctionné ?
Lors de l’élection présidentielle américaine de 2020, nos questions de « sagesse des foules » ont une fois de plus été meilleures pour prédire le résultat du vote populaire national que les questions traditionnelles. Dans le cadre du sondage USC Dornsife Daybreak Poll, nous avons demandé à plus de 4 000 participants comment ils s’attendaient à ce que leurs contacts sociaux votent et quel candidat ils pensaient gagner dans leur État. On leur a également demandé comment ils prévoyaient eux-mêmes de voter.
Les résultats actuels de l’élection montrent une avance de Biden de 3,7 points de pourcentage dans le vote populaire. Une moyenne des sondages nationaux prévoyait une avance de 8,4 points de pourcentage. En comparaison, la question sur les contacts sociaux prédisait une avance de 3,4 points pour Biden. La question sur les états gagnants prédisait une avance de 1,5 point pour Biden. En revanche, la question traditionnelle qui portait sur les intentions propres des électeurs dans le même sondage prédisait une avance de 9,3 points.
Pourquoi les nouvelles questions de sondage fonctionnent-elles ?
Nous pensons qu’il y a trois raisons pour lesquelles le fait d’interroger les participants au sondage sur d’autres personnes de leur cercle social et sur leur État finit par être plus précis que de les interroger sur les participants eux-mêmes.
Premièrement, le fait d’interroger les gens sur d’autres personnes augmente effectivement la taille de l’échantillon du sondage. Cela donne aux sondeurs au moins quelques informations sur les intentions de vote des personnes dont les données auraient autrement pu être entièrement laissées de côté. Par exemple, de nombreuses personnes n’ont pas été contactées par les sondeurs ou ont refusé de participer. Même si les sondés ne disposent pas d’informations parfaites sur toutes les personnes qui les entourent, il s’avère qu’ils en savent suffisamment pour donner des réponses utiles.
Deuxièmement, nous soupçonnons que les gens peuvent trouver plus facile de signaler comment ils pensent que les autres pourraient voter que d’admettre comment ils vont eux-mêmes voter. Certaines personnes peuvent se sentir gênées d’admettre qui est leur candidat préféré. D’autres peuvent craindre le harcèlement. Et d’autres encore peuvent mentir parce qu’elles veulent faire obstruction aux sondeurs. Nos propres résultats suggèrent que les électeurs de Trump auraient pu être plus susceptibles que les électeurs de Biden de cacher leurs intentions de vote, pour toutes ces raisons.
Troisièmement, la plupart des gens sont influencés par leur entourage. Les gens obtiennent souvent des informations sur les questions politiques de leurs amis et de leur famille – et ces conversations peuvent influencer leurs choix de vote. Les questions de sondage qui demandent aux participants comment ils vont voter ne permettent pas de saisir cette influence sociale. Mais en demandant aux participants comment ils pensent que les autres autour d’eux vont voter, les sondeurs peuvent avoir une idée des participants qui pourraient encore changer d’avis.
Autres méthodes que nous étudions
En nous appuyant sur ces résultats, nous cherchons des moyens d’intégrer les informations de ces questions et d’autres dans des algorithmes qui pourraient faire des prédictions encore meilleures sur les résultats des élections.
Un algorithme, appelé « sérum de vérité bayésien », donne plus de poids aux réponses des participants qui disent que leurs intentions de vote, et celles de leurs cercles sociaux, sont relativement plus répandues que ne le pensent les gens de cet état. Un autre algorithme, appelé « prévision à information complète », combine les réponses des participants à plusieurs questions du sondage afin d’intégrer les informations de chacune d’entre elles. Les deux méthodes ont largement surpassé la question de sondage traditionnelle et les prévisions issues d’une moyenne de sondages.
Notre sondage ne comptait pas suffisamment de participants dans chaque État pour faire de bonnes prévisions au niveau de l’État qui pourraient aider à prédire les votes au Collège électoral. En l’état actuel des choses, nos questions sur les cercles sociaux et les gagnants attendus dans les États ont prédit que Trump pourrait gagner de justesse le Collège électoral. C’était faux, mais jusqu’à présent, il semble que ces questions avaient en moyenne une erreur plus faible que les questions traditionnelles pour prédire la différence entre les votes Biden et Trump à travers les États.
Même si nous ne connaissons toujours pas le décompte final des votes pour l’élection de 2020, nous en savons suffisamment pour voir que les sondeurs pourraient améliorer leurs prédictions en demandant aux participants comment ils pensent que les autres voteront.