Pourquoi ce blog? Comment les comptages sont calculés?

Bienvenue sur ce blog!

Son but est d'utiliser les sciences pour étudier les données ouvertes par des méthodes transparentes afin d'étudier voire solutionner des problèmes communautaires d'auto-organisation ou liés à la mobilisation citoyenne spontanée, telle que celle des Gilets Jaunes. Ce blog se veut donc didactique en décrivant non seulement des outils rigoureux mais aussi en expliquant leurs fonctionnements.

Un de ces problèmes récurrents est le décompte des participants, qui ne peut jamais être exact, et encore moins lors de mobilisations décentralisées (avec des groupes dans différents endroits), mais il est certainement possible d'obtenir une approximation assez juste de la fourchette basse, autrement dit à minima. Ce premier billet vise à expliquer comment faire de tels décomptes, que nous effectuerons de la même sorte régulièrement à l'avenir.


 

Table of Contents

Comment contribuer?

Nous sommes des bénévoles contribuant à ce blog pendant notre temps libre, aussi toute aide est la bienvenue!

Vous pouvez nous aider de trois façons:

  • en nous envoyant vos photos ou vidéos panoramiques prises en hauteur (le plus haut le mieux), accompagnées en description du lieu (exact si possible pour faciliter la recherche géographique, par exemple "Place des Graslin, Nantes") et de la date avec si possible l'heure (pour permettre le décompte à différentes heures). Vous pouvez nous les envoyer par email à admin@gjsciences.com ou dans les commentaires de cet article.
  • en effectuant des décomptes avec une des méthodes indiquée ci-dessous (un compte sera créé pour que vous puissiez écrire vos décomptes).
  • en devenant rédacteur de dossiers scientifiques, c'est-à-dire sur tout sujet pouvant toucher à la mobilisation citoyenne spontanée d'un point de vue scientifique (sciences "dures" ou sciences humaines!), l'important est de décrire clairement la méthodologie et qu'elle soit soutenue par des références de qualité (journalistiques ou académiques).

N'hésitez pas à nous contacter par email à admin@gjsciences.com ou en commentaires d'article!

Comment compter une foule?

Pour illustrer notre approche, nous allons ici détailler étape par étape des méthodes de comptage, appliquées à la manifestation des Gilets Jaunes du 5 décembre 2019 à Paris.

Il existe de nombreuses méthodes de comptage des foules, mais on peut les répartir dans ces quelques catégories:

  • Les méthodes par densité se basent sur une photographie suffisamment en hauteur d'un lieu et compare la densité moyenne de manifestants au mètre-carré à la surface géographique occupée. Ce sont des méthodes rapides mais assez approximatives, bien que ça donne une bonne idée du nombre (en tout cas de l'ordre de grandeur: centaines, milliers, dizaines de milliers, etc). Elles sont particulièrement appropriées pour compter des foules statiques, par exemple sur une grande place. Elles fonctionnent particulièrement bien à partir de photographies. La méthode considérée comme standard est la méthode de Jacobs. Le comptage par rangées (nombre de têtes sur la 1ère rangée x nombre de rangées à l'horizon) peut être assimilée à une réduction de la méthode par densité, assumant une densité constante définie par le nombre de rangées (au lieu de l'espace occupé par chaque manifestant, c'est donc un peu l'équivalent 1D alors que la méthode par densité est en 2D).
  • Les méthodes à vue sont toutes les méthodes qui comptent sur le terrain ou à partir d'une vidéo chaque manifestant ou groupe de manifestant qui passe devant le compteur. Dans la méthode la plus simple, il suffit de se positionner à hauteur (si possible un peu en hauteur) du cortège et d'utiliser un compteur à main mécanique (ou compteur "bip"). Elles sont meilleures pour les manifestations mobiles, puisqu'il suffit de placer un compteur voire deux à deux points de passage du cortège pour compter de façon assez fiable. C'est la méthode utilisée par la police, en enregistrant des vidéos pour laisser la possibilité d'une vérification ultérieure.
  • Les méthodes arithmétiques consistent à estimer le nombre de manifestants à partir d'autres variables mesurables plus facilement et à extrapoler à partir de là. Par exemple, si on sait la distance parcourue par un cortège, et le nombre de manifestants à la première ligne, la ligne du milieu et la dernière ligne, on peut estimer le nombre total de manifestants en prenant en compte la vitesse moyenne de marche d'un individu. Un autre exemple est celui de France Police - Policiers En Colère, qui suppose un nombre de manifestants minimum par rond-point, puis multiplie par le nombre de rond-points recensés par la préfecture et enfin multiple une dernière fois par peut-être 2 ou 3 pour tenir compte du turn-over (remplacement des manifestants au long de la journée). C'est la méthode la plus fréquemment utilisée par les syndicats, et est relativement rapide à calculer.
  • Les méthodes mécaniques utilisent un système mécanique par lequel les participants sont obligés de passer ou d'utiliser afin de compter précisément le nombre. Par exemple, le nombre de billets vendus pour un événement, ou des portiques tourniquets par lequel chaque participant doit passer pour rentrer dans un lieu. Ou encore le nombre d'utilisateurs d'une application. De nouvelles techniques par laser et par intelligence artificielle (voir plus bas) permettent d'utiliser ces méthodes en plein air, mais sont encore expérimentales. C'est les méthodes les plus précises lorsqu'elles sont en relation directe avec les participants/manifestants. Car il est également possible d'utiliser ces méthodes de façon indirecte, par exemple en comptant les tickets de transport utilisés le jour de rassemblement par rapport au nombre de tickets utilisés les autres jours, ce qui peut donner un ordre d'idée mais ne peut qu'être approximatif, puisque tous les usagers du transport n'allaient pas nécessairement au rassemblement.
  • Les méthodes déclaratives nécessitent une simple déclaration de participation pour être compté. Cela peut être sous la forme d'une pétition ou d'une application mobile et/ou en ligne. Elles peuvent être utilisées soit sur le terrain, soit en amont de la manifestation. Le défaut de cette méthode tient à sa nature déclarative, puisqu'il est impossible de s'assurer que les déclarants soient réellement mobilisés sur le terrain. C'est donc davantage une méthode de comptage des soutiens que de mobilisation.
  • Les méthodes par intelligence artificielle ou vision artificielle utilise les techniques de vision artificielle pour automatiquement détecter et compter les personnes. Ces méthodes sont en plein essor et effervescence, c'est un domaine très actif de recherche qui n'est pas vraiment solutionné (voir les articles tout en fin de ce billet). À noter que c'est la méthode utilisée par le cabinet Occurrence. Ces méthodes sont très précises et effectives, mais elles nécessitent de connaitre le parcours de manifestation en amont pour pouvoir placer le matériel et le calibrer, ce qui est inapplicable dans le cas des rassemblements spontanés et sans parcours fixes comme celui des Gilets Jaunes, sous peine d'une sous-estimation flagrante.
  • La méthode intuitive, qui n'est pas réellement une méthode mais une estimation "à vue de nez", c'est-à-dire sans réellement compter ou en comptant de façon très approximative (exemple: nombre de manifestants sur une ligne multipliée par la longueur estimée à vue). C'est la méthode utilisée par certains journalistes qui ne font pas appel à un cabinet de comptage indépendant comme Occurrence. Cette "méthode" est bien entendu extrêmement peu fiable: elle peut s'avérer très juste comme totalement éloignée de la réalité comme démontré par des études scientifiques, et sans possibilité de quantifier la marge d'erreur ni de vérifier le décompte. C'est donc une méthode à éviter dans le cadre d'un comptage sérieux.
  • La méthode par onde, qui compte les manifestants soit en se connectant à leur téléphone à partir d'une antenne locale sur site, soit en analysant la propagation (et le rebondissement) sur les corps directement, sans besoin d'appareil de la part des manifestants. C'est une approche encore expérimentale mais extrêmement intéressante, néanmoins elle fonctionne davantage pour des sites en intérieurs, et avec un nombre limité de personnes, qu'en extérieur. Voir en fin d'article une compilation de références académiques.

MAJ 16/09/2019: BFMTV avait déjà écrit un excellent article sur les différentes méthodes de comptage en 2013. La nomenclature diffère un peu de celle utilisée ici, et quelques méthodes plus expérimentales sont omises, mais le principal y est. Logitheque.com avait également écrit un article un peu plus technique sur quelques méthodes de comptage, dont l'outil MapChecking. Un article de Les Échos avait écrit en 2013 au sujet de nouvelles méthodes que l'on voit maintenant émerger.

Nous allons ici utiliser les méthodes par densité et à vue, puisque nous avons eu l'occasion d'obtenir des données permettant ces deux approches.

Méthode de comptage à vue

Commençons par la méthode à vue, puisque celle-ci est généralement considérée comme plus précise (et avec des estimations plus basses). Comme données, nous avons une vidéo filmée au carrefour du pont Petit Pont - Cardinal Lustiger et du Quai Saint-Michel à Paris le 5/01/2019 entre 14h20 et 15h.

Cliquez ici pour télécharger la vidéo.

Cette vidéo est de très bonne qualité et a le bon angle pour un comptage à vue, même si elle est filmée un peu trop basse: en effet le comptage à vue nécessite une vue de profil des manifestants et statique (stabiliser la caméra et éviter de changer d'angle de vue et éviter de changer de position sauf si la vue devient obstruée) et si possible en hauteur. En particulier ici nous avons un angle au coin d'une rue dans laquelle le cortège se tourne, ce qui permet d'avoir à la fois une vue de profil et de dos, permettant un meilleur décompte à vue. La vidéo a été floutée avec le logiciel gratuit Shotcut avec un filtre gaussien, de façon à ne pas porter préjudice à la vie privée des manifestants filmés, ce qui n'impacte en rien la capacité de compter à vue (même si les visages sont flous, on distingue très bien les silhouettes des personnes).

Tout d'abord, il faut définir quels manifestants seront comptés: certains portent un gilet jaune, d'autres pas, et il y a en plus des passants. Quels critères choisir?

Nous proposons de compter comme manifestant toute personne qui:

  • soit porte un gilet jaune fluo ou un accessoire jaune fluo sur soi ou qui ont un autre attribut qui les identifie clairement comme participants (drapeau, chant, pancartes, masque ou équipement de protection), qu'on qualifiera de gilets jaunes.
  • soit des personnes sans accessoire jaune fluo mais qui marchent en formant un groupe proche avec des gilets jaunes.
  • soit des personnes sans accessoire jaune fluo et sans être dans un groupe proche avec des gilets jaunes mais qui suivent le même parcours et au même rythme que les gilets jaunes, et est précédé et suivi de groupes de gilets jaunes. Ce critère n'est utilisé que lorsqu'il est évident que les personnes suivent le même tracé: par exemple à partir d'environ 18:30, on peut observer si les personnes tournent vers la rue où se dirigent les autres gilets jaunes, et tiennent leur droite, les passants choisissant généralement de s'éloigner ou allant dans une direction différente.

Ce sont des critères larges mais qui semblent pertinents pour compter non seulement les gilets jaunes physiquement habillés mais également les sympathisants qui participent à la marche.

Comme on peut le voir, compter chaque tête serait bien trop fastidieux. Une méthode, appelée count and follow up, consiste à compter par ligne ou par groupe de x personnes qui passent le centre du champ de vision, c'est la méthode régulièrement utilisée par la police. L'idée est d'essayer de regarder passer une ligne à la fois, et de n'appuyer sur son compteur que lorsque la ligne est passée de sa ligne de référence. Il faut donc essayer d'évaluer le nombre de personnes qu'il y a en moyenne dans une ligne. Néanmoins, comme le montre la vidéo, cette manifestation n'est pas un cortège régulier, aussi il est moins bien organisé, et le nombre de personnes dans une ligne peut changer, aussi il peut être plus facile de compter par groupe de personnes plutôt que par ligne. Pour pallier à ce problème, nous avons estimé 10 personnes par ligne lorsque la foule est très dense, puis par groupe de 10 personnes lorsque la foule est moins dense (dans ce cas nous avons attendu jusqu'à ce que 10 personnes environ passent le champs de vision), et enfin un comptage par tête à partir de environ 18:30.

Enfin, puisque nous avons ici une vidéo, et donc que nous pouvons répéter le comptage, celui-ci a été répété 3 fois selon la même méthode, et nous rapportons la valeur la plus basse et la valeur la plus haute.

En suivant ces critères, nous avons obtenu une estimation de 2920, 3110 et 3190 sur trois décomptes, soit une moyenne de 3063 personnes. À noter qu'il n'est pas clair si la vidéo commence en tête de cortège ou s'il y a encore davantage de manifestants à l'avant, la perspective ne permettant pas de voir.

Mise à jour 19/01/2018: Addendum: il a été porté à notre connaissance qu'un autre projet, le Nombre Jaune, vise également à compter les manifestations des gilets jaunes. Ces derniers utilisent la méthode de comptage à vue, avec des expérimentations de comptage mécanico-déclarative (par dépôt de bouchon de bouteille dans une urne) et en ajoutant les comptages de journaux locaux.

Qu'en est-il de la précision de cette méthode à vue? D'après le cabinet Occurrence, un cabinet de comptage indépendant qui utilise une méthode par intelligence artificielle, la méthode à vue telle qu'utilisée par la préfecture de police avec des compteurs à main mécaniques (ou compteurs "bip") permet une bonne estimation dans une marge d'erreur de 20% comparée à leur méthode high-tech.

Méthode de comptage par densité

Pour la méthode par densité, nous allons utiliser la méthode de Jacobs, la méthode de calcul de foule statique la plus communément utilisée de nos jours et même considérée comme un standard. Cette méthode est issue des observations de Herbert Jacobs sur le parvis de son université, lequel était composé de dalles carrées. Il avait remarquait que les manifestants avaient en moyenne tendance à se répartir selon 3 distances bien définies selon la densité (donc selon le nombre de manifestants et selon l'espace de la place occupée). D'après ses données acquises lors de nombreuses manifestations, il en a déduit que chaque manifestant occupait soit:

  • 10 pieds carré (0,929 m²) pour une foule parsemée (chacun à portée de bras des autres)
  • 4.5 pieds carré (0,418 m²) pour une foule plus dense (marchant au coude à coude)
  • 2.5 pieds carré (0,232 m2) pour une foule extrêmement dense (dit mosh-pit, c'est-à-dire comme dans une foule de concert, où il est même difficile de se mouvoir dans la foule)

Pour vous représenter ce que ces densités représentent, vous trouverez ici une excellente illustration.

Puisque ces calculs ont été fait sur une foule statique, et qu'une foule qui marche aura tendance à s'éloigner davantage (pour avoir assez d'espace pour marcher), nous multiplierons tous ces chiffres par 50% pour laisser une marge, soit respectivement 1.394 m², 0.627 m² et 0.348 m². À noter que d'autres organisations utilisent les constantes de Jacobs sans les modifier pour des manifestations mobiles, mais nous préférons pour notre part être prudent, quitte à sous-estimer légèrement la densité.

Pour utiliser cette méthode, nous suivrons la méthodologie décrite par Dillon Cariveau pour pouvoir appliquer la méthode de Jacobs à des photographies non aériennes. Pour cela, nous avons besoin d'images/vidéos qui:

  • englobent le plus possible de manifestants
  • offre une vue suffisamment en hauteur pour évaluer la densité (c'est-à-dire à quel point les manifestants sont proches les uns des autres)
  • permettent non seulement de localiser le lieu mais de délimiter la surface occupée par les manifestants (la hauteur et une prise panoramique aident), afin de pouvoir comparer

Pour cela, nous allons utiliser cette photographie, provenant du Huffington, photographiée par Sameer Al-Doumy, probablement peu après la vidéo ci-dessus:

Photographie de la manifestation des gilets jaunes à Paris, France, le 5 janvier 2019, par Sameer Al-Doumy pour l'AFP (Crédit: SAMEER AL-DOUMY/AFP/Getty Images)

De cette image, on peut estimer que la foule était dense, mais pas extrêmement dense puisqu'il était possible de marcher à travers, donc une densité d'à peu près 0,627 m² par manifestant.

Il faut maintenant délimiter géographiquement le lieu afin d'estimer la surface que les manifestants ont occupés. Pour cela, on peut utiliser le service uMap se basant sur OpenStreetMap, qui permet de tracer des polygones et d'estimer la surface.

Néanmoins, il faut pouvoir délimiter le plus précisément possible les limites de ce polygones, et il est difficile d'évaluer cela avec la perspective. En effet, ce type de comptage est habituellement calculé à partir de photos aériennes. Mais nous pouvons nous débrouiller autrement, en remarquant deux points d'intérêts:

  • l'enseigne "Restaurant Voltaire".
  • l'étendard avec le drapeau français au loin, et on peut même voir l'étendard suivant juste derrière.

Nous pouvons utiliser ces deux points pour définir le début et la fin du polygone. En utilisant Google Street View, il est possible de retrouver l'emplacement géographique de ces points d'intérêts et de se placer quasiment dans le même angle que la photographie:

Il est toujours bénéfique de vérifier ainsi la prise de vue de la photographie pour s'assurer qu'on ne se trompe pas de lieu géographique.

Le cortège est donc visible depuis un peu avant le pont du Carrousel (là où se trouve le deuxième étendard au loin) jusqu'au croisement du quai Voltaire et de la rue de Beaune, en prenant tout l'espace sur les trottoirs. Voici le balisage géographique:

Surface totale: 2800.18 m².

Il suffit alors de diviser le total de la surface occupée par l'espace occupé par un manifestant pour obtenir le nombre de manifestants, soit: 2800 / 0.627 = 4466 manifestants sur la photographie.

D'après les chiffres de la préfecture, il y avait 3500 manifestants à Paris ce jour là, aussi notre chiffre est très proche. Il est à noter que la différence peut être due aux erreurs d'approximations induites par cette méthode de comptage (suppose une densité fixe dans tout le cortège, balisage géographique de la surface correct, etc.). En effet, la méthode de Jacobs a une marge d'erreur estimée entre 10% à 20% avec une photographie aérienne, mais nous avons utilisé une photographie au niveau du sol, ce qui biaise la perspective et peut augmenter de façon importante la marge d'erreur et peut donner une impression de plus grande densité.

Par ailleurs, notre chiffre représente le nombre de manifestants observables sur la photo, ce qui signifie que les manifestants en dehors du cadre ne sont pas pris en compte, ainsi que les potentiels autres cortèges qui ont défilés ailleurs dans la capitale au même moment.

Cette méthode de Jacobs est rudimentaire mais permet une bonne approximation de foules statiques ou à un moment t. On pourrait l'améliorer par exemple en divisant l'espace selon une grille et en calculant avec une densité approprié chaque subdivision de cette grille, mais cela nécessite une photographie suffisamment en hauteur, voire aérienne. En effet, une photographie rapprochée donnera toujours une plus grande impression de foule, car cela a tendance à diminuer visuellement l'espace entre les personnes, et aussi il est plus difficile de délimiter le périmètre (et donc la superficie totale occupée). On pourrait également prendre en compte la météo et la disposition des lieux, afin de prendre en compte où les personnes sont le plus susceptibles de se concentrer et regrouper (par exemple, s'il fait grand soleil et assez chaud, les gens auront tendance à s'abriter sous des arbres ou dans l'ombre le long des bâtiments ou mobilier urbain). Pour une place, un lieu bien défini, on pourrait estimer par rapport à la capacité du lieu (rempli à 50%, 75%, 100%?) et faire le rapport à la superficie du lieu.

MAJ du 6/2/2019: après plusieurs semaines d'expérimentation de cette méthode de comptage, il apparait primordial de bien évaluer la densité et le périmètre du cortège, car sans cela, le décompte peut être erroné. De notre expérience, nous préférons sous-estimer le périmètre ET la densité plutôt que de sur-estimer (par exemple, si un cortège est composé de zones à moyenne densité et d'autres à faible densité, il convient de ne pas inclure dans le périmètre géobalisé les zones à faible densité, ou les compter séparément). Les constantes de densité peuvent sembler arbitraire, mais elles sont basées comme écrit ci-dessus sur les constantes de Jacob's, considérées encore comme le standard scientifique en matière de comptage de foule, et que nous avons augmenté de 50% par mesure de prudence pour les foules mouvantes. Par ailleurs, cette méthode ne s'adapte pas à toute donnée: elle est bien plus appropriée pour les cortèges statiques ou sur un instantané d'un cortège où l'on peut clairement définir la tête et la fin. Pour les données vidéos montrant un cortège qui défile, il vaudra mieux préférer un décompte à vue (voir méthode précédente), car nous avons constaté, comme le cabinet Occurrence, que les cortèges ont une densité variable. En pratique, la méthode par densité est idéale pour compter des gros cortèges (plusieurs milliers de personnes). Notons enfin que le défaut de la méthode par densité, qui est de se fonder entièrement sur 2 paramètres (la densité et le périmètre/surface), fonde en même temps sa qualité première: il suffit de ces deux paramètres pour définir un décompte par densité, il est donc aisé de le reproduire et de le réfuter, ce qui explique qu'il soit considéré comme un standard scientifique.

MAJ 10/02/2019: Voici quelques conseils supplémentaires pour cette méthode:

  • Le plus grand risque de sur-estimation est lié à la perspective (comme rapporté dans de précédents travaux). Il faut donc être particulièrement vigilant à l'effet de perspective, et tenter d'utiliser de multiples données synchronisées sous des angles de vue différents pour corroborer toute estimation de densité et de superficie!
  • La meilleure façon d'augmenter la précision de cette méthode est de subdiviser la zone occupées par le cortège en plusieurs aires de différente densité, si bien entendu la manifestation est relativement statique et les données permettent de bien évaluer. Ou on peut faire des suppositions, donner son apriori (comme par exemple supposer qu'un cortège est plus dense à l'avant qu'à l'arrière), cela peut augmenter la précision (mais peut aussi biaiser donc attention, nous ne l'avons pour le moment jamais fait, mais c'est courant dans de nombreux modèles de comptage et dans d'autres domaines).
  • Attention: plus la densité est haute, plus il faut être précis avec le géobalisage, car chaque m² comptera beaucoup plus! À l'opposé, lorsqu'on estime une densité parsemée, la précision du géobalisage importera moins (ex: c'est moins grave si les contours rentrent un peu dans le mobilier urbain ou les bâtiments, même s'il est toujours préférable d'éviter bien entendu).
  • Lorsque la densité est plus faible que parsemée (c'est-à-dire moins qu'1 personne par m² et demi), alors il vaut mieux ne pas inclure ces zones de très faible densité dans le comptage. S'il n'y a que de telles zones à très faibles densité, il vaut mieux préférer une autre méthode de comptage, ou trouver d'autres données à un autre moment où le rassemblement est plus dense.
  • L'heure est très importante pour synchroniser le décompte quand plusieurs cortèges ou quand le rassemblement est énorme! Deux vidéos de deux personnes prise à peu près au même moment à chaque bout du cortège permet de faire un comptage bien plus complet! De plus, cela permet de remplir l'une des règles de McPhail et McCarthy.
  • Toujours utiliser des images satellitaires (pas juste plan) pour ajuster géobalisage, car un plan peut trop simplifier les contours d'une route par exemple, et la rendre plus fine ou plus large qu'elle n'est vraiment.

Est-ce beaucoup ou peu de manifestants?

Répondre à cette question est plus complexe qu'il n'y parait.

Il est maintenant bien démontré que nous sommes particulièrement mauvais à dénombrer tout nombre au-dessus de la dizaine, notre cerveau ne pouvant mémoriser et suivre de nombre plus grand, celui-ci s'adaptant alors à l'échelle. Par exemple, une différence entre 5.00 euros et 5.10 euros nous semblera similaire à une différence entre 5000 et 5100 euros: si nous sommes prêt à débourser 5000 euros, alors si le prix est finalement de 5100 euros nous nous laisserons généralement convaincre tout autant. Cette technique, utilisée fréquemment utilisée en marketing et commerce, fonctionne car nous comptons alors de manière relative, alors que la valeur de la différence absolue est bien plus grande: c'est ce qu'on appelle un biais cognitif. On ne peut donc pas se fier à ce qu'on pense dénombrer "à vue de nez", il nous faut d'autres repères.

Des scientifiques et journalistes ont préconisé de calculer la moyenne de plusieurs décomptes, en observant que bien qu'aucun observateur unique n'avait pu calculer exactement le bon décompte, la moyenne était très proche du bon décompte. Néanmoins, d'autres études n'ont pas pu démontrer le même résultat, avec une moyenne bien éloigné du décompte réel. En tout état de cause, la moyenne n'est pas forcément plus proche de la vérité, étant le sophisme bien connu du « juste milieu » (argumentum ad temperantiam).

Néanmoins, comme montré pour la méthode à vue, la moyenne peut être utile lorsqu'on compte plusieurs fois de la même façon, pour avoir un décompte plus juste en réduisant le biais (ce qui a pour effet d'appliquer un lissage par moyenne, méthode mathématique courante pour réduire le bruit dans des séries statistiques). Mais lorsque les méthodes de comptage sont différentes, la moyenne (ou la médiane ou toute autre méthode d'aggrégation) n'a aucune justification: la moyenne d'un calcul approximatif et d'un calcul faux ne rapproche pas du résultat correct, cela constitue un sophisme (un argument fallacieux).

Revenons à notre exemple: d'après les chiffres de la préfecture, le 5 janvier 2019, un total de 50 000 manifestants ont été dénombrés en France, tandis que France Police - Policiers En Colère évoque 300 000, soit 6 fois plus! En comparaison, prenons les chiffres des manifestations contre la loi Travail: le 14 juin 2016, les syndicats dénombraient 1.3 millions de manifestants en France, tandis que la police seulement 125 000... Les différences de décomptes ne sont donc pas récentes ni spécifiques aux manifestations des gilets jaunes!

Comment expliquer ces différences de chiffres? Quel décompte est le plus proche du vrai nombre?

Pour répondre à cette question, il y a le cas d'école de la Million Man March aux États-Unis en 1995, où les organisateurs prévoyaient plus d'un million de manifestants. Naturellement, ils ont décomptés 1.3 million, tandis que le National Park Service (NPS) en a décompté 400 000, vérifiés même par un expert indépendant...

Photographie de la One Million March à Washington le 16 Octobre 1995, par Doug Mills pour Associated Press.

Cela a fait scandale, les organisateurs menaçant le NPS de poursuites en justice. Plus tard, d'autres chercheurs ont indépendamment calculé à partir de cliché aériens, avec un résultat proche du NPS. De plus, ils ont calculé que la capacité maximale de personnes dans le lieu de rassemblement ne pouvait être que de 1 million, avec une densité extrême (au coude-à-coude), démontrant ainsi que le décompte des organisateurs, qui était de 1.3 million, était impossible. Une autre étude plus tard a estimé qu'il était possible d'avoir une plus grande densité de personnes (6 personnes dans un mètre carré!) dans cette place, mais cette étude a été faite à posteriori, et il semble que ce résultat est davantage politique que scientifique. Aujourd'hui, la plupart des scientifiques s'accordent sur le chiffre initial du NPS. Il ressort de ce cas d'école qu'il est courant que les chiffres soient gonflés par une entité ayant un intérêt à sur-représenter la participation, en général les organisateurs, parfois par peur de décevoir les partisants après s'être hasardé à prédire une grande mobilisation ; à l'opposé, d'autres peuvent souhaiter minimiser afin de décourager à la mobilisation. En général, toute entité ayant un intérêt lié à une mobilisation (ou sous-mobilisation) peut être tenté d'en "ajuster" le décompte. Les "grands écarts" sont également courant entre les décomptes des syndicats et ceux du Ministère de l'Intérieur en France.

L'intérêt de ces méthodes apparait alors clairement: elles sont suffisamment simples et accessibles de nos jours, notamment grâce aux cartes géographiques en ligne telle que OpenStreetMap, qu'il est possible à tout à chacun de vérifier les décomptes dans une certaine mesure (c'est-à-dire tout ce qu'on peut observer sur photographie).

Dans le cas présent, il y a une composante supplémentaire à prendre en compte: la mobilité des manifestants et la durée. Par exemple, France Police - Policiers En Colère prend en compte le turn-over, c'est-à-dire le remplacement du départ d'une partie des manifestants à la mi-journée ou soirée par d'autres arrivant fraîchement, ce qui n'est effectivement pas pris en compte dans notre méthode, et probablement pas non plus par la méthode de la préfecture, puisqu'elle utilise le plus souvent la méthode de comptage à vue comme nous l'avons fait ci-dessus avec la vidéo.

D'autre part, le comptage de la préfecture a probablement été effectué ce jour-là uniquement sur le plus gros cortège, sans compter les autres rassemblements plus réduits, comme le suggère nos comptages qui sont très proches des chiffres de la préfecture sur Paris, alors que nous n'avons compté qu'un seul cortège à un instant t, donc sans compter le turn-over sur la journée. En d'autres termes, il est difficile de pouvoir estimer correctement tous les cortèges à travers la France, même en étant de bonne volonté, car il est nécessaire d'avoir un observateur sur chaque rassemblement: s'il n'y a pas d'observateur ou si l'observateur se retrouve sur un petit cortège, l'estimation sera bien en-dessous de la réalité. Il serait donc judicieux que chaque cortège comprenne systématiquement un observateur, chargé d'enregistrer photos ou vidéos permettant le décompte après coup.

Pour en revenir à la question initiale: 50 000 manifestants peut sembler peu quand on est habitué à entendre de grands décomptes grandiloquents dépassant le million, mais au vu des estimations réelles pour d'autres manifestations de grande ampleur, on peut douter de la véracité de ces chiffres, ceux concernant de précédents rassemblements. En effet, dans le cas des gilets jaunes, il n'y a aucune organisation officielle ni syndicat partie prenante du mouvement qui pourrait avoir un intérêt à produire un décompte gonflé. C'est la raison pour laquelle nous n'avons que les chiffres, certainement dans la fourchette basse, de la police.

Dans ce cas, 50 000 manifestants représente un rassemblement d'une ampleur certaine, dans des proportions analogues à d'autres importants rassemblements comme ceux contre la loi Travail. Surtout pour un mouvement qui s'est mobilisé dans la durée et pendant l'hiver, où les conditions météorologiques ne sont pas favorables et remplie de périodes de fêtes. Voir d'ailleurs l'excellent mini-doc de Arté sur la comparaison entre les proportions des rassemblements des gilets jaunes et ceux de la manif pour tous:

Il convient donc non pas d'essayer de gonfler ce chiffre comme des parties prenantes ont pu le faire, ni de le minimiser, mais de reconnaitre l'importance de la mobilisation citoyenne, quant bien même elle est en-dessous de la barre symbolique du million: comme les manifestants gilets jaunes ainsi que la police et les journalistes l'ont dûment constaté, des dizaines de milliers de manifestants dans les rues, cela fait beaucoup de monde sur le terrain, un "effet de masse", assez pour remplir des grandes places et des boulevards entiers.

Quelle confiance accorder à nos estimations?

Évidemment, comme l'indique clairement le nom de ce site, nous ne sommes pas neutres. Mais il n'est pas besoin de nous faire confiance aveuglément: nous publions non seulement les résultats de nos décomptes, mais aussi la méthode que nous appliquons, c'est le but de ce premier billet. C'est l'avantage de se fonder sur des méthodes scientifiques, qui sont reproducibles quelque soit l'expérimentateur. Si vous estimez que nous avons fait une erreur, libre à vous de vérifier par vous-mêmes!

Quelle différence par rapport aux autres organismes de comptage?

Section rajoutée après mise à jour 19/01/2019.

Plusieurs organismes se sont à ce jour annoncés pour compter les manifestants lors des rassemblements de gilets jaunes. Voici un résumé de chacun et de ce qu'on sait de leurs approches respectives:

  • Le Ministère de l'Intérieur utilise les remontées de chaque préfecture, eux-même se fondant sur les décomptes des policiers du service central du renseignement territorial au niveau départemental, plus précisément en se basant sur "le nombre de rassemblements" et "le nombre de manifestants" évalués par ces policiers de terrain. Le Ministère de l'Intérieur ajuste ensuite ces décomptes selon sa propre cellule de suivi du mouvement, spécialement mise en place pour le mouvement des Gilets Jaunes, et au fur et à mesure de la journée. Néanmoins, aucune information n'a été sur les méthodes de calcul. Cependant, il serait raisonnable de penser que le Ministère, et les policiers du CRT, utilisent la même méthode que pour d'autres rassemblements, à savoir la méthode de comptage à vue. Cette méthode semble raisonnable, mais les pressions politiques peuvent mener à des écarts assez importants, notamment au niveau de la cellule de suivi qui ajuste les calculs pour le Ministère de l'Intérieur. Enfin, la publication des chiffres de chaque préfecture permettait jusqu'alors un certain degré de vérifiabilité et de réfutabilité (même si les données sources - les vidéos de comptage - n'étaient jamais publiées), mais le Ministère de l'Intérieur a récemment choisi d'ordonner l'interdiction de communiquer ces chiffres.
  • France Police - Policiers En Colères effectue des décomptes depuis quasiment le début du mouvement des gilets jaunes. Leur décompte est en général assez élevé, car il se base sur une estimation de la participation moyenne multiplié par le nombre de ronds-points répertoriés par la préfecture et en prenant en compte le turn-over (donc multiplication par 2 ou 3 du nombre de manifestants estimé?). Le fait que leurs décomptes soient élevés ne signifie pas forcément que leur méthode est irréaliste, la méthodologie semblant raisonnable, et il est impossible de décompter exactement tous les manifestants, donc on ne peut pas vérifier la validité de cette méthode en l'état... Enfin, comme tous les observateurs de ce mouvement, ce syndicat n'est pas neutre.
  • Le Nombre Jaune se fonde sur une agrégation de décomptes provenant de sources diverses: remontée de vidéos du terrain permettant un comptage à vue, journaux locaux, préfectures, témoignages sans décompte méthodique, ainsi que nos décomptes par densité depuis l'Acte XI. Bien que cette approche soit novatrice dans le cadre d'un mouvement spontané et auto-organisé comme celui des gilets jaunes, elle peut être rapprochée à deux initiatives précédentes: le recoupement des décomptes de journaux locaux par le journaliste Sylvain Ernault et rapporté par Arrêt Sur Images sur la manifestation des retraités de Mars 2018 ; et la March For Science qui a utilisé une agrégation de vidéos remontées par des bénévoles et comptées à vue avec des méthodes déclaratives telle que le comptage de bouchons dans une urne. Cette approche se fonde donc sur le recoupement de multiples sources d'information, ce qui est nécessaire d'un point de vue pratique puisqu'il n'y a pas (encore?) de réseau d'observateurs-compteurs à l'échelle de tout le territoire (et il n'y a donc pas d'autre moyen de proposer un décompte national pour une petite structure comme ce collectif), mais peut se voir comme un avantage puisque le recoupement d'information permet de réduire l'incertitude dans les chiffres. Il y a donc des précédents, et le recoupement d'information est un vrai plus, mais les sources peuvent être d'une fiabilité variable, aussi la fiabilité de cette approche sera à évaluer dans le temps. Néanmoins elle donne des chiffres déjà bien plus raisonnables que ceux des syndicats : pour rappel, Le Nombre Jaune obtient des chiffres environ 2x supérieurs à ceux du Ministère de l'Intérieur, tandis que par exemple les syndicats annonçaient des chiffres 10x supérieurs pour la Loi Travail... Par ailleurs, ce collectif s'impose une règle de crédibilité, sans définir exactement laquelle, dans le but d'éviter de dériver des décomptes trop grands et irréalistes. La définition de cette ou ces règles de crédibilité serait à explorer car cela pourrait améliorer cette approche. À noter que c'est le seul organisme (à part nous) qui publie les données sources utilisées pour les décomptes, et ce depuis la mobilisation du 19/01/2019. C'est donc le seul autre organisme de comptages sourcés, donc vérifiables et réfutables, à part nous, et la raison pour laquelle nous avons noué un partenariat depuis le 26/01/2019. Une clarification de leur processus de comptage et de première estimation à 18h le samedi a été publiée le 24/03/2019.
  • Le cabinet Occurrence est un cabinet indépendant utilisant des caméras relié à un ordinateur utilisant l'intelligence artificielle pour faire un décompte à vue semi-automatique (voir également cette excellente interview vidéo: Télé Matin du 28/01/2019 par Laurence Beauvillard). Initialement, ils proposaient leurs services pour des utilisations commerciales (comptage de clients, sécurité etc), en dehors donc de tout intérêt politique. C'est la raison pour laquelle un collectif de journaliste a commencé a travailler avec eux pour des décomptes de manifestations à partir de 2018, après un premier essai en 2017. Leur méthode repose sur la technologie par vision artificielle de la société Eurecam, dont les décomptes sont réajustés en temps réel par des "micro-comptages" durant quelques dizaines de secondes et effectués par une méthode à vue en parallèle de la méthode informatique, ces micro-comptages étant alors utilisés pour estimer les erreurs de densité de l'algorithm et réhausser ou réduire les décomptes (notamment lorsque la foule est trop compacte, produisant une occlusion des manifestants et donc une sous-estimation). Cette technologie est très intéressante, et possiblement capable de devenir un nouveau standard surpassant la méthode de Jacobs par densité, même si pour le moment elle continue d'inclure un facteur subjectif et humain par les micro-comptages, ce qui peut introduire des biais (tout comme l'estimation des paramètres de densité et de superficie peuvent être biaisés pour la méthode par densité). Cela est dommage puisque le but ultime des méthodes par intelligence artificielle est d'automatiser complètement afin d'éviter les biais humains, mais cela viendra nous l'espérons. Néanmoins, la limitation principale réside dans le fonctionnement même de cette méthode: elle ne fonctionne que sur les cortèges mobiles, puisqu'il faut que les manifestants "passent" une ligne invisible pour être décomptés. Cette méthode peut donc probablement devenir un nouveau standard pour les cortèges mobiles, mais nous pensons que la méthode de Jacobs restera le standard pour les cortèges statiques et/ou massifs. Le cabinet Occurrence a effectué des estimations au début du mouvement, mais s'est par la suite longtemps refusé à en faire en raisonnant qu'il est impossible de compter de façon exhaustive et suffisamment précise des foules spontanées et désorganisées. Comme nous l'avons écrit plus haut, c'est tout à fait vrai, mais il est de notre avis qu'il est loin d'être impossible de compter de façon approximative mais objective des cortèges de foule spontanée, ce qui permet au moins de donner une idée de la mobilisation dans la fourchette basse, avec des marges d'erreurs scientifiquement quantifiées bien en-dessous des « 200% à 300% » évoqués (sans fondement) par le cabinet. En effet, bien que ce cabinet n'ait apriori pas d'intérêt particulier pour ou contre le mouvement (ou les autres mouvements sociaux), son intérêt réside dans la vente de sa méthode de comptage, quitte à décrédibiliser indûment celle des autres... À noter que le cabinet a commencé à se remettre à comptabiliser les cortèges, avec un succès mitigé, s'expliquant par la difficulté de positionner les capteurs au bon endroit pour capturer l'ensemble du cortège, qui de plus nécessite un certain temps de préparation, ce qui est difficile et coûteux avec les manifestations hebdomadaires des gilets jaunes... D'autres sociétés comme Trenscube ou FoxStream proposent des services similaires.
  • Les syndicats, lorsqu'ils fournissent un décompte des rassemblements du mouvement, utilisent vraisemblablement le plus souvent un comptage arithmétique, ce qui de notre propre expérience peut largement surestimer le nombre de manifestants car sous-estimant les "trous" et donc surestimant la densité.
  • Les journalistes ne détaillent quasiment jamais la façon dont ils obtiennent leur décompte: ils l'annoncent comme une évidence. Pourtant, comme ce billet l'explique, un comptage est loin d'être une évidence, même s'il est tout à fait possible de faire une estimation pertinente en utilisant les méthodes appropriées. Il est vraisemblable que ceux-ci utilisent un comptage "intuitif" ou arithmétique, ce qui est dans les deux cas très peu fiable, sans marge d'erreur quantifiable. Néanmoins, pour certains événements, certains journalistes font appel à des cabinets indépendants comme Occurrence.

Comparé à ces organismes, nous préférons une approche de décompte par densité, qui a l'avantage d'être davantage reproducible et accessible. Comparé aux méthodes par intelligence artificielle, il est estimé que le comptage par densité produit à peu près des résultats similaires (tant que les données sources permettent d'évaluer avec assez de précision le périmètre et la densité des manifestants!).

Le défaut de notre méthode est lié à son principal avantage: la nécessité de données observables fait que nous ne pouvons effectuer un décompte à l'échelle nationale, sauf à ce qu'un réseau d'observateurs soit créé dans chaque cortège pour nous faire remonter des données, ce qui est quasiment impossible, surtout pour un mouvement décentralisé (mais tout à fait possible quand le mouvement est centralisé).

Néanmoins, nous ne considérons pas que nous sommes en compétition, mais plutôt en complémentarité: plus il y a d'estimations avec des méthodes de calcul différentes, plus nous pourrons être certains de nos mesures.

Innovation et exhaustivité des décomptes

Suite à de nombreuses questions, nous souhaitons clarifier les principales raisons de la potentielle différence entre nos décomptes (ou ceux de Le Nombre Jaune) et d'autres organismes.

En effet, les méthodes que nous utilisons (par densité ou à vue) sont connues depuis des décennies (la méthode par densité a été publiée par Herbert Jacobs en 1968!). Il n'y a donc rien de nouveau dans nos méthodes!

La différence principale réside dans notre protocole:

  • Le sourçage, qui permet une meilleure reproducibilité et réduit les potentiels biais partisans (puisque chacun peut critiquer!). Le sourçage permet à la fois le principe de transparence et celui de reproductibilité, dont nous savons que tous deux sont des principes fondamentaux de bonne conduite, notamment dans le monde académique mais aussi dans tout autre domaine.
  • L'annonce de chiffres à minima plutôt qu'exhaustifs: lorsqu'on annonce un décompte exhaustif, on doit alors d'une part contrôler deux types d'erreurs (type I et type II, autrement dit à la fois le risque de sous-estimation et le risque de sur-estimation), ce qui est extrêmement contraignant et impossible à faire en pratique, et même en théorie; d'autre part cela nécessite de prouver non seulement l'existence des manifestants décomptés, mais également l'inexistence de davantage de manifestants que l'on n'aurait pas pris en compte.

En effet, en annonçant un chiffre à minima, nous écartons le risque de sous-estimation: le seul risque restant est celui de la sur-estimation, qui lui peut être bien mieux contrôlé. Cela a un corrollaire: il est plus facile de démontrer qu'un chiffre exhaustif est faux qu'un chiffre à minima, puisqu'un chiffre exhaustif peut être critiqué sur 2 types d'erreurs, plutôt qu'un. Par exemple, les chiffres du Ministères de l'Intérieur ont déjà démontré une erreur de sous-estimation de 72,5% (8 000 manifestants comptés à Paris lors de l'Acte XII au lieu de près de 14 000) par rapport à la méthode par intelligence artificielle du cabinet Occurrence. Si leur chiffre était à minima, cela ne poserait pas de problème, néanmoins ceux-ci sont affichés comme exhaustifs par le Ministre de l'Intérieur lui-même.

Pourquoi prétendre à l'exhaustivité est-elle un problème? Car ce n'est pas tant la borne inférieure, l'estimation à minima, qui pose problème, que la borne supérieure: tandis que pour la borne inférieure il suffit de compter ce qu'on peut observer sur des données ou sur le terrain, estimer la borne supérieure requiert de compter également ce qui n'est pas visible (autres cortèges simultanés, tous les rassemblements doivent être comptabilisés même si non déclarés, etc).

En effet, il peut toujours exister plus que ce que l'on a pu observer, et donc on ne peut prouver l'inexistence de quelque chose, raisonnement fallacieux bien connu des philosophes et logiciens, notamment ceux dissertant sur l'existence de Dieu. Un comptage peut donc démontrer l'existence d'un nombre de manifestants, mais ne peut démontrer qu'il n'y en n'a pas plus. Déclarer qu'un nombre de manifestants est exhaustif nécessite donc de prouver qu'il n'y en n'a pas eu davantage: il faut donc prouver leur inexistence. En revanche, déclarer un nombre de manifestants à minima requiert également une preuve, mais bien plus aisée: il suffit de données les montrant, prouvant ainsi leur existence.

En conséquence, nous affirmons qu'aucun décompte ne peut être exhaustif, à moins d'avoir une preuve solide d'inexistence (par exemple en étant sourçé sur une donnée publique appropriée, c'est-à-dire une photographie aérienne et de qualité, et pour un événement dont le tracé et lieu est bien délimité). Un exemple étant la Million Man March.

La méthode du Ministère de l'Intérieur, ni d'aucun autre organisme de la liste ci-dessus, ne permet de déclarer de décompte exhaustif, mais seulement à minima. En d'autres termes, ces décomptes ne peuvent être utilisés comme preuve qu'il n'y avait pas davantage de manifestants. Néanmoins, tout décompte, même à minima, doit fournir des preuves, comme des sources publiquement accessibles.

Addendum du 2022-03-02: Il semble que notre démonstration et notre usage du "au moins tel nombre de manifestants" pour signaler un décompte à minima a fait son petit bout de chemin dans la presse générale, même si nous ne sommes pas crédités. En effet, à notre connaissance, nous sommes les premiers à avoir fait cette démonstration, c'est-à-dire qu'il n'est possible de compter que ce qui est observé, et donc de fournir seulement une fourchette basse.

Pour le comprendre plus intuitivement, voici une illustration: imaginons une jarre en verre bien transparent avec un double-fond obscurcit. Remplissons cette jarre de bonbons. Maintenant, si l'on vous demande de compter à vue (sans toucher) le nombre de bonbons dans cette jarre, vous pouvez très certainement compter le nombre que vous pouvez voir dans la 1ère partie qui est transparente. Par contre, il vous est impossible de compter les bonbons qui sont dans le double-fond: il peut y en avoir beaucoup comme il peut n'y en avoir aucun dans cette partie de la jarre. Donc, quand vous rapportez votre nombre de bonbons, vous pouvez de façon assurée déclarer qu'il y a "au moins X bonbons", ceux que vous avez pu compter. Mais vous ne pouvez pas savoir le nombre de tous les bonbons, car il y en a peut-être que vous ne pouvez voir dans le double-fond.

Dans le cadre des manifestations, le double-fond représente les allées parallèles, d'autres points de rencontre sur un trajet différent, les flux sortants et rentrants (c'est-à-dire: vous pouvez n'avoir qu'à chaque instant seulement 1000 manifestants, mais peut-être que toutes les 10 minutes il y a 100 manifestants qui rentrent et 100 qui sortent, donc si l'on comptait le nombre total de personnes qui ont participé à la manifestation à au moins un moment, au bout d'1h on compterait 1600 manifestants au lieu de 1000 si l'on prenait en compte les flux sortants et rentrants! Certains s'y sont essayés comme GKStill pour la grande marche au Royaume-Uni mais c'est un exercice extrêmement technique qui nécessite des données de très haute qualité par hélicoptère qui ne sont accessibles qu'aux gouvernements), etc.

Et si on veut être ultra-précis et correct, il faut alors rajouter "environ" et écrire "environ au moins X manifestants", car comme pour toute mesure, il y a une marge d'incertitude sur cette fourchette basse: par exemple, on peut avoir surcompté quelques manifestants par rapport à ce qui était observé, et un recomptage (observé en vidéo) pourrait trouver légèrement moins de manifestants.

Fin de l'addendum.

Conclusion

Chaque méthode de comptage a ses avantages et inconvénients, et ne permet qu'une approximation de l'ordre de grandeur (centaines? milliers? dizaines de milliers?), et seulement de la fourchette basse puisqu'on ne peut qu'estimer un cortège à un endroit et temps. Mais cela reste des outils formidables que n'importe qui peut utiliser afin de pouvoir s'assurer de façon objective de la taille d'une foule, et cela ne requiert que d'obtenir des vidéos ou photos un minimum en hauteur. Cela peut non seulement servir à faire des décomptes à minima à un instant t d'un seul cortège, mais également de vérifier si un décompte est possible ou si l'espace et la densité indiquent un gonflage (comme cela a été appliqué pour compter les maires du Grand Débat). Pour s'assurer de la crédibilité d'un décompte de foule, les auteurs Clark McPhail et John McCarthy conseillent quatre règles, en prenant en compte:

  • la capacité (donc la superficie) de l'espace accueillant le rassemblement (pour éviter les chiffres irréalistement grands!).
  • la densité du rassemblement.
  • d'avoir plusieurs points de vue, notamment avec certains en hauteur.
  • une comparaison entre les estimations directes (sur le terrain) et indirectes (par exemple le volume de passagers dans les transports en commun).

Auxquelles nous rajoutons une cinquième règle:

  • les données permettant le décompte doivent être publiquement accessibles, afin de permettre un re-décompte par d'autres observateurs et donc assurer une reproducibilité et une réfutabilité.

Dans ce billet, nous avons suivi 4 des cinq points ci-dessus, le quatrième ne pouvant être fait puisqu'il est nécessaire d'avoir accès à des estimations indirectes, et ces données n'ont pas été publiées. Nous avons d'ailleurs dérivé à partir de ces critères ainsi que d'autres de notre conception un score de précision afin de systématiser le respect de ces critères.

Nous avons par ailleurs montré l'utilité, les avantages et inconvénients de deux de ces méthodes (par densité et à vue). Ces méthodes de comptage sont des outils précieux non seulement pour tout mouvement citoyen, mais également les organisations journalistiques, afin de prévoir en amont le nombre de manifestants potentiels et de mobiliser le personnel et les ressources adéquates pour couvrir l'évènement. Et également pour les organisateurs de l'évènement, afin de s'assurer d'avoir suffisamment d'espace et assurer la sécurité adéquate.

Voici un résumé des avantages et inconvénients de ces deux méthodes, que nous considérons les plus fiables pour le comptage de foules:

Méthode à vue:

  • Idéale pour une vidéo à un point fixe d'un cortège défilant.
  • Simple à effectuer, nécessite seulement un critère d'inclusion de manifestants, pas de paramètre physique à estimer
  • Reproducible (sur base de vidéo)
  • Défaut: critères d'inclusion de manifestants subjectifs (mais peuvent être explicitement énoncés)
  • Défaut: laborieux (à filmer et compter) sur de gros rassemblements (plusieurs milliers de personnes)
  • Défaut: ne peut être utilisé sur un instantané ou un cortège fixe.

Méthode par densité:

  • Idéale pour un cortège statique ou un instantané à un instant t (comme une photo ou vidéo courte).
  • Très reproducible et réfutable car nécessitant seulement 2 paramètres physiques (densité de manifestants + superficie/périmètre occupé par le cortège), peu de place au subjectif.
  • Particulièrement adapté aux gros rassemblements (fonctionne quelque soit la taille/étendue).
  • Défaut: nécessite une vidéo/photo suffisamment en hauteur pour estimer la densité avec assez de précision.
  • Défaut: nécessite de connaître la géolocalisation du lieu où le cortège a été filmé (et que le lieu soit correctement cartographié pour permettre un géobalisage = estimation de superficie).
  • Défaut: peu adaptée aux cortèges défilants (la combinaison avec la méthode arithmétique a été explorée comme solution mais rajoutait une marge d'erreur importante). Une subdivision du cortège selon le lieu et la position de tête (c'est-à-dire: une plus grande densité à l'avant du cortège, moyenne au milieu et légère pour le reste jusqu'à la queue, comme observé par le cabinet Occurrence) permet d'améliorer la précision, mais nécessite soit une vue bien en hauteur, soit plusieurs données synchronisées à différents endroits du cortège.

Le manque de précision dans les décomptes de foule n'est pas limité aux méthodes présentées ici, mais bien à toutes les méthodes de comptage de foules, celles-ci relevant autant de la science que de l'art. En outre, leur application est encore plus difficile à des manifestations mobiles et décentralisées telles que celles des gilets jaunes évoquent de nouveaux défis, mais pas impossible puisque d'autres rassemblements similaires ont pu obtenir de bonnes estimations avec un peu d'organisation en amont.

À l'avenir, nous privilégierons le recours à des décomptes avec méthode par densité telle que Jacobs, car elles sont davantage reproducibles que la méthode à vue: en effet, pour la méthode à vue, même avec des critères bien définis et une vidéo permettant le recomptage, la méthode dépend en grande partie de la subjectivité dans la manière de compter à vue du compteur, alors qu'avec la méthode par densité, étant donné les deux paramètres qui sont la densité de la foule et la superficie du lieu, on peut sans problème reproduire ou contester la mesure. De plus, il est bien plus aisé d'obtenir des photographies que des vidéos d'un cortège (de nombreux observateurs publient des photos, quand pour la méthode à vue il faut des gens formés à cela sur le terrain).

Bien que les meilleures estimations soient faites à partir de photographies aériennes, ce qui n'est que difficilement possible pour les manifestations mobiles et spontanées, on pourrait explorer l'usage de photographies simultanées à plusieurs endroits autour du cortège, afin de mieux délimiter l'aire géographique. Par exemple, l'API de Twitter de recherche de photographies géotagguées ou la carte de chaleur SnapChat (de même que d'autres plateformes), ou les données EXIF pourraient s'avérer de précieux outils pour améliorer la précision de tels décomptes. Par exemple, en utilisant ces plateformes géolocalisées, il est possible de cliquer sur un lieu pour afficher les tweets ou vidéos récemment enregistrées à cet endroit, ce qui peut permettre de mieux délimiter le périmètre d'une foule à partir de plusieurs points de vue.

Enfin, des scientifiques suggèrent l'usage de drones volants pour l'obtention de photographies aériennes à moindre coût avec de très bons résultats de comptage, mais son application peut se heurter à la règlementation en vigueur sur les drones, en particulier sur des lieux de rassemblements, ce qui a conduit à l'arrestation d'un manifestant gilet jaune souhaitant filmer avec un drone volant la chaine humaine du 27/01/2019.

Il existe également quelques applications spécialisées dans le décompte, en général à visée commerciale pour les organisateurs d'évènements privés.

Enfin, il est possible de combiner les méthodes par densité et à vue pour améliorer la précision, en enregistrant un timelapse sur le terrain à mi-chemin de la marche pour mieux pouvoir estimer la densité après coup avec la méthode de Jacobs. Une généralisation de cette approche serait d'appliquer les méthodes d'enquête statistique, par échantillonnage de la densité à plusieurs intervalles.

Évolutions et futur de nos méthodes

Un billet a été publié après quelques mois de comptages hebdomadaires afin de décrire des extensions à nos méthodes de comptage, afin de les rendre plus précises et (encore plus) transparentes, notamment avec des scores de précision et une réévaluation des constantes de densité, en s'adaptant au type de cortège (statique ou mobile) et prenant en compte le flux et l'effet de goulot d'étranglement.

Pour aller plus loin

Pour ceux qui souhaitent aller plus loin, je conseille vivement ces lectures:

Et pour ceux qui s'intéressent au futur de ce domaine d'étude: le comptage automatique assisté par ordinateur (même si certains observateurs doutent du bénéfice par rapport à la méthode de Jacobs):

Il est également possible de compter par onde, que ce soit par téléphone mobile ou directement en analysant le spectre des ondes rebondissant sur les corps (dans besoin sans téléphone):

  • «Crowd Counting Through Walls Using WiFi», Depatla et al, 2018
  • https://ieeexplore.ieee.org/abstract/document/8117189
  • https://ieeexplore.ieee.org/abstract/document/6507544
  • https://dl.acm.org/citation.cfm?id=2426673
  • https://ieeexplore.ieee.org/abstract/document/6917354
  • https://ieeexplore.ieee.org/abstract/document/8255034
  • https://ieeexplore.ieee.org/abstract/document/7763227
  • http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.160.9244&rep=rep1&type=pdf
  • https://ieeexplore.ieee.org/abstract/document/6847958
  • https://ieeexplore.ieee.org/abstract/document/7158187

Articles de presse intéressants que nous n'avons pas (encore) traité dans ce billet:

  • https://france3-regions.francetvinfo.fr/nouvelle-aquitaine/gironde/bordeaux/gilets-jaunes-quelle-methode-compter-manifestants-bordeaux-1617937.html
  • https://www.liberation.fr/futurs/2015/04/13/et-les-meilleurs-en-comptage-de-manifestants-sont-les-policiers_1240327
  • http://www.lefigaro.fr/actualite-france/2015/04/09/01016-20150409ARTFIG00197-comptage-des-manifestants-la-methode-de-la-police-jugee-efficace.php
  • http://theconversation.com/compter-les-manifestants-il-faut-associer-policiers-syndicalistes-et-journalistes-60952
  • https://www.la-croix.com/France/Compter-manifestants-medias-sengagent-2018-03-21-1200922560
  • http://www.leparisien.fr/societe/greve-enfin-une-methode-independante-pour-compter-les-manifestants-21-03-2018-7621563.php
  • https://la-bas.org/la-bas-magazine/chroniques/manifs-c-est-pas-la-taille-qui-compte

MAJ 6/2/2019: ajout d'un résumé des deux méthodes de comptage "à vue" et "par densité". Ajout d'informations sur les méthodes de Le Nombre Jaune et du cabinet Occurrence. Ajout de limitations et précautions pour la méthode de comptage "par densité".

MAJ 10/2/2019: ajout d'informations sur la méthode du cabinet Occurrence. Ajout de précautions et conseils pour la méthode par densité.

MAJ 28/2/2019: ajout de la référence vers le papier séminal de Herbert Jacobs.

MAJ 13/3/2019: correction intro "Est-ce que c'est beaucoup ou peu de manifestants?" et ajout du sophisme du « juste milieu ».

MAJ 15/3/2019: correction de coquilles, ajout d'une source et meilleure description du procédé de comptage du Ministère de l'Intérieur, lien vers le billet d'évolutions dans nos méthodes de comptage, ajout d'une sous-conclusion à propos de l'exhaustivité des décomptes dans le comparatif entre organismes de comptage.

MAJ 29/04/2019: ajout du comptage par ondes, avec références en fin d'article.

MAJ 16/09/2019: ajout d'infos à propos du cabinet Occurrence.

Le texte de cet article est sous license Creative Commons Attribution 4.0 International (CC BY 4.0). Les images sont les propriétés de leurs auteurs tels qu'indiqués en description ici ou sur la page liée. Image d'en-tête par GJ Sciences, sous CC BY 4.0.

Comments