15 mars 2019

Évolutions dans notre méthode de comptage

Nous nous efforçons de prendre en compte toutes les remarques constructives, et nous avons fait continuellement évoluer notre méthode de comptage afin d'augmenter sa précision et sa transparence! Ce billet récapitule ces changements, après trois mois de comptages hebdomadaires.

Ce billet décrit les dernières évolutions que nous avons déjà implémenté dans notre méthode de comptage depuis l'Acte XV pour certaines ou que nous implémenterons dès l'Acte XVIII pour les autres. Pour une description détaillée de notre méthode de comptage, vous pouvez consulter ce billet.

Score de précision et marge d'erreur
Modifications des constantes de densité
Logiciels de géolocalisation et de géobalisage
Arrondi des décomptes
Conclusion

Score de précision et marge d'erreur

Suite à des retours très intéressants notamment sur la marge d'erreur en pratique, qui n'est à notre connaissance pas possible à quantifier dans tous les cas et surtout avec un délai aussi court, nous avons réfléchi à une solution alternative: un score de précision. L'idée est que même s'il est impossible de quantifier la marge d'erreur en pratique, il est certainement possible de la qualifier.

Depuis l'Acte XV, nous dérivons pour chaque décompte par densité un score de précision.

Ce score vise à permettre de qualifier le degré de certitude sur la précision de ce décompte par rapport à la qualité et le nombre des données sources. Plus les données sont de qualité, et en nombre, plus le score de précision sera important, car moins nous aurons besoin de faire d'hypothèses (plus de paramètres sont observables directement depuis les données). En d'autres termes, un haut score de précision garantit que l'estimation à minima est correcte, donc évite la sur-estimation, mais ne donne pas d'information sur une possible sous-estimation. Nous l'avons conçu comme un agrégat de multiples critères de crédibilité, incluant ceux de McPhail et McCarthy, mais aussi de critères de qualité des données.

Critères de précision

Voici la liste de nos critères, incluant certains des critères de McPhail et McCarthy (à l'exception des comparaisons avec des estimation indirectes, comme le nombre de voyageurs en transport en commun, puisque nous n'avons pas accès à de telles infrastructures ni données):

C1: géobalisage, prenant en compte la capacité (donc la superficie) maximale de l’espace accueillant le rassemblement.
C2: reality check: géolocalisation précise reproduisant point de vue du vidéaste (ex: Google Street View) et géobalisage vérifié sur une vue satellitaire et une photographie des lieux (ex: Street View) afin de pallier aux approximations sur plan et d'avoir une meilleure idées des dimensions réelles.
C3: estimation de la densité du rassemblement.
C4: C1 et C2 basés sur au moins une donnée primaire (c'est-à-dire photographie ou vidéo publique, permettant un géolocalisage précis et l'estimation de la superficie et de la densité), donc réfutable.
C5: vue bien en hauteur ou se déplaçant dans une bonne partie de la foule permettant une bonne observation et estimation de la superficie et densité. Les zooms sont un plus mais ne peuvent pas être considérés comme suffisant (voir notre recomptage de la première manifestation des foulards rouges).
C6: au moins deux points de vue synchronisés (c'est-à-dire à heure proche) à deux endroits différents, pour mieux estimer la superficie et/ou la densité du cortège.
C7: au moins deux décomptes similaires du même cortège (dans la marge d'erreur de 20%) à heures et lieux différents.
CV: au moins deux décomptes similaires avec deux méthodes de comptage robustes différentes (un avec la méthode par densité et l'autre avec la méthode à vue). Les décomptes doivent être fait sur des données appropriées pour chaque méthode, et si possible sur des données différentes. Utilisé en général seulement pour vérification en cas de contestation (si données appropriées disponibles, comme pour notre recomptage de la 1e manifestation des foulards rouges).

Nous ajoutons que tout décompte devrait inclure le temps (au moins l'heure) auquel il a été effectué, afin de permettre la reproducibilité et la comparaison. Néanmoins cette information n'est pas toujours disponible en pratique.

Degrés de precision

Le score de précision est ainsi défini:

"Aucune" si aucun des critères C1 à C4 ne sont remplis. Il n'y a aucune marge d'erreur (sauf si la méthode utilisée en fournit une).
"Minime" si au moins un des critères C1 à C4 n'est pas rempli. La marge d'erreur est énorme.
"Faible" si les critères C1 à C4 sont remplis. Le décompte est fondé sur des preuves permettant de contraindre le résultat et donc d'offrir des garanties, mais la marge d'erreur peut potentiellement être plus importante (c'est-à-dire plus que la marge d'erreur théorique de 20% - en général, le pire cas est de se tromper dans l'évaluation de la densité, c'est-à-dire en utilisant une constante de densité plus grande ou plus faible, c'est-à-dire une marge d'erreur de 50% en sur-évaluation puisque chaque constante de densité est le double de la constante de densité directement inférieure).
"Moyenne" si les critères C1 à C4 sont remplis ainsi qu'1 autre critère (C5, C6 ou C7). La marge d'erreur théorique (20%) devrait être respectée.
"Haute" si les critères C1 à C4 et en plus 2 autres critères (C5, C6 et/ou C7) sont remplis. La marge d'erreur devrait être minime (inférieure à 10%?).
"Très haute" si tous les critères, soit C1 à C7, sont remplis. À noter que ce cas n'est pas possible à l'échelle d'un seul décompte (puisque requérant C7), cette mention ne peut donc apparaître que dans le tableau récapitulatif et le décompte final par ville. La marge d'erreur devrait être très faible (c'est un très bon décompte à minima - en ne se prononçant que sur ce qui est visible, puisqu'il est impossible d'affirmer ou d'infirmer s'il y avait davantages de manifestants, peut-être dans un autre cortège, à une autre heure, etc).
"Vérifié" si le critère CV est rempli. Signifie qu'un décompte similaire est trouvé avec différentes méthodes de comptage (par densité et à vue) avec une ou des données publiques. Ce critère est une preuve de reproductibilité et donc la meilleure garantie pour la précision d'un décompte.

Ces scores de précision seront à chaque fois repris dans un tableau récapitulatif à côté des décomptes par ville, ainsi qu'après chaque décompte.

[vtftable]
Ville;;;Décompte;;;Heure;;;Précision;nn;
Paris;;;10 660;;;15h-17h;;;Moyenne;nn;
Toulouse;;;8 545;;;17h00;;;Très Haute
(dont 4 832 Vérifié à 15h37);nn;
Marseille;;;5 557;;;14h42;;;Moyenne;nn;
[/vtftable]
Extrait du tableau récapitulatif de l'Acte XVII.

Épilogue

Puisque nous manquons de recul (ce score de précision est à notre connaissance la première initiative de ce type dans le cadre de comptage de foules), les critères et les intervalles colorés sont amenés à être mis à jour selon notre expérience. En effet, bien que d'autres organismes comme le cabinet Occurrence aient pu vérifier leurs décomptes en comparant à celui de plusieurs équipes de journalistes sur quelques rassemblements, il n'est pas fourni de qualification ni de quantification systématique de la marge d'erreur sur chaque rassemblement, ce qui est ici notre défi.

Nous ne considérons pas dans nos critères les remontées sur le terrain ou d'autres sources de comptage comme journalistiques (sauf si par densité ou à vue et avec données publiques), qui pourraient constituer un biais de confirmation. Néanmoins, si nous obtenons des remontées du terrain, nous les ajouterons en note aux décomptes.

Enfin, notons que même un score de précision "Faible" offre des garanties et une qualification de la marge d'erreur qu'aucun autre organisme de comptage de foules ne propose à l'heure actuelle. En d'autres termes, un décompte avec une précision "Faible" possède tout de même un certain degré de précision, quand les décomptes d'autres organismes sont à qualifier avec une précision "Minime" voire "Aucune" d'après nos critères (en tout cas une précision qui n'est ni transparente ni vérifiable).

Modifications des constantes de densité

Travaux antérieurs

Nous nous référerons aux excellents travaux du Prof. Dr. G. Keith Still, lequel a développé un ensemble d'outils de simulation pour visualiser (liste ici et autres visualisations ici) et analyser les foules. Nous reproduisons ci-dessous certains de ses visuels avec son aimable permission.

La première observation cruciale est, comme nous le supposions, que des foules mobiles occupent davantage d'espace que des foules statiques.

Modélisation 3D d'un manifestant statique (à gauche) et mobile (à droite) sur un espace quadrillé. Source: Prof. Dr. G. Keith Still, gkstill.com.

Cela signifie que les constantes de densité doivent être différentes selon que la foule est statique ou mobile. Cela a une autre conséquence: les foules mobiles atteignent un seuil critique (c'est-à-dire une densité maximale) avec 2 à 4 personnes/m², quand les foules statiques peuvent atteindre 4 à 5 personnes/m².

Simulation de foules statiques et mobiles à différentes densités (cliquez pour agrandir). Source: Prof. Dr. G. Keith Still, gkstill.com (lien 1, lien 2).

D'autre part, les foules subissent un effet de goulot d'étranglement lorsque la densité est trop grande (entre 2 et 4 personnes/m² pour foules mobiles). En conséquence, il est judicieux de ne considérer de densité importante (>2-3 personnes/m² pour foule mobile et >3-4 personnes/m² pour foule statique) que si l'on peut également observer un effet de goulot d'étranglement, c'est-à-dire qu'on observe des difficultés de la part des manifestants à se mouvoir dans la foule ou à suivre le cortège.

Illustration de l'effet de goulot d'étranglement à différentes densités pour des foules mobiles et statiques. Source: Prof. Dr. G. Keith Still, gkstill.com.

À noter que ce goulot d'étranglement peut être réduit (c'est-à-dire qu'il n'arrive qu'à une densité encore plus élevée) si la foule est organisée (par exemple: une marche militaire, un événement de danse, etc).

Illustration de l'influence de l'organisation sur l'effet de goulot d'étranglement à différentes densités pour des foules mobiles. Source: Prof. Dr. G. Keith Still, gkstill.com.

Tous ces paramètres dépendent également de l'événement (le lieu de rassemblement et le type de rassemblement) et de la population composant la foule (taille, corpulence, age, culture, type de manifestant). On pourrait rajouter le pays et la densité de population (par exemple un rassemblement dans une mégalopole verra plus de personnes que dans un village, un pays densément peuplé comme l'Inde verra régulièrement de plus gros rassemblements que de plus petits pays).

Pour les férus de travaux académiques, plusieurs travaux ont été dédiés à l'étude de la gestion des flux de foules:

Still, G. K. (2014). Introduction to crowd science. CRC Press.
Pecol, P. (2011). Modélisation 2D discrète du mouvement des piétons: application à l’évacuation des structures du génie civil et à l’interaction foule-passerelle (Doctoral dissertation, Université Paris-Est).
Hughes, R. L. (2003). The flow of human crowds. Annual review of fluid mechanics, 35(1), 169-182.
Thalmann, D. (2007). Crowd simulation. Wiley Encyclopedia of Computer Science and Engineering.
Luo, L., Zhou, S., Cai, W., Low, M. Y. H., Tian, F., Wang, Y., ... & Chen, D. (2008). Agent‐based human behavior modeling for crowd simulation. Computer Animation and Virtual Worlds, 19(3‐4), 271-281.

Comparaison avec les constantes de densité actuelles

Si l'on compare les constantes de densité originales de Jacobs, c'est-à-dire 0.25, 0.5 et 1.0 m²/personne, cela correspond à respectivement 4, 2 et 1 personnes/m². D'après les simulations du Prof. Dr. G. Keith Still sur foule statique (voir figures ci-dessus), ces constantes correspondent tout à fait respectivement aux états de congestion (haute densité), à capacité (moyenne) et de flux libre (densité légère).

En ce qui concerne nos constantes modifiées de Jacobs pour les foules mouvantes, nous avions décidé d'augmenter la densité par 50% afin de prendre en compte le plus grand espace occupé par les manifestants mobiles, ce qui donnait respectivement 0.348, 0.627 et 1.394 m²/personne, soit environ 2.9, 1.6 et 0.7 personnes/m². Là encore, nous retrouvons des observations similaires dans les simulations du Prof. Dr. G. Keith Still sur foule mobile, avec 3 personnes/m² étant un état de congestion, 1.5 personnes/m² un état à capacité (et qu'on voit régulièrement dans les cortèges, c'est-à-dire une configuration par rangées).

Simulation d'une densité de 1.5 personnes/m² pour une foule mobile. Source: Prof. Dr. G. Keith Still, gkstill.com.

En ce qui concerne 0.7 personnes/m², les relevés du professeur ne les montrent pas, mais on peut supposer que cette dernière constante devrait suivre une trajectoire similaire aux autres puisque régie par la même fonction de capacité/flux (voir figure ci-dessus).

Nouvelles constantes de densité

En prenant en considération ces excellents travaux du Prof. Dr. G. Keith Still, nous implémenterons dorénavant les changements suivant dans notre évaluation de la densité des foules:

Afin de permettre une plus grande flexibilité et précision dans l'estimation de la densité des cortèges, nous nous permettrons de choisir des valeurs au nombre de personne par m² lorsque la densité est relativement faible (c'est-à-dire en-dessous de 1 personne/m²).
Pour les densités élevées, nous requièreront dorénavant de pouvoir observer une réduction du flux du cortège et/ou des difficultés à se mouvoir (effet goulot d'étranglement) pour pouvoir considérer une telle densité élevée (à partir de 2-3 personnes/m² pour les foules mobiles, 3-4 personnes/m² pour les foules statiques).
Pour les cortèges statiques, nous utiliserons principalement les constantes originelles de Jacobs: 4 personnes/m², 2 personnes/m² et 1 personnes/m² pour respectivement les zones à densité élevée, moyenne et légère. De plus, nous nous permettrons de raffiner ces constantes selon ce qui est observable dans les données, par pas de 0.5 personne/m², ce qui permettra une plus grande précision (car chaque constante est le double de la précédente, un incrément de 0.5 permet de diminuer cet écart tout en restant objectif). L'avantage est donc une meilleure granularité et donc précision dans l'évaluation de la densité des cortèges statiques, sans impact sur l'objectivité puisque nous avons toujours un ensemble contraint et bien défini de 10 constantes possibles au total, de 0.5 à 5.0 (dont les 2 à 4 dernières, c'est-à-dire 3.5 à 5.0, ne seraient que rarement utilisées puisque représentant les densités élevées à extrêmement élevées).
Pour les cortèges mobiles, nous continuerons d'utiliser uniquement nos constantes modifiées (ajout de 50%), soit 0.384 m²/personne (environ 2.9 personnes/m²), 0.627 m²/personne (environ 1.6 personnes/m²) et 1.394 m²/personne (environ 0.7 personne/m²) pour respectivement les aires à densité élevée, moyenne et légère.

Logiciels de géolocalisation et de géobalisage

Les deux étapes principales dans le calcul de nos décomptes résident dans la géolocalisation puis le géobalisage du périmètre du rassemblement, tout ceci afin d'estimer la superficie de façon précise et vérifiable.

Pour cela, nous nous efforçons d'utiliser un maximum de logiciels libres (open-source) lorsque cela est possible.

Géolocalisation

Pour la géolocalisation, il est nécessaire d'utiliser des images satellitaire. Pour le moment, nous n'avons pas trouvé de base de donnée satellitaire libre avec modélisation en 3D, nous utilisons donc le service Google Maps (en mode satellitaire, avec vue 3D) combiné avec Google Street View pour vérifier l'angle de vue et la position exacte du photographe/vidéaste.

Exemple d'une géolocalisation à partir d'une enseigne, par une vue Google Street View puis par une vue satellitaire.

Reproduction d'un point de vue d'un vidéaste à partir d'une carte satellitaire Google Maps.

Géobalisage

Pour le géobalisage, nous utilisons depuis le début le service libre uMap (code source ici) qui se fonde sur la base de données libre OpenStreetMap. Néanmoins, OpenStreetMap n'inclut que des schémas de plan, pas d'images satellitaire, ce qui est nécessaire pour mieux évaluer certaines rues et places, qui ont parfois des dimensions différentes des plans (en particulier sur des dimensions aussi petites, comme lorsqu'on essaie de géobalisage la route mais pas les trottoirs, la marge d'erreur des plans est plus grande).

Exemple d'un géobalisage uMap sur la place du Capitole à Toulouse.

Aussi, nous combinons avec Google Maps en mode satellitaire pour vérifier les dimensions. Dernièrement, nous remplaçons parfois uMap par un géobalisage sur la plateforme libre MapChecking (code source ici) qui permet de géobaliser directement sur les cartes satellitaire de Google Maps (qui ne sont pas libres par contre!). Nous recommandons vivement cette plateforme qui rend le comptage par densité très aisé, mais notons quelques limitations, notamment l'impossibilité de tracer plusieurs géobalisages à la fois (ce qui empêche de subdiviser un cortège en plusieurs parties selon des densités variables, technique qui augmente significativement la précision), néanmoins cela reste possible avec uMap et nous continuons d'utiliser cette dernière pour ces cas-ci.

Exemple d'un géobalisage MapChecking sur la place Jean-Jaurès à Toulouse.

Nous avons récemment découvert que uMap proposait également d'autres cartes, dont une satellitaire (mais sans point d'intérêt, c'est-à-dire sans nom de rue ni enseignes). Il suffit d'être en mode d'édition, de cliquer sur le bouton "Change tilelayers", puis de sélectionner la carte "IGN Image aérienne (France)":

Capture d'écran de l'interface uMap, permettant de changer la carte plan vers une carte satellitaire.

Cela permet alors de géobaliser dans uMap directement sur une carte satellitaire! Il est donc alors possible d'utiliser toutes les fonctionnalités avancées de uMap: multi-balisages à densités variables, exclusion de zones dans un balisage (exemple: fontaines, voitures), union de balisage (exemple: on joint ensemble toutes les aires à densité légère, de façon à calculer la superficie aisément, même si chaque aire est disjointe des autres). Voici un exemple d'un géobalisage uMap complexe:

Exemple d'un géobalisage uMap complexe, extrait du comptage de l'Acte 19 des Gilets Jaunes.

Futur

Dans le futur, nous aimerions pouvoir pousser le géobalisage encore plus loin en intégrant une simulation de la densité des manifestants, en reproduisant un modèle en 3D des lieux à partir de vue satellitaire intégrant également des modèles 3D de personnes soit statiques soit mobiles. Cela permettrait de reproduire en 3D un point de vue tel qu'observé dans des vidéos ou photos, ce qui permettrait une estimation plus précise encore de la densité ainsi que de vérifier le géobalisage (potentiellement corrigeant les biais de perspective). Quelques travaux de recherche expérimentaux peuvent être intéressants à ce sujet:

Exemple d'un travail de reconstruction 3D à partir de données Google Maps satellitaire.

De tels outils existent en réalité déjà pour les professionnels (voir ici et ici) mais ne sont bien entendu pas gratuits et encore moins libres.

Nous aimerions également mettre davantage les citoyens profanes au coeur des méthodes scientifiquement fondées. À ce propos, voici deux articles fascinants:

Franzoni, C., & Sauermann, H. (2014). Crowd science: The organization of scientific research in open collaborative projects. Research policy, 43(1), 1-20.
Prpic, J., & Shukla, P. (2016, January). Crowd science: Measurements, models, and methods. In 2016 49th Hawaii International Conference on System Sciences (HICSS) (pp. 4365-4374). IEEE.

Arrondi des décomptes

Nous avons reçu un certain nombre de questionnements concernant la pertinence de communiquer un chiffre de décompte sans arrondi, par exemple 11 234. En effet, il est bien évident qu'un décompte de foule ne peut jamais être aussi précis, en tout cas à cette échelle (car il est bien entendu possible de compter à l'unité près de très petits rassemblements de l'ordre de dizaines voire la centaine de personnes). Pourquoi alors communiquer de tels chiffres?

Nous avions fait ce choix en tout état de cause dès le départ, car, comme nous l'avions écrit ailleurs, il y a deux approches: soit communiquer le chiffre tel quel résultant des calculs, soit l'arrondir pour communiquer une certaine imprécision.

Le défaut de cette dernière approche est qu'elle ajoute d'autres biais: à quelle décimale devons-nous choisir d'arrondir? Est-ce qu'un chiffre arrondi à la centaine, par exemple 11 200, est-il forcément précis à la centaine? Non pas forcément, et pourtant c'est l'impression que cela donne. Arrondir implique donc un double biais: d'abord de celui qui le communique dans son choix de l'arrondi, et ensuite auprès des lecteurs par la fausse impression de précision qu'ils en perçoivent.

De l'autre côté, l'approche consistant à communiquer les chiffres tels quels offrent l'avantage de ne pas induire de biais supplémentaire, et c'était pourquoi nous l'avions choisie: afin que tout à chacun puisse reproduire nos résultats tels quels, à l'aide des données et de la description pas à pas de chacun de nos décomptes. Néanmoins, elle souffre également de défauts: elle peut donner l'impression d'un décompte se clamant d'une précision impossible à l'unité près (ce que bien entendu nous n'avons jamais clamé et nous nous efforçons de clarifier chaque fois que nécessaire). Mais également un tel chiffre est notablement plus difficile à retenir pour l'esprit humain qu'un nombre arrondi (avec donc moins de chiffres significatifs).

Après mûres réflexions, nous avons décidé d'une solution de compromis mais qui devrait satisfaire tous les cas de figure:

Nous continuerons de communiquer les décomptes par ville sans arrondi, à l'unité près (y compris dans le tableau récapitulatif) afin de faciliter la reproductibilité de nos calculs.
Le décompte final, la somme des décomptes par ville, sera en revanche dorénavant arrondi au 3e chiffre significatif. Par exemple, 11 234 deviendra 11 200, mais seulement pour le décompte agrégé final.

Conclusion

La science du comptage de foules est une science très dynamique qui est encore en plein dévelopement. Il y a néanmoins déjà de nombreux travaux très sérieux, sur lesquels nous nous fondons pour nos décomptes, et que nous combinons avec des solutions utilisées couramment dans d'autres domaines scientifiques.

Nous continuerons de faire évoluer nos méthodes afin d'améliorer leurs qualités et leurs précisions. Si vous avez des suggestions ou des ressources à nous faire lire, n'hésitez pas à nous les communiquer (en commentaire ici ou sur les réseaux sociaux), nous les étudierons avec attention.

Évolutions dans notre méthode de comptage

Table of Contents