Comptage des gilets jaunes du samedi 05/10/2019 (Acte 47)

Comptage par densité scientifiquement fondé de l'acte 46 (acte XLVI) des gilets jaunes et autres manifestants convergents (climat, grévistes, urgences, services publics, cheminots, syndicalistes, etc). Notre décompte est au pic de mobilisation et limité à un décompte local pour quelques villes pour lesquelles nous avons obtenu des données adéquates.

En partenariat avec Le Nombre Jaune, avec lequel nous échangeons des données, et que nous vous invitons à consulter pour un décompte à l'échelle nationale.

Par manque de temps, nous publions ce décompte sans qualification de précision et avec un minimum de formattage (car nous avons accumulé du retard dans nos publications), mais il nous semble important de publier les sources de nos décomptes afin d'assurer la vérifiabilité et reproductibilité.


Notre méthode de comptage, rigoureuse, vérifiable et scientifique, se fonde sur le comptage par densité de Jacobs appliqué aux photographies non-aériennes selon Dillon Cariveau avec les règles de crédibilité de McPhail et McCarthy, avec un score de précision pour qualifier la marge d'erreur de chaque décompte. Notre méthode est la même que celle utilisée par les fact-checkers et historiens. Nous nous basons uniquement sur des preuves observables (photographies et vidéos assez en hauteur et en suffisante qualité et bien localisées/datées), jamais sur les chiffres d'autres observateurs, bien que nous puissions les mentionner pour donner du contexte. Nous détaillons ici notre décompte ville par ville, avec les données sources utilisées et notre méthode pour calculer chacun.

Ce décompte ne se veut pas exhaustif, mais représentatif du nombre de manifestants dans un cortège dans un lieu précis et à un moment donné. Autrement dit, c'est un instantané à minima de ce qu'on peut observer sur photo ou vidéo, et ne peut constituer un décompte exhaustif mais simplement donner un ordre d'idée de la mobilisation. Notez qu'avec Le Nombre Jaune nous sommes les seuls à fournir un comptage basé sur des données sourcées et détaillées.

Nous ne cachons pas que nous sommes engagés, et cela n'entame en rien notre soucis d'objectivité: l'objectivité s'atteint par une méthode, pas par la neutralité de ses pensées. Tout comme plus personne, et les scientifiques les premiers, ne peut plus rester neutre face aux catastrophes causées par le changement climatique, nous nous engageons afin que les méthodes scientifiques aient un impact positif sur la société.

Nous échangeons des données avec Le Nombre Jaune depuis l'Acte 11, et ceux-ci reprennent régulièrement nos décomptes pour certaines villes, principalement les gros rassemblements sur lesquels notre méthode par densité est plus adaptée.

Nos comptages se fait au pic de mobilisation (donc à une heure variable) autant que possible (selon les données qui nous parviennent), contrairement au Ministère de l'Intérieur qui fournit deux chiffres à heures fixes (14h et 18h respectivement, voir ce billet pour plus d'informations sur leur méthode). D'autre part, nous considérons les manifestations convergentes, tandis que le Ministère les exclut.

Enfin, il est à noter que nous décomptons selon les données que nous arrivons à nous procurer (images assez en hauteur pour estimer la densité, plan assez large pour estimer périmètre, lieu et heure assez précis). Si vous avez de meilleures images/vidéos, n'hésitez pas à nous en faire part en commentaire!

Les données (photos, vidéos) ont été soit échangées avec le collectif Le Nombre Jaune (groupe Facebook Le Nombre Jaune), soit trouvées sur Twitter (recherche avec les mots clés: #giletsjaunes ville, où ville est remplacé par la ville) soit ailleurs sur Facebook (mots clés: gilets jaunes ville live).

Nous tenons à remercier chaleureusement les auteurs des photos et vidéos que nous utilisons ici ou que nous avons considéré pour notre comptage: nous ne pourrions rien faire sans vous! Nos référents terrains prennent d'ailleurs de plus en plus de risques avec la montée de la répression policière. Observer et compter est devenue une activité risquée. De même pour les auteurs de données que nous n'avons pas pu utiliser, nous vous remercions tout autant, car toutes les photos et vidéos de foules sont utiles dans notre processus de sélection, soyez-en certains!

De plus en plus d'autres acteurs convergent avec le mouvement des gilets jaunes, aussi nos décomptes intègrent également ces acteurs qui se joignent aux cortèges des gilets jaunes (puisque, comme pour la manifestation pour le climat, il n'y a aucun moyen de différencier ces manifestants qui participent aux mêmes cortèges).

 

Table of Contents

Score de précision et marge d'erreur

Depuis l'Acte XV, nous dérivons pour chaque décompte par densité un score de précision (voir ici pour plus d'infos). Nous prenons en compte ce score de précision lorsque nous choisissons le chiffre final à rapporter pour une ville (par exemple, entre un chiffre haut à précision faible, et un chiffre plus bas à précision haute, nous choisissons celui à précision haute. Lorsque la précision est moyenne pour le chiffre haut, nous pouvons rapporter les deux).

Nous avons depuis calibré plus précisément nos méthodes, en voici un brief résumé, nous écrirons tout cela plus en détail dans un futur billet:

  • analyse de sensibilité par variation des paramètres du géobalisage, ce qui donne des intervalles de décompte plutôt qu'un seul nombre. Le principe est d'abord de calculer selon les paramètres les plus plausibles, puis de varier vers le bas, afin de donner une fourchette plus basse (et nous considérons les paramètres les plus plausibles comme la fourchette haute -- ce qui permet de diminuer encore le risque de sur-estimation). Cela permet de mieux quantifier et représenter l'incertitude dans les mesures et notre marge d'erreur, et nous pensons que l'interprétation est également davantage intuitive de cette façon.
  • préférence donnée aux décomptes de cortèges statiques: la méthode de comptage par densité a été construite et optimisée pour des cortèges statiques. Bien que nous l'ayons adaptée avec succès pour les cortèges mobiles, la marge d'erreur reste plus grande que pour les cortèges statiques, puisque les mouvements acroissent la possibilité de "trous", c'est-à-dire plus techniquement de variations dans la densité du cortège. Aussi, pour un même cortège, s'il y a des moments ou des données permettant de l'observer quand il est statique, ces décomptes seront préférés aux décomptes lorsqu'il est mobile.
  • la qualité des vidéos est davantage prise en compte: une vidéo HD permettra plus souvent un décompte avec une précision plus élevée qu'une vidéo de mauvaise qualité, puisque la distance de vue est alors limitée.
  • les horodatages codifiés, avec l'utilisation de "à" pour dénoter la précision lorsque nous utilisons l'horodatage d'un live Facebook -- seuls lives dont l'horodatage peut être considéré fiable en général car calculé en début de live et non pas en fin d'upload -- versus "vers" lorsque nous utilisons un horodatage plus imprécis comme celui de Twitter qui n'horodate que l'heure de fin d'upload; etc), dont nous écrirons les détails dans un futur billet.
  • Nous songeons à modifier le score de précision pour le séparer en 2: un pour chaque paramètre, soit un pour la densité et un pour la superficie. En attendant, nous n'ajoutons que les critères qui permettent de délimiter précisément. Par exemple, une vidéo en hauteur mais qui ne permet pas de bien observer la superficie du cortège (par exemple car le feuillage d'un arbre obstrue la vue au loin) ne recevra pas forcément le critère C5 (mais si la hauteur permet une meilleure estimation de la densité alors le critère C5 pourrait être attribué). Autre exemple: si la vidéo est filmée en hauteur puis que le vidéaste se déplace autour de la foule, le critère C5 pourrait être attribué mais pas le critère C6 si le déplacement autour de la foule n'apporte pas plus de précision par rapport au plan filmé en hauteur (C5). L'idée est que si un critère est rempli mais que cela n'aide pas pour autant à améliorer la précision sur un des paramètres, nous ne l'ajoutons pas, et le score de précision sera donc plus faible que lors de précédents décomptes similaires avec notre ancienne méthode.

Comptage ultra-précis par vision artificielle

Nous intégrons les décomptes issus du travail remarquable de Henri Deadlonexus, qui a conçu une méthode de comptage assistée par ordinateur! Cette méthode est ultra-précise, puisque fondée sur la vision artificielle (sous-domaine de l'intelligence artificielle), qui consiste à détecter automatiquement les passants.

Cette méthode est qualifiée d'ultra-précise puisqu'elle compte exactement chaque manifestants, un par un, sans aucune approximation, contrairement aux autres méthodes "humaines" comme la méthode par densité ou à vue. En effet, la machine a la possibilité de tracker/suivre un nombre quasi illimité de passants simultanément, quant le cerveau humain est limité à environ 7.

Cette méthode n'est bien entendu pas parfaite, et présente les défis usuels en vision artificielle: occlusion, plan stables, intensité lumineuse de la scène, etc. C'est pourquoi cette méthode est vérifiée manuellement par un opérateur, en l'occurrence Henri, qui vérifie que chaque manifestant est bien détecté et détecté une fois (une boite de couleur apparait sur la tête du manifestant). De cette façon, avec la vérification manuelle, il est possible d'éliminer le risque de sur-estimation. D'autre part, l'algorithme utilisé prend en compte la direction des manifestants, en différenciant la zone de détection des passants (zone d'entrée) et la zone de comptage (zone d'arrivée).

Le code couleur est le suivant:

  • Boite bleue: passant détecté, mais pas encore compté.
  • Boite verte: passant détecté et compté, car arrivé en zone de comptage.
  • Boite rose: passant rajouté manuellement car pas détecté par la machine.

Lorsque disponible, nous fournissons les vidéos de ces décomptes dans des sous-sections nommées "Décompte par vision artificielle".

Pour plus de détails techniques, voici ce que décrit l'auteur:

Liste non exhaustive des outils:

Frameworks:
* Qt5 : https://www.qt.io/
* MXNet : https://mxnet.apache.org/
* Ubuntu 18.04 CUDA 10 : https://www.nvidia.fr/object/cuda-par...
* OpenCV4 : https://opencv.org/

Algorithmes de calculs exterieurs:
* Détection d'objets: Faster R-CNN : https://github.com/ijkguo/mx-rcnn
* Tracking: Optical Flow : https://en.wikipedia.org/wiki/Optical...

Et plus de 10000 lignes de code perso.

Comptage par ville

Paris

Avant-propos

Il y avait au moins 3 cortèges mobiles déclarés + blocage du centre commercial Italie 2: https://paris.demosphere.net/rv/73249

Donnée 1

Donnée:

https://twitter.com/delangemars/status/1180476425276710913

Impossible de géolocaliser, aussi nous n'avons pas pu compter.

Donnée 2

BEST: https://twitter.com/T_Bouhafs/status/1180417476083032066
et https://twitter.com/Jeanne_gbd/status/1180408160038858752
et https://twitter.com/YahooActuFR/status/1180402474164854784
et https://twitter.com/AiphanMarcel/status/1180453652533784576
et https://twitter.com/Callystor/status/1180410968167329793
* https://www.facebook.com/trp.eric5/videos/10156943446514121/UzpfSTEwOTg3MTQ3MTc6Vks6NjMzNzgzOTg3MTQ5OTU1/
* blocage pas meme groupe car y sont encore au soir https://www.facebook.com/brutofficiel/videos/531529537418695/
blocage indéfini, appel à reproduire à l'international, initiative d'extinction rébellion + convergence des luttes

Dans ce cortège (différent des 3 autres mobiles), il y avait environ 300 manifestants d'après les journalistes. Nous n'avons pas pu effectuer un décompte par densité puisqu'en intérieur, et nous n'avons pas pu obtenir de plan nous permettant de calculer une superficie précise.

https://twitter.com/Pressagrun/status/1180463514709823488

Toulouse

Donnée 1

Source:

https://twitter.com/AuryBouzar/status/1180475229090521089

Géobalisage MapChecking. Densité très légère. Entre 720 et 1200 manifestants.

Donnée 2

Source:

https://twitter.com/AuryBouzar/status/1180492657497399298

Géobalisage MapChecking. Densité très légère. 940 manifestants.

Donnée 3

Source (à 40:56):

https://www.facebook.com/RevPermanenteToulouse/videos/409904679670620/UzpfSTEwMDAwMzk0MjgyNTQ5ODpWSzo2MzM3OTM3OTM4MTU2NDE/

Géobalisage MapChecking. Densité très légère. 1140 manifestants.

Donnée 4

Source:

https://www.facebook.com/lydialydia3131/videos/10217811832940073/UzpfSTEwMDk2NzY2OTU6Vks6NjMzOTUyMTk3MTMzMTM0/

Géobalisage MapChecking. Densité très légère. 1375 manifestants. Précision plus élevée car vidéo de haute qualité et assez en hauteur.

Bordeaux

Source:

https://twitter.com/delangemars/status/1180477637292122119

Géobalisage MapChecking. Densité mobile légère. 930 manifestants.

Amiens

Source (en fin de vidéo):

https://www.facebook.com/laetitia.cuisset/videos/10220784288705876/

Géobalisage MapChecking. Densité mobile légère. Entre 1100 et 1500 manifestants.

Tableau récapitulatif

[vtftable]
Ville;;;Décompte;;;Heure;;;Précision;nn;
Toulouse;;;1200 à 1400;;;-;;;-;nn;
Amiens;;;1100 à 1500;;;-;;;-;nn;
Bordeaux;;;930;;;-;;;-;nn;
[/vtftable]

Conclusion

Nous décomptons un total de 3 230 à 3 830 manifestants, sur 3 villes pour lesquelles nous avons eu des données utilisables pour un comptage par densité ou par vision artificielle, dont au moins 1 200 à 1 400 à Toulouse, 1 100 à 1 500 à Amiens, 930 à Bordeaux. Rappelons que nous ne gardons que 3 chiffres significatifs pour le total (sauf quand nous oublions de faire cet arrondi).

Ce chiffrage ne se veut pas exhaustif à l'échelle nationale, mais représentatif de la mobilisation à minima pour les villes pour lesquelles nous avons eu assez de données pour faire un décompte par densité. Pour un décompte plus exhaustif, nous vous redirigeons vers notre partenaire Le Nombre Jaune.

Nous soulignons que ce décompte, bien que le nombre de villes comptabilisées peut sembler faible, nous prend en moyenne 3h de travail par ville (recherche de données, géolocalisation, géobalisage, retracement du déroulé de journée, croisement des données), chaque week-end, et ce sans compter l'écriture de l'article, les diverses sollicitations sur réseaux sociaux, les re-comptages, le développement de nos méthodologies comme le score de précision... Autant dire que notre week-end y passe. Plus de la moitié de ce temps de travail réside dans la recherche, la sélection et le rapprochement chronologique de données adéquates, aussi vous pouvez nous aider à compter plus de villes et avec une plus grande précision en nous faisant remonter vos vidéos de cortèges statiques (sur une place par exemple)!

Au niveau de l'évolution de la mobilisation, nous ne pouvons nous prononcer à l'échelle nationale, nous vous renvoyons vers Le Nombre Jaune. Notons que la convergence est maintenant pleinement assumée:

https://twitter.com/v_delmas/status/1180442132424921088

Cette semaine encore, le Ministère de l'Intérieur n'a donné aucune estimation du nombre total de gilets jaunes (tout comme les semaines précédentes). Ce qui est peut-être mieux, étant donné la minimisation systématique de leurs décomptes. Nous vous renvoyons vers notre billet dédié, démontrant de façon formelle la minimisation des chiffres du Ministère de l'Intérieur.

Pour un peu d'humour, voici un yellow bloc:

https://twitter.com/AuryBouzar/status/1180469710992924672

 

Nous vous renvoyons vers notre dossier sur Twitter pour en savoir plus sur le #PitieGate de la manifestation du 1er Mai 2019, événement emblématique qui a fait prendre largement prendre conscience dans la sphère publique des violences policières sur tous les manifestants et journalistes (et pas seulement les gilets jaunes), avec toutes les preuves de ce «mensonge d'État» d'après David Dufresne, voire scandale d'État.

https://twitter.com/i/moments/1124459414642208768

Le texte de cet article est sous license Creative Commons Attribution 4.0 International (CC BY 4.0). Les images et vidéo sont les propriétés de leurs auteurs tels qu'indiqués en description ici ou sur la page liée. Image d’en-tête est notre composition à partir de dessins par Clker-Free-Vector-Images et OpenClipart-Vectors, tous deux sous license Pixabay.

Comments