Le PassSanitaire ou le paradoxe de Simpson, l'envers des tweets !

INTRODUCTION

« Le paradoxe de Simpson est un paradoxe statistique qui permet de faire dire à des chiffres tout et son contraire. »

Les dernières annonces de l’exécutif décrétant l’instauration quasi généralisée du fameux sésame, le QRcode, a mis le feu aux poudres. Beaucoup ce sont érigés en défenseur de nos libertés individuelles allant jusqu’à ressortir parfois des parallèles assez sombres de l’Histoire de notre humanité.

Mais ne vous y méprenez pas, ce bref article n’est pas là pour infirmer ou confirmer les différentes inepties, non-vérités, assertions que vous avez pu entendre dans les médias, sur les réseaux sociaux, dans vos cercles d’amis voire dans votre propre famille. Je souhaitais juste donner quelques billes de lecture sur l’émoi que peuvent susciter certains tweets et éveiller des personnes comme ma grand-mère ou ma tante qui peuvent facilement se faire avoir… par les fameux biais cognitifs…

Je reste persuadé qu’avoir une information de qualité primera de plus en plus dans un monde hyper connecté. De nombreux enjeux sociétaux, politiques et au-delà se joue parfois sur la manipulation de masse. Pouvoir donner une autre lecture permet de développer son esprit critique face à un sujet, une situation…

Servez-vous un café, un thé, un chocolat et même un lait-menthe pour les puristes comme moi et je vous emmène pour cette petite analyse.

NOTA: Comme à l’accoutumée, j’essaierai d’être succinct et aller pertinent. Il y a beaucoup à dire sur ce genre d’analyse et facilement l’on peut dériver.



ANALYSE

Après une collecte d’environ 31000 tweets sur une période de 5 jours, j’ai analysé tout cela avec mon super petit outil qui se débrouille de mieux en mieux.

Cette analyse présentée en sous-rubriques abordera les différentes métriques/données que j’ai jugé pertinentes. Bien entendu, je suis loin d’être exhaustif mais j’y travaille.


Qu’est-ce qui ressort comme sentiment de tous ces tweets analysés

On m’a soufflé quelques très bonnes idées que je vais m’atteler à mettre en place

Une des métriques clés est de pouvoir donner la tendance générale se dégageant dans des tweets. Pour ce faire, différentes solutions existent comme le #MachineLearning et le #naturallanguageprocessing. Cela permet de donner plus de poids à une analyse en s’aidant d’algorithmes, un peu de mathématiques et surtout de l'#IntelligenceArtificielle.

Aussi, cette capture d’écran en dit long… Elle montre clairement que la majeure partie des gens qui ont tweeté sur le #PassSanitaire à date reste neutre. Ils n’ont pas encore tranché.

𝐒𝐞𝐮𝐥𝐞𝐦𝐞𝐧𝐭 𝟏𝟔% 𝐬𝐨𝐧𝐭 𝐜𝐥𝐚𝐢𝐫𝐞𝐦𝐞𝐧𝐭 𝐜𝐨𝐧𝐭𝐫𝐞 𝐥𝐞 “𝐩𝐚𝐬𝐬𝐞 𝐬𝐚𝐧𝐢𝐭𝐚𝐢𝐫𝐞” 𝐞𝐭 𝟖.𝟐% 𝐞𝐧 𝐟𝐚𝐯𝐞𝐮𝐫.

Cette petite statistique devrait certainement vous éclairer un peu plus.

sentimentanalysis.png

Statistiques générales

Voici les Statistiques générales présentant le trafic généré par les 31045 tweets analysés

stats.png

On notera que ces 30000 tweets recueillis ont généré pas loin de 3 millions d’interactions entre les favoris ou likes, les retweets, les commentaires, … Imaginez ce que cela représenterait en passant à l’échelle sur des quantités de 100 000, 300 000 voire bien plus de tweets… ça donne le tournis mais à la fois des sons de cloche qui méritent amplement d’être entendus.


Représentation des différentes communautés autour du hashtag #passSanitaire

Ce graphe représente un prisme général des différentes communautés ainsi que lesdits membres de ces communautés. Les principales grosses communautés sont celles autour de :

Bien entendu, on observe d’autres communautés satellites qui viennent elles-mêmes donner du crédit / de la force à ces comptes.

En zoomant dans certaines parties du graphe, on se rend compte qu’il y a des comptes / communautés plus surprenantes les unes que les autres qui apparaissent… C’est la preuve que tout le monde est concerné par ce sujet et à envie de faire entendre sa voix.

graph.png


Les 50 comptes les plus actifs

Dans le cas en présence, j’ai considéré qu’un compte était actif lorsqu’il recensait au minimum 20 tweets reprenant le hashtag #passSanitaire. Bien entendu, cette assertion peut être ajustable pour une analyse encore plus fine.

On remarquera les 3 premiers comptes comme étant pourfendeurs du “passe sanitaire” et donc extrêmement actifs. On reviendra sur l’analyse de ces profils par la suite

mostinfluential.png


Les 60 comptes les plus mentionnés et/ou retweetés et/ou retweetés avec un commentaire

Sans surprise, les comptes de E. Macron et O. Véran sont ceux qui ont été les plus cités. Á leurs côtés dans le haut du classement, les comptes de BFMTV et Mediavenir. On devine aisément que l’effet d’annonce du lundi 12 juillet au soir a largement contribué à accroître cette visibilité ; visibilité relayée par les médias.

De manière générale, on retrouve de nombreux médias cités mais aussi des responsables politiques comme F. Philippot, G. Attal ou encore J. Castex.

Le compte de F. Divizio est très sollicité aussi. On comprend mieux la raison lorsque l’on sait qu’il est un des défenseurs de la première heure et un farouche opposant de toutes les sorties de l’exécutif qu’il a toujours jugé liberticide et ubuesque.

Je laisse au lecteur, l’appréciation des autres comptes présents dans ce TOP60.

top60_mentions.png


Les 50 interactions les plus fortes

Ce tableau met en exergue la multitude d’interactions de certains comptes avec d’autres comptes et les plus actifs à travers leurs tweets.

On notera que parmi les utilisateurs les plus prolifiques, un certain @ChrisMcCandl (Le démocrate a son pass sanitaire) ou encore @Jyzee2 (⛔ Anti pass sanitaire ⛔), ont été assez virulents à leur manière ! L’un en faveur du passe et l’autre à l’extrême opposé. D’ailleurs, leurs descriptions en témoignent.

top50_strong_interactions.png

Certaines des lignes de la précédente capture d’écran peuvent interpeller. Si vous n’êtes pas familier de Twitter, c’est une pratique très courante que de s’auto-citer… rien de narcissique enfin je l’espère. Je ne connais pas toutes ces personnes…

Il s’agit juste de thread, comprenez l’enchaînement d’une idée à développer qui ne tiendrait pas en 280 caractères sur un seul tweet. Donc, il y a nécessité de chaîner des deux voire plus de plus pour la présenter dans son entièreté.

Voici quelques de ces lignes :

COMPTE MENTIONNANT COMPTE MENTIONNÉ NB
Le démocrate a son pass sanitaire (@ChrisMcCandl) Le démocrate a son pass sanitaire (@ChrisMcCandl) 24
franceinfo (@franceinfo) franceinfo (@franceinfo) 15
Jean-Baptiste Marteau (@jbmarteau) Jean-Baptiste Marteau (@jbmarteau) 10

On pourrait s’accorder à y voir une certaine forme de narcissisme mais il n’en est rien !

Typiquement pour l’exemple du journaliste de France2 Jean-Baptiste Marteau, le 21 juillet il évoquait le #passSanitaire dans les titres du journal qu’il présentait.

jbmarteau.png

Voici un autre paradigme différent des comptes très actifs lors de mon analyse.

On retrouve nos deux amis Le démocrate a son pass sanitaire (@ChrisMcCandl) avec 366 tweets et ⛔ Anti pass sanitaire ⛔ (@Jyzee2) avec 193 tweets sur cette période de 5 jours assez courte.

top50_most_actives_users.png

Je laisse au lecteur, l’appréciation des autres comptes présents dans ce TOP50 et de leur nombre de tweets.


Hashtag frequency

Une des choses qui me semblent intéressantes et pertinentes, est de savoir quels sont les autres hashtags utilisés ou associés à notre sujet de base, #passSanitaire. Cela permet d’avoir une vision plus holistique… et sans donner d’idées à certains, permettre de rajouter du bruit et de polluer le débat.

Sans surprise, le hashtag passSanitaire a été massivement repris avec des variantes dans son utilisation. On notera par exemple :

  • #passsanitaire tout en minuscule et utilisé 159 fois,
  • #Passanitaire avec une lettre majuscule et utilisé 129 fois,
  • #PassSanitaireDeLaHonte avec l’ajout du suffixe de “DeLaHonte” et utilisé 522 fois.

Le corpus des autres hashtag utilisé gravite beaucoup autour du COVID19, vaccin, antivax, Macron, résistance, dictature ou encore manifestation.

On notera l’utilisation du #MajoriteSilencieuseVaccinee qui est le seul hashtag positif et qui a été utilisé que 121 fois. Tous les autres mots-dièse restent très négatifs.

top_hashtags_frequency.png

A l’inverse au bas du classement, on retrouve ces mots-dièse qui viennent renforcer ce sentiment de rejet autour du #passSanitaire.

low_hashtags_frequency.png

On notera des hashtag comme eglise, FIFA22 qui n’ont a priori rien à voir avec notre sujet de base…


Les 50 comptes les plus actifs avec la répartition du nombre de hashtags les plus utilisés autour de #passSanitaire

users_hashtags_repartition.png

users_hashtags_repartition.png

Le tableau suivant bien plus succinct nous donne une meilleure vision, plus globale du nombre de hashtags total utilisé dans les tweets des différents utilisateurs.

users_hashtags_total.png

On voit apparaître de nouveaux comptes dans le TOP10… Je laisse au lecteur, l’appréciation de ce classement ainsi que le nombre de hashtags utilisés par ces différents comptes.


L’heure à laquelle les gens tweetent le plus

Si l’on se penche un peu plus sur la temporalité des 30000 tweets analysés, on notera qu’en France, la majorité des tweets a lieu en début de soirée. On peut expliquer ça par le fait que beaucoup de gens finissant le travail vont se ruer sur leur téléphone en empruntant les transports en commun par exemple.

Si l’on lit différemment ses mêmes chiffres, cela supputerait que si l’on veut toucher un maximum de personnes pour diffuser des théories les unes plus saugrenues que les autres ou au contraire diffuser de vraies infos, il serait plus judicieux de privilégier ces créneaux horaires pour tweeter.

nb_tweets_par_heure.png


Wordclouds ou les fameux nuages de mots…

Je vous présente successivement trois nuages de mots concernant :

=> Les autres hashtags associés à #passSanitaire pour avoir une idée du corpus

hashtag_wordlcloud.png

=> Les utilisateurs ayant contribué au débat autour du hashtag #passSanitraire

user_wordlcloud.png

=> Les mots les plus utilisés dans les tweets autour du hashtag #passSanitraire

wordstweets_wordlcloud.png


Répartition des utilisateurs en fonction des équipements les plus utilisés

Autre métrique intéressante, les équipements de ceux qui tweetent. Voici un aperçu des équipements les plus utilisés durant cette période pour tweeter autour du hashtag #passSanitaire. On notera la prépondérance de Twitter for Android donc de smartphones sous Android. Ensuite, les gens utilisent beaucoup soit leur ordinateur ou alors leur Iphone pour tweeter.

répartition_equipement_par_user.png


Liens externes et internes partagés dans les tweets

Je me suis posé aussi la question sur les liens qui pouvaient être partagés. C’est le genre d’information assez pertinente à avoir pour recouper des sources et voir ce qui transite d’un réseau à l’autre, de communautés en communautés, de personnes à personnes.

Je vous mets les deux captures d’écran respectives correspondant aux liens externes et internes. Les liens externes font références à des articles de blog de la presse mainstream ou de blogs en tous genre. On retrouve dans ces liens aussi des vidéos qui la plupart sont questionnables… Les liens internes quant à eux, sont les liens vers des tweets que certains ont pu repointer pour différentes raisons.

liens_externes.png

liens_internes.png



CONCLUSION

L’analyse du hashtag #passSanitaire m’a permis d’avoir à titre personnel une autre lecture de ce qui se passait derrière les tweets. Cet éclairage permet une meilleure compréhension des enjeux mais surtout vient parfois donner du sens ou contrebalancer certains sons de cloche.

Il y aurait encore tellement de métriques à vous présenter, des choses à recouper, des éclairages à apporter mais l’article serait bien trop volumineux. Peut-être que dans un dossier spécial, cela passerait mieux.

Mais il est à noter que l’effet d’annonce du M. le Président a mis le feu aux poudres. Beaucoup sont sortis de leur réserve et ont voulu faire entendre leur voix. Ces marqueurs ne sont pas à prendre à la légère et permettent à mon humble avis d’anticiper sur de nombreuses choses à venir y compris des mouvements sociétaux.

Beaucoup tweete mais pas toujours pour les bonnes raisons…🤷🏾‍♂️ On voit apparaître des communautés fort intéressantes et tous les membres desdites communautés qui gravitent autour. Au passage, il y a un bon nombre de compte dormant ou bot, qui sont (ré)activés à l’occasion pour amplifier ou rajouter du bruit !

Par ailleurs, j’ai aussi commencé à analyser un fameux groupe sur facebook grandissant avec des membres qui postent pas mal de choses… sans se rendre compte que, par défaut, ce genre de groupes est truffé de personnes des renseignements… #lasuiteauprochainrdv

Je n’ai pu aborder que superficiellement certains aspects mais j’espère que cette petite immersion fût enrichissante pour vous et vous aura permis d’apprendre quelques petites choses. L’information est la chose la plus manipulable et encore plus quand on ne sait pas l’appréhender et la recouper.

N’hésitez pas à me contacter pour tout complément ou discuter de sujets connexes qui seraient intéressants d’analyser pour un dossier plus conséquent.





MESSAGE DE SERVICE

Dans le fond, la seule chose qui me chagrine et me gêne profondément… est de savoir que les moindres fait et gestes d’un citoyen seront potentiellement épiés dans un futur proche…Prenons un petit parallèle pour expliquer ce qui pèserait comme dérives extrêmes autour du #PassSanitaire.Imaginons qu’en temps normal, mesdames vous soyez en vacances entre amis. Au bout d’une semaine, s’approche de vous un inconnu et là, ce dernier, après de rapides salamalecs, se mettent à vous conseiller des lieux sympas à visiter sur votre lieu de villégiature… Bien entendu, il ne s’arrête pas là, il prend la peine d’insister sur quelques détails comme l’heure à laquelle vous rentrez dans votre hôtel, ou encore certaines rues peu fréquentables que vous avez pu emprunter…

Comment réagissez-vous honnêtement ?

J’imagine, totalement apeurée… de savoir qu’une personne vous a ciblé, suivi et en a déduit de nombreuses choses sur vous…

Outre les questions sanitaires, sur lesquelles je ne reviendrais absolument parce que n’étant pas spécialiste, il y a celles relevant de notre #vieprivéenumérique

Demain (dans 1e semaine, 1 mois, 6 mois, 1 an, …), rien n’empêchera que ces données puissent être exploitées par des tiers. Ainsi, un tiers de confiance ou non, i.e: le barman du coin, pourra déduire avec un peu de jugeote :

  • votre bord religieux ;
  • vos orientations sexuelles ;
  • vos penchants pour certaines activités ;
  • votre sociabilité rapport à la fréquence nombre de bars / restos ;
  • votre bord politique ;
  • vos centres d’intérêts ;

La liste pourrait facilement s’allonger, mais ce n’est qu’ici que quelques exemples.

Pour ma part, depuis quelques années j’ai pris conscience de ces questions concernant la vie privée numérique. Voyager, être au contact d’autres cultures nous ouvrent énormément. Mais par-dessus tout, j’ai pu me rendre compte que beaucoup de pays nous envie notre liberté de penser, de se mouvoir, d’être. Ce n’est absolument pas anodin si le France est le pays des droits de l’Homme par excellence.

L’adoption d’un “pass sanitaire” généralisé enfreindrait énormément nos libertés et laisserait planer le doute sur de sévères dérives.

Personnellement, et comme pour d’autres experts, je sais comment passer en partie au travers des mailles du filet ; quid du reste de la population.

Nos libertés en dépendent et celles de nos enfants.

Que le pays des lumières ne bascule point dans l’obscurantisme.





Cybèrement vôtre, SaxX / mail