Aller au contenu

Cluster-17 // Politique & Big Data


Déchet(s) recommandé(s)

On m'a conseillé récemment un excellent site, Cluster17. Le principe est simple : 33 questions politiques clivantes, vous répondez avec franchise et honnêteté et l'algorithme identifie le cluster politique auquel vous appartenez. 

Pour faire le test, c'est ici : 

 

Un cluster, c'est un groupe à peu près homogène qui a des idées politiques similaires et qui se trouve avoir aussi une origine, un niveau d'étude, et un niveau de revenus proches. C'est orienté sur la politique française mais potentiellement les catégories restent pertinentes au niveau de l'Occident d'une façon générale, à vérifier. 

En étudiant d'un peu plus près les différents clusters, leurs différences, les lignes de rupture on peut avoir une vision assez nette de la situation actuelle et des évolutions possibles. 

Le site est encore jeune mais il commence à produire des analyses assez intéressantes, c'est un truc à suivre je pense. 

Révélation

Je me passionne pour le Big Data en ce moment, si ça vous intéresse de comprendre le principe du clustering les vidéos de StatQuest sont toujours pertinentes (les sous-titres peuvent être activés)  :

 

Lien vers le commentaire
Partager sur d’autres sites

De mon côté, Cluster 14 : les sociaux-patriotes.

Principalement des descendants d'immigrés, espagnols, portugais, polonais — des mécaniciens, des cheminots, des facteurs, des aides à domicile, des femmes de ménage. En somme, toute ma famille maternelle. Très à gauche économiquement, favorables à la solidarité et à la redistribution. Très à droite sur les valeurs, si l'Islam veut s'implanter il doit d'abord passer par le filtre de la philosophie des Lumières : aucune partition de la société, le peuple doit rester un et indivisible, pas d'alternative. Le Catholicisme est passé au filtre des Lumières, l'Islam le doit aussi. Et aucune nostalgie du pays d'origine. Aucune. Nos grand-parents on fait le boulot, ils se sont assimilés. Ils ont fait un effort presque surhumain, ils ont arrachés leurs racines profondes pour les replanter ici, ça a pas été facile mais ils l'ont fait et dès lors — de quel droit les autres en seraient dispensés ? A quel instant quelqu'un a-t-il dit que de s'assimiler à la France serait facile ? Mais ce que nos anciens ont fait ça s'appelle construire et derrière pour nous, les descendants, nos vies sont les mêmes que les autres. Je suis un vrai français de souche, en tant que petit-fils. Je défie quiconque de remettre ça en cause. Et pourtant j'ai une gueule métissée, peu importe le pays où je vais autour de la méditerranée, les inconnus me parlent d'abord dans leur langue locale. Et je ne suis qu'un pur produit de la culture française et cette culture-là, ma culture, elle est belle.

Je ne songeais pas à Rose ;
Rose au bois vint avec moi ;
Nous parlions de quelque chose,
Mais je ne sais plus de quoi.

J'étais froid comme les marbres ;
Je marchais à pas distraits ;
Je parlais des fleurs, des arbres
Son œil semblait dire: " Après ? "

La rosée offrait ses perles,
Le taillis ses parasols ;
J'allais ; j'écoutais les merles,
Et Rose les rossignols.

Moi, seize ans, et l'air morose ;
Elle, vingt ; ses yeux brillaient.
Les rossignols chantaient Rose
Et les merles me sifflaient.

Rose, droite sur ses hanches,
Leva son beau bras tremblant
Pour prendre une mûre aux branches
Je ne vis pas son bras blanc.

Une eau courait, fraîche et creuse,
Sur les mousses de velours ;
Et la nature amoureuse
Dormait dans les grands bois sourds.

Rose défit sa chaussure,
Et mit, d'un air ingénu,
Son petit pied dans l'eau pure
Je ne vis pas son pied nu.

Je ne savais que lui dire ;
Je la suivais dans le bois,
La voyant parfois sourire
Et soupirer quelquefois.

Je ne vis qu'elle était belle
Qu'en sortant des grands bois sourds.
" Soit ; n'y pensons plus ! " dit-elle.
Depuis, j'y pense toujours.

 

Victor Hugo, Vieille chanson du jeune temps. 

 

Et pour autant, si on défend cette culture, notre culture, nous, les assimilés des bas-quartiers, économiquement on est de gauche, on veut de la solidarité, on veut du tissu social, on veut un état fort et protecteur. Et par dessus-tout on veut être libres de nos vies, l'état n'a rien à dire là-dessus, l'état n'a rien à faire dans nos vies intimes. Il s'occupe pas de nos fesses, il s'occupe de sa monnaie et de ses frontières, il s'occupe d'assurer le minimum matériel à tous et nous on s'occupe pas de lui, chacun son boulot. La vie locale elle est à nous, c'est la notre pas celle des parisiens. On vit comme on veut à l'endroit où on est, mais on respecte Paris et on paie nos impôts pour qu'ils aient les moyens d'agir à leur niveau, pour faire à bonne échelle ce qui est bien pour tous. 

Je sais pas si vous voyez, à peu près, la sociologie du truc. A priori on est 8% en France. 

  • J'aime! 1
Lien vers le commentaire
Partager sur d’autres sites

(modifié)

Et donc, en synthèse de ce que j'ai pu dire plus haut : dans ma famille on a perdu quelque chose, aimer la France c'était pas gratuit. On a payé. Mes ancêtres ont payés. Et moi je l'aime, mon pays. Le premier qui me dit que parce que j'aime mon pays je suis un fasciste, qu'il se déclare. 

L'assimilation, ça fonctionne. Ca a fonctionné. En France, par l'assimilation, un immigré devient de souche en deux générations, pas plus. 

Modifié par BeauRouge
  • J'aime! 1
Lien vers le commentaire
Partager sur d’autres sites

En fait, après une petite recherche rapide, Cluster17, c'est juste une maison de sondage, avec un petit vernis techno-scientifique par dessus. Le test des cluster est probablement aussi intéressant que les tests de personnalité MBTI (i.e. pas vraiment).

 

  • J'aime! 3
  • HAHAHA! 1
Lien vers le commentaire
Partager sur d’autres sites

Hmm , pas sûr. Je ne juge pas aux "on-dit-que" et lorsqu'on juge sur pièce, les clusters sont cohérents. Quand je dis que je suis passionné par le Big Data c'est une sorte d'euphémisme, c'est surtout que je passe mon Master cette année dans cette spécialité. Que Cluster-17 fasse aussi des sondages, oui. Si tu as passé le test, dans quel cluster es-tu Céline ?

Lien vers le commentaire
Partager sur d’autres sites

il y a 35 minutes, BeauRouge a dit :

Et donc, en synthèse de ce que j'ai pu dire plus haut : dans ma famille on a perdu quelque chose, aimer la France c'était pas gratuit. On a payé. Mes ancêtres ont payés. Et moi je l'aime, mon pays. Le premier qui me dit que parce que j'aime mon pays je suis un fasciste, qu'il se déclare. 

L'assimilation, ça fonctionne. Ca a fonctionné. En France, par l'assimilation, un immigré devient de souche en deux générations, pas plus. 

Je trouve juste que la notion de nationalisme est passée date.

Lien vers le commentaire
Partager sur d’autres sites

il y a 2 minutes, MattIsGoD a dit :

Je trouve juste que la notion de nationalisme est passée date.

Certes, pourquoi pas. Autant, ma famille et moi on s'est assimilés à rien.

Passé de date, ok, mais alors — remplacé par quoi ? Pour toi, qu'est-ce qui a remplacé cette notion ? 

Lien vers le commentaire
Partager sur d’autres sites

il y a 6 minutes, BeauRouge a dit :

Hmm , pas sûr. Je ne juge pas aux "on-dit-que" et lorsqu'on juge sur pièce, les clusters sont cohérents. Quand je dis que je suis passionné par le Big Data c'est une sorte d'euphémisme, c'est surtout que je passe mon Master cette année dans cette spécialité. Que Cluster-17 fasse aussi des sondages, oui. Si tu as passé le test, dans quel cluster es-tu Céline ?

Les clusters sont cohérent comme les types MBTI le sont. Ça reste une grille d'analyse avec un gros risque de biais, puisque le choix des groupes reste énormément arbitraire. Le fait qu'il y en ait autant que 17 devrait être un gros red flag. La grosse question, ultimement, c'est quelle est la valeur ajoutée d'un tel truc. Je vais prendre un risque, et dire aucune.

On me met sociaux-démocrates, vraisemblablement en raison de mon statut socio-professionnel, et qu'au Québec, on a des positions plus tendres sur le multiculturalisme. (Mes positions sur la laicité font de moi un vilain fasciste au Québec, mais un beige citoyen du monde en France).

Pour le coup, il va falloir m'expliquer en quoi y'a du big data derrière Cluster17. Faire du K-means sur 2000 répondants d'un sondage, c'est pas du big data. Ce que Cambridge Analytica a fait, en se basant non pas sur des réponses à des questions, mais directement sur le comportement des individus en agrégant les données de millions de personnes, ça c'est du big data qui a un pouvoir prédictif (et dirigeable).

  • J'aime! 1
Lien vers le commentaire
Partager sur d’autres sites

(modifié)

Pour l'instant je ne suis pas assez compétent pour déterminer si trop de noyaux sont contre-productif, d'instinct je dis non, ça dépend du jeu de données et uniquement du jeu de données. Certains donneront deux clusters, d'autres douze, d'autre seize d'autre six-cent. 

Et la coïncidence avec le MBTI est intéressante, s'ils s'appellent Cluster-17 c'est qu'ils ont identifiés 16 types, le 17ème cluster, c'est eux. Et 16 types, c'est le nombre du MBTI. 

Est-ce que tu as déjà essayé de lire C. G. Jung ? Le MBTI ne sort pas de nulle part, c'est fondé sur une pensée, celle de Jung.

Modifié par BeauRouge
Lien vers le commentaire
Partager sur d’autres sites

il y a 49 minutes, Celine a dit :

Pour le coup, il va falloir m'expliquer en quoi y'a du big data derrière Cluster17. Faire du K-means sur 2000 répondants d'un sondage, c'est pas du big data. Ce que Cambridge Analytica a fait, en se basant non pas sur des réponses à des questions, mais directement sur le comportement des individus en agrégant les données de millions de personnes, ça c'est du big data qui a un pouvoir prédictif (et dirigeable).

En fait, de ce que j'ai vu on a pas les infos sur le nombre des données qui ont permis d'établir le modèle des clusters. 2.000 c'est environ le nombre des participants aux sondages, après que le modèle ait été établi — mais nous n'avons pas les chiffres qui ont permis d'établir le modèle. 

Et ça lance bien sûr la question de la data, chacun de nous sème de la data derrière lui chaque fois qu'il se déplace sur internet et en répondant au questionnaire de Cluster17 vous leur donnez de la data. C'est pas une question simple. 

Et le Big Data c'est une frontière floue, à partir de quel instant le jeu de données est-il suffisant pour travailler ? Nos profs disent que les meilleurs d'entre eux ont besoin de très peu de données pour s'amuser, à chaque itération ils sont capables de retirer un jeu aléatoire dans les données initiales et de retravailler plusieurs fois comme ça, sur des données réduites, en remélangeant ensuite les jeux aléatoires entre eux. C'est pas idéal, mais ça fonctionne. Il n'y a pas un nombre fixe permettant de figer la frontière du big data, tant que tu peux trouver des fonctions mathématiques en sortie et que ces fonctions te donnent des résultats pertinents, c'est que ça marche. 

Ca se juge aux résultats en sortie. Soit les résultats sont pertinents, soit ils ne le sont pas. Et comme le MBTI j'ai bien l'impression que Cluster17 a trouvé des lignes de force pertinentes. 

Lien vers le commentaire
Partager sur d’autres sites

il y a 17 minutes, BeauRouge a dit :

En fait, de ce que j'ai vu on a pas les infos sur le nombre des données qui ont permis d'établir le modèle des clusters. 2.000 c'est environ le nombre des participants aux sondages, après que le modèle ait été établi — mais nous n'avons pas les chiffres qui ont permis d'établir le modèle. 

 

Ça m'étonnerait qu'il y ait un gros modèle derrière. À vu d'oeil, ça me semble beaucoup plus être une dénomination faite à la main, à partir de recoupement sur le profil des répondants. LE genre de chose que l'on sait déjà en feuilletant les rapports des autres grosses maisons de sondage. À savoir les profils socio-économiques et ethniques des électeurs selon leur groupement politique. En gros, rien qu'une simple PCA ne pourrait pas faire. Ce que Cluster17 a fait, c'est surtout apposer un nom sur ces groupements, et en faire une inférence sur un profil type d'électorat. On est beaucoup plus dans le marketing, que dans une démarche scientifique en tant que telle.

 

Citation

t ça lance bien sûr la question de la data, chacun de nous sème de la data derrière lui chaque fois qu'il se déplace sur internet et en répondant au questionnaire de Cluster17 vous leur donnez de la data. C'est pas une question simple. 

Cluster17 se base sur les 30 questions pour déterminer à quel groupe on est. Pas sur notre historique de navigation.

 

Citation

Et le Big Data c'est une frontière floue, à partir de quel instant le jeu de données est-il suffisant pour travailler ? Nos profs disent que les meilleurs d'entre eux ont besoin de très peu de données pour s'amuser, à chaque itération ils sont capables de retirer un jeu aléatoire dans les données initiales et de retravailler plusieurs fois comme ça, sur des données réduites, en remélangeant ensuite les jeux aléatoires entre eux. C'est pas idéal, mais ça fonctionne. Il n'y a pas un nombre fixe permettant de figer la frontière du big data, tant que tu peux trouver des fonctions mathématiques en sortie et que ces fonctions te donnent des résultats pertinents, c'est que ça marche. 

Tu mélanges l'entraînement d'un modèle d'apprentissage machine et big data. Effectivement, on peut généraliser efficacement à partir d'un jeu de donnée limité, si celui-ci est de qualité (fortement i.i.d. ).

Mais par big data, ce que l'on entend, c'est des données qui individuellement sont pauvres en information (par exemple, que quelqu'un aime manger du riz), mais qui lorsque combiné à une panoplie d'autres données toutes aussi individuellement pauvres en information, on gagne un pouvoir prédictif énorme sur le profil type d'un individu. Bref, on fait une inférence à partir d'observations.

Dans Cluster17, on est plus dans des problèmes décisionnels. On a des données limitées dans leur volume, mais riches dans leur information ( savoir si l'on est pour ou contre la peine de mort pour les terroristes). Dans les définitions actuelles, ce n'est pas du big data.

Alors présenter Cluster17 comme du big data, c'est juste du langage techno-marketing pour impressionner le commun des mortels.

 

Citation

Ca se juge aux résultats en sortie. Soit les résultats sont pertinents, soit ils ne le sont pas. Et comme le MBTI j'ai bien l'impression que Cluster17 a trouvé des lignes de force pertinentes. 

Les résultats de Cluster17, c'est le sondage. Et leur claim, c'est que de classifier les électeurs comme il le font permet de mieux capter la dynamique de l'électorat. J'ai tendance à penser que ça tend à surestimer les partis aux extrêmes, sans nécessairement apporter de plus-value claire. On verra bien lors des élections.

  • J'aime! 3
Lien vers le commentaire
Partager sur d’autres sites

(modifié)

Ok, je garde ça en tête. J'ai un côté idéaliste toujours, dès que ça semble bon je fonce tête baissée. 

Mais j'aime quand même bien leurs premières analyses : Pécresse (LR) vient de s'allier au centre de Lagarde (UDI) et ce faisant, elle augmente son emprise sur les Centristes (Cluster 5), les Sociaux-Républicains (Cluster 8) mais elle diminue son influence dans les clusters Identitaires (16) et Anti-Assistanat (15). Or, ces deux clusters sont très nombreux, surtout les identitaires qui représentent environ 10% de l'électorat. L'emprise chez le cluster des centristes affaiblit Macron, c'est le cœur de son électorat, mais ce faisant elle laisse de la marge dans son propre électorat à Zemmour (clusters de 12 à 16), qui se situe entre elle et Le Pen. 

Cette campagne électorale est juste passionnante :fallout_party:jusqu'à présent je n'avais jamais vu autant des possibilités aussi ouvertes. 

Modifié par BeauRouge
Lien vers le commentaire
Partager sur d’autres sites

grosse surprise :)

je ne comprenais pas trop l'association avec le MBTI, mais je vois très bien de quoi tu parles maintenant. ça fait très marketing, oui, et c'est amusant à faire et à lire.

on nous associe même avec des personnalités connues (que je ne connais pas). quoique celui du milieu, je le reconnais peut-être du film d'Astérix.

image.thumb.png.e7c6d935cd0fdc02fd5751f6bfdf3a2d.png

  • J'aime! 1
Lien vers le commentaire
Partager sur d’autres sites

Il y a 18 heures, MattIsGoD a dit :

Je trouve juste que la notion de nationalisme est passée date.

J'ai un peu de mal à comprendre cette idée, alors que la plupart des grandes puissances mondiales sont très nationalistes et que les États-Unis traversent une crise sociétale partiellement liée à leur multiculturalisme. Je peux tout à fait comprendre que ça te déplaise et que tu aimerais vivre dans un monde où le nationalisme n'existe plus, mais quand on a les Chinois qui font les Chinois, la Russie qui s'amuse à nous montrer son zizi, le Brexit, plus de 30 % d'intentions de vote pour (ce qu'ils appellent ridiculement) l'extrême droite en France, la Pologne qui décide qu'elle passe avant l'UE, des nationalistes bien représentés aux Pays-Bas, en Italie, en Espagne, en Autriche, en Hongrie, ça semble au contraire fortement d'actualité et l'abandon du nationalisme ne concerne qu'une minorité à l'échelle planétaire.

 

---

Sinon, je fais partie des libéraux : 

Disons que sociologiquement, ça ressemble très fort aux gens qui m'entourent et à ce que je suis devenue mais que je me sens une fibre sociale un peu plus développée que ça. Je me reconnais dans ce que @BeauRouge dit plus haut sur nos familles qui ont fait l'effort de s'intégrer, et je constate un développement de l'Islam qui se fait au mépris de certaines de nos règles de vie.

--- 

@Tomás de Torquemada, je n'ai pas aimé l'intervention de Pécresse, ça m'a confronté dans l'idée qu'elle est une petite élève modèle qui sait fayoter quand il le faut (mais elle ferait néanmoins une meilleure présidente que Macron). Cependant, de ce qui se dit sur elle, elle est très impliquée dans la défense des femmes maltraitées sur le terrain et il aurait été malvenu qu'elle esquive le sujet.

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Je veux revenir!
 Partager

×
×
  • Créer...