elissa
Nombre de messages : 1 Date d'inscription : 05/09/2007
| Sujet: Clusters Mer 5 Sep - 11:30 | |
| Bonjour tout le monde! Je ne suis pas sûre que ce forum "fonctionne" toujours, car il ya beaucoup de questions, de nouveaux posts, et peu de réponses... Mais bon, vu que j'ai beau lire mon énorme bouquin de stats, chercher un peu au hasard dans SPSS, farfouiller sur internet et que je ne trouve pas, je viens ici chercher de l'aide. Je suis actuellement sur un chouette protocole avec de chouettes données que j'ai déjà exploitées pour mettre en évidence des liens entre déiffrentes variables (comparaisons de moyennes, corrélations, régressions linéaires). J'ai assisté à un congrès, il y a peu, où un chercheur présentait une étude avec laquelle il avait fait une analyse en clusters (je ne suis même pas sûre, d'ailleurs de l'expression exacte): à partir de toutes ses variables, il a fait une analyse stat qui lui a permis de mettre en évidence des types (regrouper des variables qui seraient intercorrélées, en quelque sorte). D'après ce que j'ai pu voir, cela pourrait avoir à faire avec la classification hiérarchique ou l'analyse factorielle, mais j'ai beau essayer avec SPSS, ça ne marche pas trop... Je précise que j'ai beaucoup de variables, n=210, que mes variables sont nominales dichotomiques, nominales avec plusieurs modalités, numériques... S'il y a une âme charitable qui s'y connaît bien, ce serait formidable!!! merci d'avance! | |
|
faten
Nombre de messages : 4 Date d'inscription : 06/09/2007
| Sujet: Re: Clusters Mer 19 Sep - 15:38 | |
| Bonjour Elissa,
Le terme que tu as utilisé existe bien. Il s'agit du clustering, c'est une méthode de classification. Comme toute méthode de classification, elle se décompose en phase d'apprentissage (dans laquelle tu identifies tes classes la où tu utilises une base d'apprentissage), et une phase de test (tes classes sont deja définies et tu utilises ta base de test que tu vas classifier). Chaque individu de ta base est représenté par un vecteur de paramètres que tu devras fixer dès le début ainsi que la distance que tu vas utiliser. Un cluster est le centre d'une classe.
Voici une description de l'algorithme: 1- tu choisis arbitrairement tes cluster parmis ta base d'apprentissage (tu dois fixer dabor le nombre de clusters=nombre de classes) 2- tu calcules la distance entre chaque element de ta base et chaque cluster 3- un element fera partie de la classe représentée par le cluster le plus proche 4- une fois tous tes elements sont classés, tu calcule le centre de chaque classe (comme un barycenter avec la même distance) 5- tu refais 2, 3, 4 avec les nouveau clusters=les centres des classes, jusqu'à ce que les nouveaux clusters sont proche des anciens (il s'agit d'un équilibre de ton système)
Une fois tes classes sont définies, tu passe à la base de test et tu ne fias que les étapes 2 et 3.
Je ne sais pas si je t'ai aidée et que c'est ce que tu cherche à savoir, mais je t'ai juste défini le clustering, car tu me semble ne pas le connaitre. En tout ça t'aidera surement en quelque chose. | |
|