Avec l'ACM, tu as la fameuse méthode dite des patates = regroupement à la main des modalités proches qui pourraient faire une classe. Ensuite, en fonction des caractéristiques de tes individus tu sais dans quelle classe ils se trouvent.
Vu ta problématique j'opterais plutot pour une classification type CAH que tu peux faire sous SAS.
Cette procédure va regrouper tes individus (entreprises) en classes en fonction des modalités de tes différentes variables.
Sinon pourquoi veux-tu absolument choisir des variables parmi celles dont tu disposes. Il y en a tant que ça? Si vraiment tu dois réduire le nombre de tes variables. Je m'y prendrais comme cela :
- à partir des résultats de ton acm, je retirerais les variables manifestement très corrélés (celles dont les modalités sont toujours très proches dans la représentation graphique, enfin il faut garder une variables parmi celles-ci, ex : il y a des chances que nombre de salariés et CA le soient, à toi de voir). De plus, je regarderais la contribution des variables (ctr) et le rang de la contribution car ce sont les variables les plus explicatives des axes. Et il faut aussi regarder les variables dont les modalités ne sont pas centrées en 0 (en général elles coincident avec les fortes contributions).
Voilà, tu peux désormais choisir les variables les plus pertinentes. Mais utilise aussi ton expérience sur le sujet pour le choix.
Par la suite, je me ferais une petite CAH. L'avantage c'est que tu peux choisir ton nombre de classe en focntion de l'inertie expliquée, et donc la précision VS la taille des tes classes.
Pour la réalisation de l'ACM et de la CAH, tu peux t'aider des macro INSEE disponibles en téléchargement sur le site de l'INSEE.
Voilà ce que je peux te dire sur le sujet,
Bonne chance