Statistiques

tout sur les statistiques
 
AccueilAccueil  FAQFAQ  RechercherRechercher  S'enregistrerS'enregistrer  MembresMembres  GroupesGroupes  Connexion  

Partagez | 
 

 Multicolinéarité

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
poupou2



Nombre de messages : 16
Localisation : Paris
Date d'inscription : 29/05/2006

MessageSujet: Multicolinéarité   Mer 20 Sep - 19:43

Bonjour,

Je dois faire des modèles de régression multiple (avec la PROC REG de SAS).

Je vérifie bien sur la non collinéarité des covariables. J'ai trouvé plusieurs façons de faire.

1) l'option collin : si le "condition index" est supérieur à 30, je m'intéresse aux covariables ayant des proportions de variation supérieures à 0.80.
2) l'option VIF : je m'arrête alors sur les covariables ayant un coefficient supérieur à 10.

Le problème: j'utilisais le critère 1) jusqu'à présent. En essayant le 2e, les covariables que je jugeais collinéaires ne le sont plus... scratch

Est-ce ces deux seuils (pour les 2 options) vous semblent juste? trop restrictifs?

(un autre bouquin disait que la collinéarité était identifiée lorsque la tolérance (option tol) était <0.40 )
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Enzo



Nombre de messages : 24
Localisation : France-Lyon
Date d'inscription : 09/05/2006

MessageSujet: Re: Multicolinéarité   Jeu 21 Sep - 15:54

Bonjour poupou2 Very Happy

Il faut bien comprendre que les valeurs seuils (30 pour condition index et 10 pour le VIF) ne sont données qu'à titre indicatif.

En effet, la distribution de ces statistiques est imprévisible (dépend uniquement des données empiriques) et il est difficile de donner des valeurs pour lesquelles la tendance est forte ou faible. C'est un peu comme lorsqu'on dit qu'il faut 30 exemples pour qu'une v.a moyenne soit approximativement normale. Dans des distributions très dissymétriques (=écart moyenne-médiane fort), ce chiffre ne veut plus rien dire...

Tout ça pour dire que je trouve ces valeurs tombées du ciel sans aucun sens. Personnellement, ces statistiques me semblent utiles pour comparer un modèle à un autre, mais pas pour évaluer conrètement la multicolinéarité. Dans une optique un peu plus "théorique", il existe un test de présence de multicolinéarité dans un modèle (j'ai oublié le nom),mais il ressemble à la tolérance (i.e, il utilise le calcul du déterminant de (X'X) ).

Par contre, il y a une technique hyper efficace pour lutter contre la multicolinéarité en régression linéaire, c'est la régression PLS (Partial Least Squares). J'ai eu l'occasion d'en faire une étude théorique et pratique assez approfondie lorsque j'étais en DEA. Et c'est vrai que ça marche très bien. Cette méthode est implémentée dans SAS (proc PLS).

Voilà tout!
a+
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Enzo



Nombre de messages : 24
Localisation : France-Lyon
Date d'inscription : 09/05/2006

MessageSujet: Re: Multicolinéarité   Jeu 21 Sep - 16:00

Il y a qqch de pas mal ici si tu veux en voir un peu plus :

http://www.ehess.fr/revue-msh/pdf/N173R963.pdf#search=%22test%20multicolin%C3%A9arit%C3%A9%20corr%C3%A9lation%20matrice%22
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Invité
Invité



MessageSujet: Re: Multicolinéarité   Jeu 21 Sep - 17:14

Salut,

Pour l'option collin , il me semble que les "seuils" de SAS sont de 10 et O,5 ;

Du moins c'est ce qu'il y a dans l'aide de SAS. ce ce qui explique que tu ne dois pas trouver la même chose.

Pour l'option tol, elle est définie comme 1/vif,
Revenir en haut Aller en bas
poupou2



Nombre de messages : 16
Localisation : Paris
Date d'inscription : 29/05/2006

MessageSujet: Re: Multicolinéarité   Jeu 21 Sep - 18:18

Merci pour ces réponses.
Je vais chercher du coté PLS study
Mais faute de temps, je vais quand même regarder le VIF (ce soir en tout cas)
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
sylo



Nombre de messages : 1
Date d'inscription : 27/07/2007

MessageSujet: Re: Multicolinéarité   Ven 27 Juil - 6:24

Et hop, je deterre ce topic. Je suis moi meme confronte a des tests sur le sujets de la multicollinearite. Quand je retire la constante (COLLINOINT) des calculs, je n'ai pas de multicolinearite selon les indices. Par contre, avec la constante, toutes mes variables sont correlees confused
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Contenu sponsorisé




MessageSujet: Re: Multicolinéarité   Aujourd'hui à 13:29

Revenir en haut Aller en bas
 
Multicolinéarité
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» Multicolinéarité
» Colinéarité et régression multiple
» régression linéaire multiple: problème vif
» Linéarité d'une vanne de sortie de chaudière
» colinéarité exercice n°2

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
Statistiques :: Statistiques-
Sauter vers: