Statistiques

tout sur les statistiques
 
AccueilAccueil  FAQFAQ  RechercherRechercher  S'enregistrerS'enregistrer  MembresMembres  GroupesGroupes  Connexion  

Partagez | 
 

 Quelques questions sur la régression.

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
huy60



Nombre de messages : 1
Date d'inscription : 15/06/2012

MessageSujet: Quelques questions sur la régression.   Ven 15 Juin - 19:54

Bonjour,

Je lis actuellement des études économétriques en économie (ou en sciences sociales éventuellement), et il y a pas mal de choses dont je ne comprends pas encore. J'espère trouver des réponses ici, où je trouverais forcément des spécialistes.

Quelle est, par exemple, la différence entre une régression logistique et probit ? Et pour quel motif on utiliserait l'un et pas l'autre ? Idem pour la régression multiple (dit aussi MCO, il me semble, corrigez-moi si il y a erreur).

Quel est la différence entre "B" et "Beta" ? Si par exemple, le coefficient de "B" était nul (0.000) alors que celui de "Beta" était positif (du genre 0.050) qu'est-ce que cela impliquerait ?

Si la "constante" (intercept?) est négative, est-ce un problème ? Et si sa p-value est supérieure à 0.05, qu'est-ce que cela impliquerait ? Que le modèle est à jeter ?

Qu'est-ce que le "Wald chi-square" et "adjusted Wald F" signifient ? Je lis parfois aussi "Levene statistics" et "df". Je ne vois pas ce que ça peut vouloir dire.

Désolé pour toute la foule de question, mais je suis encore un bleu dans le domaine.
Merci d'avance de vos réponses.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
K.Pearson



Nombre de messages : 1
Date d'inscription : 13/10/2012

MessageSujet: Quelques questions sur la régression: éléments de réponse   Sam 13 Oct - 14:09

Question: Quelle est, par exemple, la différence entre une régression
logistique et probit ? Et pour quel motif on utiliserait l'un et pas
l'autre ?
Réponse: Régression logistique et régression probit :
Le modèle logistique s’écrit E(Y | X = x) = h(x) avec h : sigmoïde.
Une fonction sigmoïde est h(x) = (exp(x))/((1+exp(x))) .
Mais on peut aussi utiliser d’autres fonctions sigmoïdes.
Dans le cas où Y est binaire (et seulement dans ce cas-là), le
logit peut être remplacé par le probit : leprobit est l’inverse de la
fonction de répartition de la loi normale centrée réduite :
pour p ∈ [0 ; 1], F(x) = p avec F(x)= 1/√2pi ∫-∞ à x 〖exp(-1/2 u² )du〗
<=> x= F^(-1) (p)
<=> x = probit (p)

Choix entre logit et probit : on préfère souvent la régression
logistique car :
- Elle est plus simple à calculer (pour l’écriture du maximum de
vraisemblance.
- Elle donne une interprétation claire des coefficients en termes
d’odd ratios.

Question: Idem pour la régression multiple (dit aussi MCO, il me semble,
corrigez-moi si il y a erreur).
Réponse: idem pour la régression multiple :
- Dans les régressions sur variables catégorielles (logistique ou probit), on
essaie de relier une variable à expliquer qualitative (par exemple, individu sain
ou malade (0 ou 1)) par des variables quantitatives (âge) et/ou des variables
qualitatives (Catégorie Socio-Professionnelle( en 3 modalités par exemple)).
- Dans la régression linéaire (simple ou multiple), on essaie de relier une variable
quantitative (par exemple le montant de l’impôt d’un foyer) par des variables
explicatives quantitatives (par exemple revenu annuel du foyer et nombre de
personnes du foyer - 1 ).

Question: Quelle est la différence entre "B" et "Beta" ? Si par exemple, le
coefficient de "B" était nul (0.000) alors que celui de "Beta" était positif (du genre
0.050) qu'est-ce que cela impliquerait ?

Réponse: Concernant la différence entre « B » et « Beta »,je ne
comprends pas la question. Que sont « B » et « Beta » ? Sont-ils les coefficients affichés en sortie de SAS, d’un autre logiciel ? Si oui, dans quelle procédure du logiciel ?

Question: Si la "constante" (intercept?) est négative, est-ce un problème ?
Et si sa p-value est supérieure à 0.05, qu'est-ce que cela impliquerait ? Que le
modèle est à jeter ?

Réponse:
- Si la « constante » (intercept de SAS) est négative par exemple dans la
régression linéaire du montant y de l’impôt dû par le foyer sur le revenu annuel
du foyer x1 et le nombre de personnes du foyer moins une x2, régression
notée y = β0 + β1*x1 + β2*x2 , cela signifie si β0 (la constante ou encore
intercept) est négative que dans le cas où x1=x2=0 (revenu annuel du foyer
nul ; nombre de personnes du foyer égal à 1), alors, y = β0 < 0, autrement dit,
le foyer perçoit une somme d’argent plutôt que d’en payer une (minimum vital).
Il n’y a donc pas, de problème à ce que la constante soit négative.
- Si la p-value de la constante est supérieure à 0,05, on rejette avec 5% de
chances de se tromper l’hypothèse selon laquelle β0 ≠ 0. Cela ne signifie pas
nécessairement que le modèle est à rejeter.

Question: Qu'est-ce que le "Wald chi-square" et "adjusted Wald F"
signifient ? Je lis parfois aussi "Levene statistics" et "df". Je ne vois pas ce que ça
peut vouloir dire.

Réponse:
- Wald chi-square : à ma connaissance, le test du chi-deux de
Wald est utilisé en régression sur variables catégorielles (de la même façon que
le test du score ou le test du rapport de vraisemblance). On l’utilise pour
accepter l’hypothèse β = 0 si le calcul est supérieur au chi-deux à p degrés de
liberté.
- adjusted Wald F : si le chi-deux de Wald calculé est supérieur au chi-deux à p
degrés de liberté, alors on accepte l’hypothèse β ≠ 0.
- Levene statistics : c’est un test paramétrique de comparaison de K échantillons
indépendants par exemple selon les caractéristiques de dispersion (K : nombre
de classes de population)
- df : abréviation de degrees of freedom, c’est-à-dire nombre de degrés de
liberté. Dans un modèle de régression linéaire multiple à p variables
explicatives et n observations,
* le modèle comprend (p - 1) degrés de liberté
* les erreurs comprennent (n – p ) degrés de liberté
[img][/img]
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
 
Quelques questions sur la régression.
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» Programmes du collège en français et en latin : quelques questions
» [résolu] Français - quelques questions sur les première et BTS.
» Quelques questions sur le latin en terminale et au bac
» CAPLP LETTRES HISTOIRE QUELQUES QUESTIONS...
» Quelques questions de novice...

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
Statistiques :: Statistiques-
Sauter vers: