Statistiques

tout sur les statistiques
 
AccueilAccueil  FAQFAQ  RechercherRechercher  S'enregistrerS'enregistrer  MembresMembres  GroupesGroupes  Connexion  

Partagez | 
 

 dépendance entre variables

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
Mushaboom



Nombre de messages : 3
Date d'inscription : 17/08/2010

MessageSujet: dépendance entre variables   Mar 17 Aoû - 21:44

Bonjour,

J'essaie de voir s'il existe une dépendance entre plusieurs variables dans le cadre d'un projet sur de la dispersion atmosphérique.

Je dispose de milliers de mesures toutes les heures de vitesse de vent, directions de vent associées, température, pression et surtout concentration d'un polluant au point de mesure.

Et je ne sais pas quelle méthode utiliser pour voir si la concentration de mon polluant à l'endroit de mesure dépend majoritairement d'un paramètre ou d'une combinaison de ces paramètres, et donc de voir la dépendance entre eux et la concentration du polluant. Je suis assez novice en statistiques, donc si vous pouviez m'aiguiller, ce serait sympa.

Merci

Mickaël
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
granchef



Nombre de messages : 45
Date d'inscription : 01/04/2008

MessageSujet: Re: dépendance entre variables   Ven 20 Aoû - 12:03

Bonjour,

Le sujet qui est votre devrait être traité par un statisticien...

*
Vous souhaitez expliquer la concentration en polluant en fonction de critères pour chacun de vos points de mesure. Donc vous établissez (initialement) autant de modèles qu'il y a de points de mesure. C'est bien ça? (Très important car la qualité de la réponse est liée à la qualité de la question)
Vous voulez dire:
A paris, la concentration en polluant s'explique par ...
A Londres, c'est différent, on l'explique ...

Après peu être que l'explication sera toujours la même...


*
Le grain de vos observation est l'heure. Toutes les heures, votre sonde récupère les infos.
Mais sur un mois? Sur deux mois? sur 1 an?

*
Il semblerait que vous soyez confronté à un problème de série temporelle (ou chronologique).

Les critères vitesse de vent, directions de vent, température et pression sont-ils indépendants?
J'en doute...
Il en découle que vous expliquez une variable (la concentration du polluant) à partir de variables corrélées entre-elles, les modèles de régressions classiques ne répondent pas à cette problématique;

Je ne suis pas certain de bien vous guider, il me faudrait voir et comprendre le jeu de données dont vous disposez... En tout cas, aux vues de ce que j'ai compris, c'est un modèle de série temporelle que vous devez établir.
Concentration= 0.56 critère1 + 0.68 critère2 * critère3 + 12 par exemple...

Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Mushaboom



Nombre de messages : 3
Date d'inscription : 17/08/2010

MessageSujet: Re: dépendance entre variables   Ven 20 Aoû - 14:32

Bonjour,

Tout d'abord, merci pour cette première réponse.

*Cas n°1 *
En fait, je dispose d'une sonde, postée à un endroit précis (au milieu de sites industriels). Le but est de voir si un site industriel a une importance prépondérante par rapport aux autres (en fonction de la direction du vent et de la position de ce dernier par rapport à la station de mesure), ou si il n'y a pas de lien entre ces sites, le vent, sa direction et la concentration mesurée (qui peut très bien être naturelle).

Les mesures pour cette station sont effectuées toutes les heures, et ce, sur une période d'un an. Je dispose des données sur 4 ans. Les critères pression, température, vitesse de vent et directions de vent ne sont effectivement sans doute pas indépendants.

*Cas n°2*
Je dispose également de mesures de 15 sondes (dont la localisation est connue) autour de ces sites, mais avec un jeu de données limité : mesures de concentrations tous les mois, sur 3 ans. Je pourrais la aussi étudier les données en corrélation avec la rose des vents (vitesses des vents et direction, puisque j'en dispose)et la position des sites industriels, mais je ne sais pas non plus comment m'y prendre.

Ces précisions changent-elles votre vision du cas n°1 ? Je vais tenter de trouver des cours & exemples sur les séries temporelles.
Auriez-vous des pistes pour le 2ème ?

Par avance, merci

PS : Je travaille sous Excel.
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
granchef



Nombre de messages : 45
Date d'inscription : 01/04/2008

MessageSujet: Re: dépendance entre variables   Ven 20 Aoû - 15:38

Bon l'avantage c'est le grand nombre d'observations à une périodicité extra fine;
Et... l'inconvénient... c'est Excel lol!

Tu ne feras pas de séries temporelles avec Excel... Le problème n'est pas insurmontable:

*
On a donc un tableau de ce genre:

Num_jour Heure Concentration Pression °C vitesse_vent Direction_vent

1 1 1.1 20 4 10 45° est
1 2 1.2 19 6 12 40° est
1 3 0.9 21 8 10
1 4 1.4
...
1 23 1.3
1 24 1
...
2 1 1.5
2 2 2
2 3 1.5
2 4 1.1
...
1400
...

Le but du jeu, ce serait:

Concentration= 0.4 + 0.005*pression * vitesse_vent+ 0.001*température + 0.6*vent[est]t+ epsilon

Et dire que le vent d'est influence positivement la concentration c'est dire que quelque chose qui vient de l'est (entreprise indus, particules exogènes...) est plus nocif que les choses qui viennent d'ailleurs.

Mais ça, c'est impossible vu tes connaissances et les outils donc tu disposes.

Tu dois privilégier un raisonnement à la fois ciblé et intuitif au moyen de graphiques en deux dimensions:

Comment ma concentration se comporte-t-elle aux vues de:

a) critère temporel:
moyenne par heure, par jour, par saison, par année...
b) critère pression: croisement pression et concentration sur graphique
c) critère température
d) et critère vent.
...
Tu n'auras pas les interactions entre les critères mais tu devrais trouver des choses.
Choses qui conforteront ou pas, choses qui t'interrogeront, choses qu'il faudra creuser.
Ex:
Tiens, le matin la concentration est plus forte.
Quand le vent est à l'est, sensible augmentation aussi.
Mais dans ma base, le critère matin et vent est sont ils souvent associés?

Le truc c'est de s'adapter à tes données: si avec tous ces critères croisés, ta concentration varie seulement de 0.000001 alors aucun des critères ne joue dans la concentration et vice versa.
Je répète plus clairement ( ou pas loool!) :
* mesure la corrélation entre tes critères (si deux critères sont très corrélées, choisis en un seul (ex : heure de la journée et température)
* croise chacun de tes critère avec la concentration
* étudie les résultats, pose toi des questions puis surement:
* croise deux critères avec ta concentration.
* continue...

Tu vois il n'y a pas forcément de connaissances théoriques à avoir, il faut juste du recul. Va toujours du général et plus visible au plus prévis et pointilleux.

C'est ce que je ferai dans ton cas, maintenant je ne suis que moi et il y a peut être (surement) d'autres solutions lol!

*
Le deuxième cas, pourrait servir de comparaison des concentrations mensuelles en,tre des différents site.
En fonction des résultats que tu obtiens au cas 1 , tu pourras regarder s'ils sont applicables aux autres sites ou pas...

Bon j'espère être dans le juste ou au moins t'aider à élargir les possibilités envisageable avec un jeu de données en or comme tu en disposes Smile



Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Mushaboom



Nombre de messages : 3
Date d'inscription : 17/08/2010

MessageSujet: Re: dépendance entre variables   Ven 20 Aoû - 16:11

Merci beaucoup !


En fait, j'avais déjà produit bon nombre de graphiques 2D et autres histogrammes pour dégager des pistes, puis trié les données dans tous les sens pour voir si des critères vitesses de vent / directions etc. se dégageaient plus que d'autres. Mais tu m'as quand même rouvert quelques pistes, c'est cool.

Un peu déçu quand même de pas faire de vraies corrélations mais bon Smile

Bon week end !
Revenir en haut Aller en bas
Voir le profil de l'utilisateur
Contenu sponsorisé




MessageSujet: Re: dépendance entre variables   Aujourd'hui à 21:25

Revenir en haut Aller en bas
 
dépendance entre variables
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» [Aide] Corrélation entre variables de différents types...
» ACP lien entre variables
» ACM
» Etablir "equation de corrélation" entre variables numériques
» ACP et corrélation entre variables

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
Statistiques :: Statistiques-
Sauter vers: