Bonjour,
Je réalise une régression linéaire multiple sur une population totale de 1000 individus me permettant d'estimer le prix d'un produit.
J'aimerais savoir quel est l'impact sur la prévision en réduisant l'échantillon à 500 individus tirés aléatoirement ?
Autrement dit, dans quel intervalle (à 95% par exemple) autour de mon estimation sur 1000 individus se trouvera mon estimation sur 500 individus tirés aléatoirement.
Parle t-on d'intervalle de confiance, de tolérance, de prévision ou de prédiction ? Je ne comprends pas tellement la différence et les possibilités d'application.
Merci d'avance pour votre aide.