Bonjour Poupou2,
1. Il me semblait que la proc PHREG était utile pour des modèles de Cox...et pas pour de la régression logistique...
2. L'échantillon est vraiment de petite taille. De plus, il est déséquilibré. Si je comprends bien, tu dois avoir uniquement 4 individus qui appartiennent au groupe "positif". Dans ce cas, tu peux utiliser ce que tu veux, tu n'arriveras jamais à une modélisation correcte (sauf gros coup de chance).
En effet, tu cumules les 2 problèmes majeures de l'apprentissage (données déséquilibrées et échantillon de faible taille). De plus, le nombre de variables que tu as doit être non négligeable. généralement, on estime qu'il faut environ 10x plus d'individus que d'attributs (cf. Vapnik..) pour avoir des estimations stables.
En général, dans les échantillons de petite taille, on utilise des stumps pour avoir des prédictions correctes. Or 2 problèmes avec cette méthodologie:
- on perd toute notion d'interprétabilité du modèle
- en cas de données déséquilibrées, les stumps sont aussi sensibles que les autres algorithmes d'apprentissage.
je ne sais pas quoi te dire d'autre. Il faudrait que tu augmentes la taille de ton échantillon, c'est le seul moyen qui me semble efficace...
Bon courage.
Enzo