Prévision des coûts médicaux
simple, rapide, propre
Saisis les caractéristiques d'un ou plusieurs individus, ou importe un fichier CSV. Le site appelle l'API et affiche les prédictions en temps réel.
- 1 Tu remplis les variables ou importes un CSV.
- 2 Le site valide et envoie les données à POST /predict.
- 3 L'API renvoie predicted_cost pour chaque entrée.
Faire une prédiction
Choisis ton mode de prédiction : simple, multiple ou par fichier CSV.
📄 CSV
age,sex,bmi,children,smoker,region 45,female,27.3,2,no,northwest 32,male,28.5,0,yes,southeast
📊 JSON
[
{"age": 45, "sex": "female", "bmi": 27.3, ...},
{"age": 32, "sex": "male", "bmi": 28.5, ...}
]
{}
{}
À propos du modèle
Régression supervisée : prédire un coût continu à partir de caractéristiques individuelles.
Le modèle est sauvegardé en joblib sous forme de Pipeline : le prétraitement (encodage, etc.) est inclus et réutilisé à l'identique.
Gradient Boosting pour estimer les coûts médicaux annuels. Sortie API : predicted_cost.
Cette application s’appuie sur un modèle de machine learning de type Gradient Boosting conçu pour prédire les coûts médicaux annuels à partir de caractéristiques individuelles telles que l’âge, l’IMC, le tabagisme, la région et la situation familiale.
Pour améliorer la stabilité des prédictions et limiter l’influence des valeurs extrêmes, le modèle a été entraîné sur une transformation logarithmique des coûts. Les résultats sont ensuite automatiquement reconvertis à l’échelle originale.
Une variable dérivée, is_obese, est calculée à partir de l’IMC afin de mieux capturer l’impact de l’obésité sur les dépenses de santé.
- Les prédictions dépendent des données d'entraînement et peuvent être biaisées.
- La généralisation hors distribution (profils rares) peut être faible.
- Vérifie la validité des entrées avant d'envoyer à l'API.
- Utilise les métriques d'évaluation pour juger de la performance du modèle.