Medical Cost Prediction
Interface web • API FastAPI
Modèle ML déployé • API publique

Prévision des coûts médicaux
simple, rapide, propre

Saisis les caractéristiques d'un ou plusieurs individus, ou importe un fichier CSV. Le site appelle l'API et affiche les prédictions en temps réel.

Endpoint
Statut API
Non vérifié
Aller au formulaire
Résumé
Ce que fait le système
  1. 1 Tu remplis les variables ou importes un CSV.
  2. 2 Le site valide et envoie les données à POST /predict.
  3. 3 L'API renvoie predicted_cost pour chaque entrée.
Prétraitement
Inclus dans le Pipeline
Modèle
Gradient Boosting
Sortie
Coût prédit (USD)
Déploiement
Render + FastAPI

Faire une prédiction

Choisis ton mode de prédiction : simple, multiple ou par fichier CSV.

Entrées
Choisis le mode de prédiction
POST /predict
L'URL de l'API est fixée pour garantir la sécurité.
La clé de l'API est "mon-secret".
📁
Clique ou glisse un fichier ici
Formats acceptés: CSV, Excel (.xlsx), JSON
💡 Exemples de formats acceptés :
📄 CSV
age,sex,bmi,children,smoker,region
45,female,27.3,2,no,northwest
32,male,28.5,0,yes,southeast
📊 JSON
[
  {"age": 45, "sex": "female", "bmi": 27.3, ...},
  {"age": 32, "sex": "male", "bmi": 28.5, ...}
]
Résultat
Sortie renvoyée par l'API
predicted_cost
Coût médical estimé
Lance une prédiction pour afficher le montant.
Payload envoyé
{}
Réponse API
{}
⚠️ Avertissement : une prédiction ML est une estimation basée sur des données historiques. Elle ne remplace pas une analyse médicale ou financière réelle.

À propos du modèle

Type de problème

Régression supervisée : prédire un coût continu à partir de caractéristiques individuelles.

Pipeline scikit-learn

Le modèle est sauvegardé en joblib sous forme de Pipeline : le prétraitement (encodage, etc.) est inclus et réutilisé à l'identique.

Modèle utilisé

Gradient Boosting pour estimer les coûts médicaux annuels. Sortie API : predicted_cost.

Détails méthodologiques

Cette application s’appuie sur un modèle de machine learning de type Gradient Boosting conçu pour prédire les coûts médicaux annuels à partir de caractéristiques individuelles telles que l’âge, l’IMC, le tabagisme, la région et la situation familiale.

Pour améliorer la stabilité des prédictions et limiter l’influence des valeurs extrêmes, le modèle a été entraîné sur une transformation logarithmique des coûts. Les résultats sont ensuite automatiquement reconvertis à l’échelle originale.

Une variable dérivée, is_obese, est calculée à partir de l’IMC afin de mieux capturer l’impact de l’obésité sur les dépenses de santé.

Limites & bonnes pratiques
  • Les prédictions dépendent des données d'entraînement et peuvent être biaisées.
  • La généralisation hors distribution (profils rares) peut être faible.
  • Vérifie la validité des entrées avant d'envoyer à l'API.
  • Utilise les métriques d'évaluation pour juger de la performance du modèle.