Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Qu'est-ce que la Régression Logistique | Régression Logistique
Classification avec Python

bookQu'est-ce que la Régression Logistique

La régression logistique est en réalité un algorithme de classification, malgré le mot « Régression » dans son nom.

Elle tire son nom du fait qu'elle est basée sur la régression linéaire, mais utilise une fonction logistique (sigmoïde) pour convertir la sortie en probabilités, ce qui permet de classer les données en catégories au lieu de prédire des valeurs continues.

Supposons que l'on souhaite prédire si une personne fera défaut sur un premier prêt (aucun historique de crédit disponible).

En régression linéaire, on construit une équation pour prédire des valeurs numériques. On peut utiliser la même équation pour calculer un « score de fiabilité ». Celui-ci prendra en compte des caractéristiques telles que le revenu, la durée de l'emploi actuel, le ratio dette/revenu, etc. Un score de fiabilité plus élevé indique une probabilité plus faible de défaut.

Les valeurs β\beta sont les paramètres que le modèle doit apprendre. Pendant l'entraînement, l'ordinateur ajuste ces valeurs afin d'améliorer les prédictions. Il le fait en cherchant à minimiser la différence entre les résultats prédits et les étiquettes réelles – cette différence est mesurée par ce que l'on appelle la fonction de perte.

Pour transformer la sortie brute du modèle en une étiquette de classe (0 ou 1), la régression logistique utilise une fonction sigmoïde. Cette fonction prend n'importe quel nombre réel et le ramène dans un intervalle entre 0 et 1, ce qui permet de l'interpréter comme une probabilité.

La fonction sigmoïde est définie comme suit :

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Ici, zz est le score (également appelé logit) que nous avons calculé précédemment.

Étant donné deux classes : 1 (une personne fera défaut sur un premier prêt) et 0 (une personne ne fera pas défaut sur un premier prêt), après application de la sigmoïde, on obtient la probabilité que l'instance appartienne à la classe 1.

Pour prendre une décision finale (0 ou 1), on compare la probabilité à un seuil – généralement 0,5 :

  • Si la probabilité est supérieure à 0,5, on prédit 1 ;
  • Si elle est inférieure ou égale à 0,5, on prédit 0.
question mark

Sélectionnez toutes les affirmations correctes.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 1

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4.17

bookQu'est-ce que la Régression Logistique

Glissez pour afficher le menu

La régression logistique est en réalité un algorithme de classification, malgré le mot « Régression » dans son nom.

Elle tire son nom du fait qu'elle est basée sur la régression linéaire, mais utilise une fonction logistique (sigmoïde) pour convertir la sortie en probabilités, ce qui permet de classer les données en catégories au lieu de prédire des valeurs continues.

Supposons que l'on souhaite prédire si une personne fera défaut sur un premier prêt (aucun historique de crédit disponible).

En régression linéaire, on construit une équation pour prédire des valeurs numériques. On peut utiliser la même équation pour calculer un « score de fiabilité ». Celui-ci prendra en compte des caractéristiques telles que le revenu, la durée de l'emploi actuel, le ratio dette/revenu, etc. Un score de fiabilité plus élevé indique une probabilité plus faible de défaut.

Les valeurs β\beta sont les paramètres que le modèle doit apprendre. Pendant l'entraînement, l'ordinateur ajuste ces valeurs afin d'améliorer les prédictions. Il le fait en cherchant à minimiser la différence entre les résultats prédits et les étiquettes réelles – cette différence est mesurée par ce que l'on appelle la fonction de perte.

Pour transformer la sortie brute du modèle en une étiquette de classe (0 ou 1), la régression logistique utilise une fonction sigmoïde. Cette fonction prend n'importe quel nombre réel et le ramène dans un intervalle entre 0 et 1, ce qui permet de l'interpréter comme une probabilité.

La fonction sigmoïde est définie comme suit :

σ(z)=11+ez\sigma(z) = \frac{1}{1 + e^{-z}}

Ici, zz est le score (également appelé logit) que nous avons calculé précédemment.

Étant donné deux classes : 1 (une personne fera défaut sur un premier prêt) et 0 (une personne ne fera pas défaut sur un premier prêt), après application de la sigmoïde, on obtient la probabilité que l'instance appartienne à la classe 1.

Pour prendre une décision finale (0 ou 1), on compare la probabilité à un seuil – généralement 0,5 :

  • Si la probabilité est supérieure à 0,5, on prédit 1 ;
  • Si elle est inférieure ou égale à 0,5, on prédit 0.
question mark

Sélectionnez toutes les affirmations correctes.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 1
some-alt