Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Qu'est-ce qu'une distribution gaussienne ? | GMMs
Analyse de Clusters

bookQu'est-ce qu'une distribution gaussienne ?

La distribution gaussienne est définie par deux facteurs clés :

  • Moyenne : il s'agit de la valeur moyenne et elle représente le centre de la distribution. La majorité des données est concentrée autour de cette valeur ;

  • Écart type : il indique la dispersion des données. Un écart type faible signifie que les données sont fortement regroupées autour de la moyenne, tandis qu'un écart type élevé indique une plus grande dispersion.

La forme de la distribution gaussienne présente des caractéristiques importantes :

  • Elle est symétrique autour de la moyenne, ce qui signifie que les côtés gauche et droit sont des images miroir ;

  • Environ 68 % des données se situent à moins d'un écart type de la moyenne, 95 % à moins de deux, et 99,7 % à moins de trois.

Cette distribution est essentielle car elle modélise précisément les données du monde réel et constitue la base des modèles de mélange gaussien, une approche flexible pour résoudre des problèmes de regroupement complexes.

Voici le code pour créer la distribution normale pour n'importe quelles données (par exemple, [2, 5, 3, 6, 10, -5]) :

1234567891011121314151617181920
import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm # Given data data = [2, 5, 3, 6, 10, -5] # Calculate mean and standard deviation mean = np.mean(data) std = np.std(data) # Generate x values x = np.linspace(mean - 4 * std, mean + 4 * std, 1000) # Calculate the normal distribution values y = norm.pdf(x, mean, std) # Plot the normal distribution plt.plot(x, y, label=f"Normal Distribution (mean={mean:.2f}, std={std:.2f})", color='blue') # Plot the data points as green balls on the x-axis plt.scatter(data, np.zeros_like(data), color='green', label='Data Points', zorder=5) plt.grid(True) # Display the plot plt.show()
copy

1. Quelle est la caractéristique principale de la distribution gaussienne ?

2. Quel facteur détermine le centre d'une distribution gaussienne ?

question mark

Quelle est la caractéristique principale de la distribution gaussienne ?

Select the correct answer

question mark

Quel facteur détermine le centre d'une distribution gaussienne ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 6. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 2.94

bookQu'est-ce qu'une distribution gaussienne ?

Glissez pour afficher le menu

La distribution gaussienne est définie par deux facteurs clés :

  • Moyenne : il s'agit de la valeur moyenne et elle représente le centre de la distribution. La majorité des données est concentrée autour de cette valeur ;

  • Écart type : il indique la dispersion des données. Un écart type faible signifie que les données sont fortement regroupées autour de la moyenne, tandis qu'un écart type élevé indique une plus grande dispersion.

La forme de la distribution gaussienne présente des caractéristiques importantes :

  • Elle est symétrique autour de la moyenne, ce qui signifie que les côtés gauche et droit sont des images miroir ;

  • Environ 68 % des données se situent à moins d'un écart type de la moyenne, 95 % à moins de deux, et 99,7 % à moins de trois.

Cette distribution est essentielle car elle modélise précisément les données du monde réel et constitue la base des modèles de mélange gaussien, une approche flexible pour résoudre des problèmes de regroupement complexes.

Voici le code pour créer la distribution normale pour n'importe quelles données (par exemple, [2, 5, 3, 6, 10, -5]) :

1234567891011121314151617181920
import numpy as np import matplotlib.pyplot as plt from scipy.stats import norm # Given data data = [2, 5, 3, 6, 10, -5] # Calculate mean and standard deviation mean = np.mean(data) std = np.std(data) # Generate x values x = np.linspace(mean - 4 * std, mean + 4 * std, 1000) # Calculate the normal distribution values y = norm.pdf(x, mean, std) # Plot the normal distribution plt.plot(x, y, label=f"Normal Distribution (mean={mean:.2f}, std={std:.2f})", color='blue') # Plot the data points as green balls on the x-axis plt.scatter(data, np.zeros_like(data), color='green', label='Data Points', zorder=5) plt.grid(True) # Display the plot plt.show()
copy

1. Quelle est la caractéristique principale de la distribution gaussienne ?

2. Quel facteur détermine le centre d'une distribution gaussienne ?

question mark

Quelle est la caractéristique principale de la distribution gaussienne ?

Select the correct answer

question mark

Quel facteur détermine le centre d'une distribution gaussienne ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 6. Chapitre 2
some-alt