Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Ausreißererkennung Mit Der 3-Sigma-Regel | Zusätzliche Aussagen Aus Der Wahrscheinlichkeitstheorie
Fortgeschrittene Wahrscheinlichkeitstheorie

book
Herausforderung: Ausreißererkennung Mit Der 3-Sigma-Regel

Aufgabe

Swipe to start coding

Im vorherigen Kapitel haben wir erwähnt, dass wir Ausreißer für normalverteilte Zufallsvariablen mit der 3-Sigma-Regel finden können. Im Allgemeinen betrachten wir alle Werte außerhalb des 3-Sigma-Bereichs als Ausreißer.
Ihre Aufgabe ist es, Ausreißer in einem bestimmten Datensatz zu finden. Sie müssen annehmen, dass die gegebenen Stichproben eine Gauß-Verteilung mit einem Mittelwert von 0 und einer Standardabweichung von 4 haben. Ihre Aufgabe ist es:

  1. Geben Sie mean gleich 0 an.
  2. Geben Sie std gleich 4 an.
  3. Geben Sie Kriterien für die Ausreißererkennung gemäß der 3-Sigma-Regel an.

Hinweis

Wir müssen zugeben, dass wir bei realen Aufgaben nicht unbegründet sagen können, dass die Daten eine Gauß-Verteilung und einen bestimmten Mittelwert und eine Standardabweichung haben. Dafür werden verschiedene statistische Tests durchgeführt. Dies wird in den nächsten Kapiteln ausführlicher besprochen.

Sobald Sie diese Aufgabe abgeschlossen haben, klicken Sie auf die Schaltfläche unter dem Code, um Ihre Lösung zu überprüfen.

Lösung

import pandas as pd
import matplotlib.pyplot as plt

samples = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/Advanced+Probability+course+media/gaussian_samples.csv', names = ['Value'])

mean = 0
std = 4
# Identify outliers using 3-sigma rule
outliers = samples[(samples['Value'] > mean + 3*std) | (samples['Value'] < mean - 3*std)]
print('Outliers are: \n', outliers)

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 7
single

single

import pandas as pd
import matplotlib.pyplot as plt
# Load data
samples = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/Advanced+Probability+course+media/gaussian_samples.csv', names = ['Value'])
# Specify mean and std
mean = ___
std = ___
# Identify outliers using 3-sigma rule
outliers = samples[(samples['Value'] > mean + 3*___) | (samples['Value'] < ___ - 3*std)]
# Print outliers
print('Outliers are: \n', outliers)

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

some-alt