Summary  
This chapter covers kernel density estimation for visualizing continuous data distributions and shows how to customize overlapping category densities by stacking and filling curves in Seaborn.

General domain of usage  
Exploratory data analysis

En `kdeplot` (kerne-tæthedsestimering) er en metode til at visualisere fordelingen af observationer i et datasæt. Det svarer til et histogram, men i stedet for at bruge diskrete intervaller, repræsenterer KDE dataene ved hjælp af en kontinuerlig sandsynlighedstæthedskurve.

Dette gør det fremragende til at se "formen" af data og identificere toppe uden den ujævnhed, der ses i et histogram.

## Visualisering af overlappende fordelinger

Når der er flere kategorier (ved brug af `hue`), kan simple linjer være svære at skelne. Seaborn tilbyder parametre til at løse dette:

* **Stabling (`multiple='stack'`):** i stedet for at tegne linjer oven på hinanden, stables de. Det viser, hvordan forskellige kategorier bidrager til den samlede fordeling;
* **Udfyldning (`fill=True`):** udfylder området under kurven med farve, hvilket gør hver kategoris visuelle vægt mere tydelig.

**Eksempel:**


import seaborn as sns
import matplotlib.pyplot as plt

# Load built-in dataset
df = sns.load_dataset('penguins')

# Create the stacked KDE plot
sns.kdeplot(
    data=df,
    x='flipper_length_mm',
    hue='species',
    multiple='stack', # Stack categories vertically
    fill=True         # Fill area with color
)

plt.show()

import unittest
import importlib
import sys
from unittest.mock import patch, MagicMock

# Helper function to dynamically generate test names and assertions
def _dynamic_test(test_case, condition, success_message, failure_message):
    if condition:
        test_case._testMethodName = success_message
        test_case.assertTrue(True, success_message)
    else:
        test_case._testMethodName = failure_message
        test_case.fail(failure_message)

class TestUserCode(unittest.TestCase):

    def setUp(self):
        # Mock pandas read_csv
        self.patcher_csv = patch('pandas.read_csv')
        self.mock_read_csv = self.patcher_csv.start()
        self.mock_df = MagicMock()
        self.mock_read_csv.return_value = self.mock_df

    def tearDown(self):
        self.patcher_csv.stop()

    # Test imports
    def test_imports(self):
        import user_code
        _dynamic_test(
            self,
            hasattr(user_code, 'sns') and hasattr(user_code, 'plt'),
            "Libraries `seaborn` and `matplotlib.pyplot` are imported.",
            "Expected `seaborn` to be imported as `sns` and `matplotlib` as `plt`."
        )

    # Test if kdeplot is used
    def test_kdeplot_called(self):
        with patch('seaborn.kdeplot') as mock_kdeplot:
            with patch('matplotlib.pyplot.show'):
                if 'user_code' in sys.modules:
                    importlib.reload(sys.modules['user_code'])
                else:
                    import user_code
            
            _dynamic_test(
                self,
                mock_kdeplot.called,
                "The `sns.kdeplot()` function is used.",
                "Expected `sns.kdeplot()` to be used."
            )

    # Test data and basic axis
    def test_data_and_axes(self):
        with patch('seaborn.kdeplot') as mock_kdeplot:
            with patch('matplotlib.pyplot.show'):
                if 'user_code' in sys.modules:
                    importlib.reload(sys.modules['user_code'])
                else:
                    import user_code
            
            if not mock_kdeplot.called:
                _dynamic_test(self, False, "", "Expected `sns.kdeplot()` to be used.")
                return

            args, kwargs = mock_kdeplot.call_args
            
            data_correct = kwargs.get('data') == user_code.df
            x_correct = kwargs.get('x') == 'max_temp'
            hue_correct = kwargs.get('hue') == 'month'

            _dynamic_test(
                self,
                data_correct and x_correct and hue_correct,
                "The `x`, `hue`, and `data` parameters are set correctly.",
                "Expected `x='max_temp'`, `hue='month'`, and `data=df`."
            )

    # Test specific visualization parameters (multiple, fill, legend)
    def test_viz_params(self):
        with patch('seaborn.kdeplot') as mock_kdeplot:
            with patch('matplotlib.pyplot.show'):
                if 'user_code' in sys.modules:
                    importlib.reload(sys.modules['user_code'])
                else:
                    import user_code
            
            if not mock_kdeplot.called:
                return

            args, kwargs = mock_kdeplot.call_args
            
            # Check for multiple='stack'
            stack_check = kwargs.get('multiple') == 'stack'
            # Check for fill=True
            fill_check = kwargs.get('fill') is True
            # Check for legend=False
            legend_check = kwargs.get('legend') is False

            _dynamic_test(
                self,
                stack_check and fill_check and legend_check,
                "The plot uses `stack`, `fill=True`, and `legend=False`.",
                f"Expected `multiple='stack'`, `fill=True`, `legend=False`. Got: {kwargs}"
            )

    # Test if plt.show() is used
    def test_show_used(self):
        with patch('seaborn.kdeplot'):
            with patch('matplotlib.pyplot.show') as mock_show:
                if 'user_code' in sys.modules:
                    importlib.reload(sys.modules['user_code'])
                else:
                    import user_code

                _dynamic_test(
                    self,
                    mock_show.called,
                    "The `plt.show()` function is used.",
                    "Expected `plt.show()` to be used to display the plot."
                )

if __name__ == '__main__':
    unittest.main()

test_code.py

Udforsk styrken ved statistisk datavisualisering designet til at afsløre mønstre og sammenhænge. Brug Seaborn til at skabe informative fordelingsdiagrammer, varmekort og kategoriske diagrammer med minimal kode. Lær at anvende æstetiske temaer og farvepaletter, der gør kompleks statistisk data tilgængelig og let at fortolke.

Estimering af Tæthed med KDE

Visualisering af overlappende fordelinger

Estimering af Tæthed med KDE

Visualisering af overlappende fordelinger

Løsning