Kursinhalt
Einführung in die Datenverarbeitung mit Azure
Einführung in die Datenverarbeitung mit Azure
1. Erste Schritte mit Azure und Kernwerkzeugen
Abgeleitete Spaltenumwandlung
Abgeleitete Spalten ermöglichen es Ihnen, Ihre Daten durch das Erstellen neuer Felder oder das Ändern bestehender Felder basierend auf Geschäftslogik zu verbessern. Diese Funktionalität ist entscheidend, um Ihren Datensatz zu bereichern und besser für nachgelagerte Prozesse wie Analysen, Berichterstellung oder maschinelles Lernen zu nutzen.
Zum Beispiel könnten Sie ein FullName
-Feld erstellen, indem Sie Vor- und Nachnamen verketten, oder einen DiscountedPrice
basierend auf einem bestehenden Price
-Feld und einem Rabattprozentsatz ableiten.
So erstellen Sie abgeleitete Spalten in ADF
- Fügen Sie einen neuen Datenfluss im Autor-Bereich von Azure Data Factory Studio hinzu;
- Ziehen Sie eine Derived Column Transformation aus der Toolbox auf die Datenfluss-Leinwand und verbinden Sie sie mit Ihrer Datenquelle;
- Definieren Sie in den Derived Column Transformation-Einstellungen den Spaltennamen für das neue oder geänderte Feld, wie zum Beispiel
DeathRate
; - Schreiben Sie einen Ausdruck unter Verwendung der Ausdruckssprache von ADF. Zum Beispiel, um eine Sterberate zu berechnen:
iif(TotalDeaths > 0, (Covid19Deaths * 100.0) / TotalDeaths, 0.0)
; - Validieren Sie die Konfiguration, indem Sie die Datenvorschau anzeigen, um sicherzustellen, dass die abgeleitete Spalte korrekt berechnet wird;
- Verbinden Sie die transformierten Daten mit einer Sink Transformation, um sie an ein Ziel, wie eine SQL-Tabelle oder Blob Storage, zur weiteren Verarbeitung zu senden.
War alles klar?
Danke für Ihr Feedback!
Abschnitt 3. Kapitel 2