Contenu du cours
Introduction à l'Ingénierie des Données avec Azure
Introduction à l'Ingénierie des Données avec Azure
Défi : Réaliser une Analyse des Transactions
Les institutions financières évaluent fréquemment la solvabilité de leurs clients pour améliorer la gestion des risques et prendre des décisions mieux informées. En analysant les niveaux d'endettement et le comportement financier à travers les transactions des utilisateurs, les institutions peuvent catégoriser les clients en groupes de risque.
Par exemple, les individus avec un ratio dette-revenu élevé, indiquant qu'ils doivent significativement plus qu'ils ne gagnent, pourraient être signalés comme Utilisateurs à Risque en raison de leur potentielle instabilité financière. En revanche, ceux avec un équilibre plus sain entre leurs revenus et leurs dettes sont classés comme Utilisateurs Normaux, reflétant une probabilité plus faible de risque financier.
Dans le défi précédent, nous avons chargé les données des cartes, et maintenant l'objectif est de classer les utilisateurs de cartes de crédit comme Utilisateurs à Risque ou Utilisateurs Normaux en fonction de leur ratio dette-revenu personnalisé.
Pour accomplir cette tâche, vous aurez besoin de données supplémentaires :
- Données des transactions pour calculer des indicateurs clés tels que le montant moyen des transactions, la somme de toutes les transactions, et le taux d'utilisation des puces (le ratio des transactions effectuées avec des puces par rapport au nombre total de transactions);
- Données des utilisateurs pour calculer le ratio dette-revenu personnalisé, qui est déterminé en divisant la dette totale par le revenu annuel.
En utilisant ces ensembles de données, vous pouvez évaluer le comportement financier des utilisateurs et les classer dans la catégorie de risque appropriée.
Tableau des Utilisateurs
Tableau des Transactions
À la fin de cette tâche, vous aurez deux tableaux - un pour les utilisateurs à risque et un pour les utilisateurs normaux. Ils ressembleront à ceci.
Utilisateurs à Risque
Utilisateurs Normaux
Description de l'algorithme
Pour résoudre cette tâche, vous pouvez utiliser les matériaux de la troisième section. Voici un guide étape par étape sur la façon de réaliser la tâche :
- Tout d'abord, chargez les données brutes dans la base de données. Cela implique de lire les fichiers CSV pour les utilisateurs, les transactions et les cartes et de remplir les tables respectives. Pour ce faire, vous devez utiliser les activités Script et Copy comme dans le défi précédent ;
- Après le chargement, assurez-vous que les types de données corrects sont appliqués en utilisant une autre activité Script ;
- Filtrez la table des utilisateurs pour inclure uniquement les utilisateurs avec des cartes de crédit. Cela peut être fait en joignant les tables utilisateurs et cartes sur
client_id
. Vous devez utiliser cette table cartes qui stocke uniquement les données des cartes de crédit (vous avez créé cette table dans le défi précédent) ; - Calculez le Ratio de Crédit pour les utilisateurs filtrés en divisant
total_debt
paryearly_income
. En fonction de ce ratio :- Classifiez les utilisateurs avec un ratio > 50% comme Utilisateurs à Risque ;
- Classifiez les utilisateurs avec un ratio ≤ 50% comme Utilisateurs Normaux ;
- Agrégez les données de transactions pour chaque groupe d'utilisateurs (Utilisateurs à Risque et Utilisateurs Normaux) pour calculer les métriques suivantes :
- Montant Total des Transactions : Somme de toutes les transactions ;
- Montant Moyen des Transactions ;
- Ratio d'Utilisation de Puce : Proportion des transactions par puce par rapport au total des transactions ;
- Créez des tables séparées pour les Utilisateurs à Risque et les Utilisateurs Normaux dans la base de données et remplissez-les avec les métriques agrégées, en vous assurant que tous les champs requis (par exemple,
client_id
, métriques) sont inclus.
En suivant ces étapes, vous pouvez traiter efficacement les données et créer les sorties requises en utilisant uniquement des activités de flux de données. Bonne chance !
Merci pour vos commentaires !