Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Écriture et Exécution de Code SQL | L'Expérience du Notebook
Fondamentaux de Databricks : Guide du Débutant

Écriture et Exécution de Code SQL

Glissez pour afficher le menu

Note
Définition

SQL (Structured Query Language) est le langage standard de l'industrie pour interagir avec les bases de données relationnelles. Dans Databricks, SQL est utilisé pour interroger les tables dans le Lakehouse, créer des visualisations et effectuer des analyses de données au sein des notebooks.

Bien que Python soit puissant pour l'ingénierie des données, SQL reste le langage le plus populaire pour l'analyse de données. Databricks considère SQL comme un langage de première classe. Même si la langue par défaut de votre notebook est définie sur Python, vous pouvez facilement passer à SQL pour effectuer des recherches rapides de données ou des jointures complexes.

Utilisation de SQL dans un notebook SQL

Si vous avez créé votre notebook avec SQL comme langue par défaut, chaque cellule que vous créez sera automatiquement une cellule SQL. Il vous suffit de saisir votre requête - telle que SELECT * FROM table_name - et de l'exécuter. Le résultat s'affiche dans un format de tableau interactif et épuré où vous pouvez trier les colonnes ou rechercher des valeurs spécifiques sans écrire de code supplémentaire.

La commande « Magic » : %sql

Si vous travaillez dans un notebook Python, il n'est pas nécessaire de créer un nouveau fichier uniquement pour exécuter une requête SQL. Databricks utilise des « Magic Commands » pour changer de langage à la volée. En tapant %sql au tout début d'une cellule, vous indiquez au cluster d'ignorer Python et d'exécuter cette cellule comme du code SQL.

%sql
SELECT "Hello from the SQL engine" AS message

Interrogation des données d'exemple

Dans la section 2, nous avons téléchargé un fichier appelé diamonds. Nous pouvons maintenant l'interroger directement. Dans une cellule SQL, essayez le code suivant :

SELECT 
  carat, 
  cut, 
  price 
FROM 
  workspace.default.diamonds
LIMIT 10

Remarquez la convention de nommage : catalog.schema.table. Ce nom en trois parties garantit que vous récupérez les bonnes données à partir du catalogue que nous avons exploré précédemment.

Résultats interactifs et visualisations

Lorsqu'une cellule SQL a terminé son exécution, Databricks fournit un ensemble de résultats interactif. Sous le tableau de résultats, une icône « + » suivie de « Visualisation » apparaît. Cela permet de transformer instantanément les résultats SQL en graphiques à barres, courbes ou camemberts. Contrairement aux environnements SQL traditionnels où il est souvent nécessaire d’exporter les données vers Excel pour visualiser un graphique, Databricks permet de réaliser l’analyse et la visualisation au même endroit.

Mise en forme SQL pour une meilleure lisibilité

Le SQL peut devenir difficile à lire à mesure que les requêtes gagnent en complexité. Databricks propose un formateur SQL intégré. Celui-ci est accessible dans la barre d’outils de la cellule (souvent représentée par une petite icône de « baguette magique » ou dans le menu « Édition »). Un simple clic permet d’indenter automatiquement les mots-clés et d’aligner les colonnes, facilitant ainsi la relecture du code par vos collègues dans l’Espace de travail.

1. Si vous êtes dans un notebook Python et souhaitez écrire une requête SQL dans une seule cellule, quelle « Magic Command » devez-vous saisir en haut ?

2. Quelle est la manière correcte de référencer une table dans Databricks en utilisant la convention de nommage en trois parties ?

question mark

Si vous êtes dans un notebook Python et souhaitez écrire une requête SQL dans une seule cellule, quelle « Magic Command » devez-vous saisir en haut ?

Sélectionnez la réponse correcte

question mark

Quelle est la manière correcte de référencer une table dans Databricks en utilisant la convention de nommage en trois parties ?

Sélectionnez la réponse correcte

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 3

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 3. Chapitre 3
some-alt