Pyyhkäise näyttääksesi valikon

Määritelmä

Laskentaresurssin (klusterin) luominen tarkoittaa virtuaalisen laitteiston varaamista pilvessä tietotehtävien suorittamista varten. Oppimistarkoituksessa käytetään Single Node -kokoonpanoa suorituskyvyn ja kustannusten tasapainottamiseksi.

On aika käynnistää "moottori". Tässä luvussa käydään läpi tarkat vaiheet ensimmäisen klusterin luomiseksi. Tämä resurssi mahdollistaa SQL- ja Python-koodin suorittamisen, jota kirjoitat myöhemmin kurssilla. Noudata näitä ohjeita huolellisesti varmistaaksesi, että ympäristösi on asetettu oikein ja kustannustehokkaasti.

Huomio

Databricks mahdollistaa myös erikoistuneempien klusterien, kuten job compute -klusterin, luomisen, joka soveltuu paremmin työnkulkuihin. Tämän luvun tarkoituksena on kuitenkin käydä läpi perusteet, joten tutustut yleiskäyttöisen klusterin luomiseen. Kaikki tässä käsitelty pätee kuitenkin myös muiden klusterityyppien luomiseen ja hallintaan.

Vaihe 1: Siirry Compute-valikkoon

Vasemmanpuoleisessa sivupalkissa napsauta Compute-kuvaketta. Tämä vie sinut compute-yleisnäkymään. Oikeassa yläkulmassa napsauta sinistä Create Compute -painiketta.

Vaihe 2: Klusterityypin valinta

Näet kaksi päävaihtoehtoa ylhäällä: Multi Node ja Single Node.

Valitse Single Node. Miksi? Multi-node-klusterit on tarkoitettu suurelle tai erittäin suurelle, yritystason datalle. Oppimiskäyttöön Single Node -klusteri on huomattavasti edullisempi (tai jopa ilmainen joissakin versioissa) ja tarjoaa riittävästi tehoa käyttämiämme tietoaineistoja varten.

Vaihe 3: Nimeäminen ja ajonaikainen ympäristö

Nimi: anna klusterillesi selkeä nimi, kuten Student_Cluster_1;
Databricks Runtime Version: tämä pudotusvalikko määrittää "moottorin" version. Etsi uusin versio, jonka vieressä on LTS. LTS tarkoittaa "Long Term Support" eli pitkäaikaista tukea. Se on vakain versio ja useimpien yritysten käyttämä todellisissa projekteissa.

Vaihe 4: "Laitteiston" määrittäminen

Node Type -kohdassa näet luettelon pilvipalvelun virtuaalikoneista (esim. Standard_DS3_v2 Azurella tai i3.xlarge AWS:ssä).

Tällä kurssilla oletusvalinta on yleensä sopiva;
Varmista, että muistia on vähintään 15GB, jos aiot tehdä myöhemmin edistyneempää data-analytiikkaa, mutta perus SQL- ja Python-harjoituksiin pienin vaihtoehto riittää usein.

Vaihe 5: Tärkein vaihe – Automaattinen sammutus

Etsi valintaruutu, jossa lukee "Sammuta ___ minuutin käyttämättömyyden jälkeen."

Aseta tämä arvoon 20 minuuttia;
Kuten edellisessä luvussa käsiteltiin, tämä on turvaverkkosi. Jos lopetat työskentelyn ja suljet kannettavan tietokoneesi mutta unohdat sammuttaa klusterin, Databricks tunnistaa, ettei koodia suoriteta, ja sammuttaa "moottorin" automaattisesti 20 minuutin kuluttua laskutuksen pysäyttämiseksi.

Vaihe 6: Luo ja odota

Napsauta Luo Compute. Näet pyörivän täytetyn ympyrän klusterisi nimen vieressä. Pilvipalveluntarjoajalta kestää yleensä 3–5 minuuttia "lämmittää" palvelimet. Kun ympyrä muuttuu vihreäksi valintamerkiksi tai vihreäksi "Käynnissä"-tilaksi, moottorisi on valmis käyttöön!

1. Mikä on oikea tapa avata uuden laskentaresurssin (klusterin) luontivalikko Databricksissa?

2. Kun luot ensimmäistä Databricks-klusteriasi tätä kurssia varten, miksi sinun kannattaa valita yksisolmuinen klusteri monisolmuisen sijaan?

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 2. Luku 3

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Ensimmäisen Laskentaresurssin Luominen