Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Próximos Pasos en Seguridad | Conceptos Fundamentales de Databricks
Fundamentos de Databricks: Guía Para Principiantes

Próximos Pasos en Seguridad

Desliza para mostrar el menú

Note
Definición

Unity Catalog es la capa unificada de gobernanza para todos los activos de datos e inteligencia artificial en Databricks. Proporciona un único lugar para gestionar permisos, rastrear el linaje de los datos y garantizar el acceso seguro a través de diferentes espacios de trabajo y entornos en la nube.

A medida que te familiarizas más con la tabla diamonds en workspace.workshop.diamonds, es necesario comprender cómo se controla el acceso a esos datos. En un entorno profesional, no es posible que cualquier usuario elimine o actualice tablas libremente.

Aquí es donde entra Unity Catalog: actúa como el "Guardia de Seguridad" de todo tu Lakehouse.

1. Control de acceso centralizado

Antes de Unity Catalog, gestionar quién podía ver cada tabla era complicado en empresas grandes. Ahora, esto se maneja en un solo lugar centralizado.

  • Privilegios: los administradores pueden otorgar permisos específicos como SELECT (solo lectura), MODIFY (puede actualizar/eliminar) o CREATE;
  • El concepto de "Propietario": cada tabla tiene un propietario (generalmente la persona que la creó) que decide quién más puede interactuar con esos datos.

2. El espacio de nombres de tres partes

Unity Catalog aplica el estándar de nomenclatura utilizado a lo largo de este curso: Catálogo > Esquema > Tabla.

  • Catálogo: contenedor de alto nivel (por ejemplo, workspace);
  • Esquema: agrupación similar a una carpeta (por ejemplo, workshop);
  • Tabla: conjunto de datos individual (por ejemplo, diamonds).

Esta estructura facilita la organización de los datos por departamento (por ejemplo, Finance.Quarterly_Reports.Revenue), manteniendo reglas de seguridad coherentes en cada nivel.

3. Linaje de datos

Una de las características más potentes de Unity Catalog es el linaje.

  • En el Catalog Explorer, es posible hacer clic en la tabla diamonds y ver un mapa visual del origen de esos datos y qué notebooks la están utilizando actualmente
  • Si se cambia el nombre de una columna en el origen, el linaje indica exactamente qué informes posteriores se verán afectados, evitando cambios "rotos" no intencionados

4. Búsqueda y descubrimiento

Unity Catalog hace que los datos sean descubribles. En lugar de preguntar a un compañero dónde se encuentra un archivo específico, se puede utilizar la barra de búsqueda en la parte superior de la interfaz de Databricks.

Como los datos están registrados en el Catálogo, es posible buscar "diamonds" y encontrar al instante la tabla, su esquema y cualquier documentación proporcionada por el propietario.

5. Registros de auditoría

La seguridad también implica responsabilidad. Unity Catalog mantiene un registro de quién accedió a qué datos y cuándo.

Esto es esencial para empresas en industrias reguladas — como finanzas o salud — para demostrar que los datos sensibles se manejan correctamente y que ningún usuario no autorizado consulta información privada.

1. ¿Cuál es el propósito principal de Unity Catalog en Databricks?

2. En el espacio de nombres de tres partes (por ejemplo, workspace.workshop.diamonds), ¿qué representa "workshop"?

question mark

¿Cuál es el propósito principal de Unity Catalog en Databricks?

Selecciona la respuesta correcta

question mark

En el espacio de nombres de tres partes (por ejemplo, workspace.workshop.diamonds), ¿qué representa "workshop"?

Selecciona la respuesta correcta

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 5

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 5. Capítulo 5
some-alt