?> addCaslib - WeAreCAS
table

addCaslib

Descripción

La acción `addCaslib` es fundamental en SAS Viya, ya que permite definir una nueva biblioteca de Cloud Analytic Services (caslib). Una caslib es un puntero a una fuente de datos, que puede ser un directorio en un sistema de archivos, una base de datos, o un almacenamiento en la nube como S3 o ADLS. Una vez definida, la caslib actúa como un puente para que el servidor CAS pueda acceder, cargar, guardar y procesar datos desde esa fuente. Esta acción es esencialmente el primer paso para hacer que los datos externos sean accesibles para el análisis en memoria en CAS.

table.addCaslib <result=results> <status=rc> / activeOnAdd=TRUE | FALSE, createDirectory=TRUE | FALSE, dataSource={srcType="ADLS" | "BIGQUERY" | "CAS" | ... | "YELLOWBRICK", srcType-specific-parameters}, description="string", hidden=TRUE | FALSE, * name="string", path="string", permission="GROUPREAD" | "GROUPWRITE" | ... | integer, session=TRUE | FALSE, subDirectories=TRUE | FALSE, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", transient=TRUE | FALSE;
Parámetros
ParámetroDescripción
activeOnAddCuando se establece en True, la nueva caslib se convierte en la caslib activa para la sesión actual.
createDirectoryCuando se establece en True, se creará el directorio de la caslib si no existe. Solo aplicable para caslibs de tipo PATH.
dataSourceEspecifica el tipo de fuente de datos y los parámetros específicos de ese tipo. El valor de `srcType` determina qué otros parámetros son necesarios (por ejemplo, `server`, `user`, `password` para bases de datos).
descriptionProporciona una descripción textual de la caslib, útil para la gestión y la comprensión de su propósito.
hiddenCuando se establece en True, la caslib no aparecerá en las listas de caslibs por defecto, ocultándola de las interfaces de usuario.
nameEspecifica el nombre único para la caslib que se va a añadir. Es un parámetro obligatorio.
pathEspecifica la información específica de la fuente de datos. Para caslibs de tipo PATH y DNFS, esta es la ruta del sistema de archivos.
permissionEspecifica los controles de acceso del host en la caslib cuando se solicita la creación del directorio.
sessionCuando se establece en True, la caslib tiene un alcance limitado a la sesión actual. Si es False, la caslib es global y visible para otras sesiones (sujeto a controles de acceso).
subDirectoriesCuando se establece en True, las tablas y archivos en los subdirectorios de la ruta especificada son accesibles desde la caslib.
tableRedistUpPolicyEspecifica la política de redistribución de tablas por defecto para esta caslib cuando el número de nodos trabajadores aumenta.
transientCuando se establece en True, la caslib es transitoria, lo que significa que no persistirá después de reiniciar el servidor.
Preparación de datos
Preparación del Entorno

Para utilizar la acción `addCaslib`, no se requiere una tabla de datos previa, ya que su propósito es precisamente definir el acceso a las fuentes de datos. Sin embargo, es necesario tener un directorio en el servidor CAS con archivos de datos para que los ejemplos de tipo 'PATH' sean funcionales. Asegúrese de que el directorio `/path/to/your/data` exista en el controlador del servidor CAS y contenga archivos de datos (por ejemplo, CSV, SAS7BDAT).

/* No se necesita código de creación de datos para addCaslib. */
/* Asegúrese de que la ruta especificada en el parámetro 'path' exista en el servidor CAS. */

Ejemplos

Este es el ejemplo más común. Se crea una caslib llamada 'myPathCaslib' que apunta a la ruta '/path/to/my/data' en el servidor. La opción `session=false` la hace disponible para otras sesiones (global), y `subDirectories=true` permite acceder a los subdirectorios.

Código SAS® / CAS
¡Copiado!
1PROC CAS; TABLE.addCaslib / caslib='myPathCaslib' dataSource={srcType='PATH'} path='/path/to/my/data' SESSION=false subDirectories=true; RUN; QUIT;
Resultado :
Una nueva caslib global llamada 'myPathCaslib' está disponible en el servidor CAS, apuntando al directorio especificado. Los datos dentro de este directorio y sus subdirectorios ahora pueden ser cargados en memoria.

Este ejemplo muestra cómo conectar SAS Viya a una base de datos Oracle. Se especifica el tipo de fuente de datos como 'oracle' y se proporcionan los parámetros de conexión necesarios como el servidor, el nombre de usuario, la contraseña y el esquema. La opción `activeOnAdd=true` establece esta nueva caslib como la activa para la sesión actual.

Código SAS® / CAS
¡Copiado!
1PROC CAS; TABLE.addCaslib / caslib='myOracle' dataSource={srcType='oracle', server='oraclesrv', user='myuser', password='mypassword', schema='hr'} activeOnAdd=true; RUN; QUIT;
Resultado :
Se establece una conexión con la base de datos Oracle. La caslib 'myOracle' ahora puede ser utilizada para consultar y cargar tablas desde el esquema 'hr' de Oracle directamente en la memoria de CAS.

A diferencia de una caslib global, una caslib de sesión (`session=true`) solo existe durante la sesión actual y se elimina automáticamente al finalizar. Esto es útil para datos temporales o para evitar saturar la lista de caslibs globales. La opción `description` añade un texto explicativo visible en las interfaces de usuario.

Código SAS® / CAS
¡Copiado!
1PROC CAS; TABLE.addCaslib / caslib='tempData' dataSource={srcType='PATH'} path='/tmp/project_xyz' SESSION=true description='Caslib temporal para el proyecto XYZ'; RUN; QUIT;
Resultado :
Se crea una caslib temporal llamada 'tempData'. Solo es visible y utilizable dentro de la sesión CAS actual. Al finalizar la sesión, esta caslib desaparecerá.

FAQ

¿Para qué se utiliza la acción `addCaslib`?
¿Qué sucede si especifico una ruta no válida al usar `addCaslib`?
¿Cuál es la función del parámetro `dataSource` en la acción `addCaslib`?
¿Cómo afecta el parámetro `session` a una caslib?
¿Qué especifica el parámetro `name`?
¿Se pueden hacer accesibles las tablas en subdirectorios?

Escenarios asociados

Caso de uso
Creación de una Caslib Global para Análisis de Campañas de Marketing

Un equipo de marketing necesita analizar datos de clientes de múltiples campañas trimestrales. Los datos están organizados en subdirectorios por trimestre en un sistema de archi...

Caso de uso
Gestión de Caslibs de Sesión para un Proyecto de Análisis de Riesgo Crediticio

Un científico de datos está trabajando en un proyecto de prueba de concepto (PoC) para evaluar un nuevo modelo de riesgo. Necesita acceder a un conjunto de datos de entrenamient...

Caso de uso
Auditoría de Robustez: Prueba con Rutas Inválidas y Directorios Inexistentes

El equipo de administración de SAS Viya necesita verificar y documentar el comportamiento del sistema ante configuraciones erróneas. El objetivo es probar cómo reacciona la acci...