?>
La acción `addCaslib` es fundamental en SAS Viya, ya que permite definir una nueva biblioteca de Cloud Analytic Services (caslib). Una caslib es un puntero a una fuente de datos, que puede ser un directorio en un sistema de archivos, una base de datos, o un almacenamiento en la nube como S3 o ADLS. Una vez definida, la caslib actúa como un puente para que el servidor CAS pueda acceder, cargar, guardar y procesar datos desde esa fuente. Esta acción es esencialmente el primer paso para hacer que los datos externos sean accesibles para el análisis en memoria en CAS.
| Parámetro | Descripción |
|---|---|
| activeOnAdd | Cuando se establece en True, la nueva caslib se convierte en la caslib activa para la sesión actual. |
| createDirectory | Cuando se establece en True, se creará el directorio de la caslib si no existe. Solo aplicable para caslibs de tipo PATH. |
| dataSource | Especifica el tipo de fuente de datos y los parámetros específicos de ese tipo. El valor de `srcType` determina qué otros parámetros son necesarios (por ejemplo, `server`, `user`, `password` para bases de datos). |
| description | Proporciona una descripción textual de la caslib, útil para la gestión y la comprensión de su propósito. |
| hidden | Cuando se establece en True, la caslib no aparecerá en las listas de caslibs por defecto, ocultándola de las interfaces de usuario. |
| name | Especifica el nombre único para la caslib que se va a añadir. Es un parámetro obligatorio. |
| path | Especifica la información específica de la fuente de datos. Para caslibs de tipo PATH y DNFS, esta es la ruta del sistema de archivos. |
| permission | Especifica los controles de acceso del host en la caslib cuando se solicita la creación del directorio. |
| session | Cuando se establece en True, la caslib tiene un alcance limitado a la sesión actual. Si es False, la caslib es global y visible para otras sesiones (sujeto a controles de acceso). |
| subDirectories | Cuando se establece en True, las tablas y archivos en los subdirectorios de la ruta especificada son accesibles desde la caslib. |
| tableRedistUpPolicy | Especifica la política de redistribución de tablas por defecto para esta caslib cuando el número de nodos trabajadores aumenta. |
| transient | Cuando se establece en True, la caslib es transitoria, lo que significa que no persistirá después de reiniciar el servidor. |
Para utilizar la acción `addCaslib`, no se requiere una tabla de datos previa, ya que su propósito es precisamente definir el acceso a las fuentes de datos. Sin embargo, es necesario tener un directorio en el servidor CAS con archivos de datos para que los ejemplos de tipo 'PATH' sean funcionales. Asegúrese de que el directorio `/path/to/your/data` exista en el controlador del servidor CAS y contenga archivos de datos (por ejemplo, CSV, SAS7BDAT).
/* No se necesita código de creación de datos para addCaslib. */ /* Asegúrese de que la ruta especificada en el parámetro 'path' exista en el servidor CAS. */
Este es el ejemplo más común. Se crea una caslib llamada 'myPathCaslib' que apunta a la ruta '/path/to/my/data' en el servidor. La opción `session=false` la hace disponible para otras sesiones (global), y `subDirectories=true` permite acceder a los subdirectorios.
| 1 | PROC CAS; TABLE.addCaslib / caslib='myPathCaslib' dataSource={srcType='PATH'} path='/path/to/my/data' SESSION=false subDirectories=true; RUN; QUIT; |
Este ejemplo muestra cómo conectar SAS Viya a una base de datos Oracle. Se especifica el tipo de fuente de datos como 'oracle' y se proporcionan los parámetros de conexión necesarios como el servidor, el nombre de usuario, la contraseña y el esquema. La opción `activeOnAdd=true` establece esta nueva caslib como la activa para la sesión actual.
| 1 | PROC CAS; TABLE.addCaslib / caslib='myOracle' dataSource={srcType='oracle', server='oraclesrv', user='myuser', password='mypassword', schema='hr'} activeOnAdd=true; RUN; QUIT; |
A diferencia de una caslib global, una caslib de sesión (`session=true`) solo existe durante la sesión actual y se elimina automáticamente al finalizar. Esto es útil para datos temporales o para evitar saturar la lista de caslibs globales. La opción `description` añade un texto explicativo visible en las interfaces de usuario.
| 1 | PROC CAS; TABLE.addCaslib / caslib='tempData' dataSource={srcType='PATH'} path='/tmp/project_xyz' SESSION=true description='Caslib temporal para el proyecto XYZ'; RUN; QUIT; |
Un equipo de marketing necesita analizar datos de clientes de múltiples campañas trimestrales. Los datos están organizados en subdirectorios por trimestre en un sistema de archi...
Un científico de datos está trabajando en un proyecto de prueba de concepto (PoC) para evaluar un nuevo modelo de riesgo. Necesita acceder a un conjunto de datos de entrenamient...
El equipo de administración de SAS Viya necesita verificar y documentar el comportamiento del sistema ante configuraciones erróneas. El objetivo es probar cómo reacciona la acci...