?>
Fügt eine neue Caslib hinzu, um den Zugriff auf eine Datenquelle zu ermöglichen. Eine Caslib ist eine In-Memory-Speicherfläche, die Tabellen, Zugriffskontrollen und Datenquelleninformationen enthält. Sie ist ein grundlegendes Konzept in SAS Viya für die Datenverwaltung im Speicher.
| Parameter | Beschreibung |
|---|---|
| activeOnAdd | Wenn auf TRUE gesetzt, wird die neue Caslib zur aktiven Caslib für die aktuelle Sitzung. |
| createDirectory | Wenn auf TRUE gesetzt, wird das Caslib-Verzeichnis erstellt, falls es nicht existiert. Dies gilt nur für pfadbasierte Caslibs. |
| dataSource | Gibt die Datenquelle an. Der Parameter `srcType` definiert den Typ der Datenquelle (z.B. 'PATH' für ein Dateisystem, 'ORACLE' für eine Oracle-Datenbank) und wird von zusätzlichen, für den Typ spezifischen Parametern begleitet. |
| description | Gibt eine textuelle Beschreibung für die Caslib an, die zur Dokumentation dient. |
| hidden | Wenn auf TRUE gesetzt, wird die Caslib als versteckt markiert und erscheint nicht in Standard-Caslib-Listen. |
| name | Gibt den Namen der hinzuzufügenden Caslib an. Dies ist ein erforderlicher Parameter. |
| path | Gibt datenquellenspezifische Informationen an. Für die `srcType` 'PATH' und 'DNFS' ist dies der Dateisystempfad zum Verzeichnis. |
| permission | Gibt die Host-Zugriffskontrollen für die Caslib an, wenn die Verzeichniserstellung angefordert wird. Standardmäßig werden die Berechtigungen gemäß der umask des Sitzungsprozesses festgelegt. |
| session | Wenn auf TRUE gesetzt, ist die Caslib nur für die aktuelle Sitzung gültig. Wenn auf FALSE gesetzt, ist sie eine globale Caslib, die für andere Sitzungen sichtbar ist (vorbehaltlich der Zugriffskontrollen). |
| subDirectories | Wenn auf TRUE gesetzt, sind Tabellen und Dateien in Unterverzeichnissen des in der Caslib-Definition angegebenen Pfads von der Caslib aus zugänglich. |
| tableRedistUpPolicy | Gibt die standardmäßige Tabellen-Umverteilungsrichtlinie für Tabellen unter dieser Caslib an, wenn die Anzahl der Worker-Pods auf einem laufenden CAS-Server zunimmt. |
| transient | Wenn auf TRUE gesetzt, wird die Caslib als transiente Caslib erstellt, was bedeutet, dass sie nicht über Serverneustarts hinweg bestehen bleibt. |
Der folgende SAS-Code erstellt eine CSV-Datei im temporären Verzeichnis `/tmp`. Diese Datei kann dann als Grundlage für eine pfadbasierte Caslib verwendet werden, um das Laden von Daten aus dem Dateisystem zu demonstrieren.
data _null_;
set sashelp.cars;
file '/tmp/cars.csv' dsd dlm=',';
if _n_ = 1 then do;
declare char(32) _all_vars_;
rc = dopen('ind');
do i = 1 to dnum(rc);
_all_vars_ = cats(_all_vars_, ',', dread(rc, i));
end;
put _all_vars_;
end;
put (_all_)(~);
run;Dieses Beispiel zeigt, wie eine einfache pfadbasierte Caslib hinzugefügt wird, die auf ein Verzeichnis im Dateisystem verweist. Dies ist die häufigste Verwendung, um auf flache Dateien wie CSVs oder SASHDAT-Dateien zuzugreifen.
| 1 | PROC CAS; TABLE.addCaslib / name='PathCaslib' path='/tmp/data' dataSource={srcType='PATH'} description='Beispiel-Caslib für Pfad'; RUN; QUIT; |
Dieses Beispiel zeigt, wie eine Caslib für die Verbindung zu einer Oracle-Datenbank hinzugefügt wird. Es gibt die erforderlichen Verbindungsparameter wie Benutzer, Passwort und Pfad (Oracle-Servername) an. Die Caslib wird als globale, nicht sitzungsgebundene Caslib erstellt, die über Sitzungen hinweg bestehen bleibt.
| 1 | PROC CAS; TABLE.addCaslib / name='OracleCaslib' dataSource={srcType='oracle', user='meinBenutzer', password='meinPasswort', path='orcl'} SESSION=false description='Globale Caslib für Oracle-Datenbank'; RUN; QUIT; |
Dieses Beispiel erstellt eine sitzungsbasierte Caslib, die nur für die Dauer der aktuellen CAS-Sitzung existiert. Die Option `subDirectories=true` ermöglicht den Zugriff auf Dateien in den Unterverzeichnissen des angegebenen Pfads.
| 1 | PROC CAS; TABLE.addCaslib / name='TempPath' path='/tmp/tempdata' dataSource={srcType='PATH'} SESSION=true subDirectories=true description='Temporäre Caslib mit Zugriff auf Unterverzeichnisse'; RUN; QUIT; |
Eine Marketingabteilung muss schnell Kundendaten aus einer kürzlich durchgeführten Kampagne analysieren. Die Daten werden als CSV-Datei in ein temporäres Verzeichnis geliefert. ...
Ein Fertigungsunternehmen sammelt riesige Mengen an Sensordaten von seinen Produktionslinien. Die Daten werden täglich in Unterverzeichnissen organisiert (z.B. `/tmp/iot_data/20...
Ein IT-Administrator richtet eine neue Datenquelle ein und gibt versehentlich einen nicht existierenden Pfad an. Das Systemverhalten muss vorhersehbar sein. Gemäß der FAQ schläg...