?> What does the `litiChunkSize` parameter do?... - Aide
QUESTION / RÉPONSE

What does the `litiChunkSize` parameter do?

3 consultations

Réponse

The `litiChunkSize` parameter specifies the size of the data chunks used for processing a document. The default is '32K'. For very large documents, using a smaller chunk size like '32K' or '64K' can improve performance and reduce memory consumption. Setting it to 'ALL' processes the entire document at once, which can be memory-intensive.
Action technique liée

Voir la documentation de applyConcept

Voir l'Action

Voir aussi

applyConcept
textRuleScore

Realiza la extracción de conceptos utilizando un modelo de extracción de conceptos (archivo LITI). Esta acción, parte del conjunto de acciones 'Text Analytics Rule Score', aplica un modelo de concepto LITI compilado a una tabla CAS de entrada para identificar y extraer conceptos definidos en el modelo. Es fundamental para el análisis de texto no estructurado, permitiendo la identificación de entidades, temas o cualquier patrón textual predefinido.

applyCategory
textRuleScore

La acción `applyCategory` se utiliza para categorizar documentos de texto basándose en un modelo de categorización preexistente, que generalmente se encuentra en un archivo de modelo de categoría de SAS (MCO). Esta acción procesa una tabla de entrada que contiene los textos a analizar y aplica las reglas del modelo para asignar una o más categorías a cada documento. Es una herramienta fundamental en el análisis de texto para la clasificación automática de grandes volúmenes de datos no estructurados.

applyConcept
textRuleScore

Führt die Konzeptextraktion unter Verwendung eines Konzeptextraktionsmodells (LI-Datei) durch. Diese Aktion ermöglicht es, vordefinierte linguistische Regeln auf einen Textkorpus anzuwenden, um relevante Konzepte zu identifizieren und zu extrahieren. Sie ist ein wesentlicher Bestandteil der Textanalyse in SAS Viya und wird häufig für Aufgaben wie die Inhaltskategorisierung, die Extraktion von Entitäten und die Stimmungsanalyse verwendet.