?>
La acción `percentile.boxPlot` en SAS Viya es una herramienta de análisis estadístico que se utiliza para calcular un conjunto completo de estadísticas descriptivas necesarias para construir diagramas de caja (box plots). Estos diagramas son fundamentales para visualizar la distribución de datos numéricos, identificar la mediana, los cuartiles, los valores atípicos y la dispersión de una variable. La acción puede procesar grandes volúmenes de datos de manera eficiente en el entorno distribuido de CAS.
| Parámetro | Descripción |
|---|---|
| attributes | Especifica atributos temporales, como un formato, para aplicar a las variables de entrada. |
| binNum | Define el número de contenedores (bins) a utilizar en el cálculo de tres pasadas. |
| casOut | Especifica la tabla de salida CAS donde se almacenarán los resultados del análisis. |
| freq | Indica la variable que contiene la frecuencia de cada observación. |
| groupByLimit | Establece el número máximo de niveles en un conjunto de agrupación (group-by). |
| includeMissingGroup | Si se establece en Verdadero, permite que los valores perdidos se utilicen como claves de agrupación. |
| inputs | Especifica las variables de entrada que se utilizarán en el análisis. |
| method | Especifica el algoritmo para el análisis de percentiles. Los algoritmos soportados son el método Iterativo y el método Exacto. |
| nOutBins | Especifica el número de contenedores a utilizar para reportar valores atípicos. Su especificación implica una solicitud para calcular valores atípicos. |
| nOutLimit | Especifica el número máximo de valores atípicos a devolver. Se devuelven los valores atípicos reales en lugar de los valores en contenedores. |
| outliers | Si se establece en Verdadero, se calculan los valores atípicos. |
| partition | Si se establece en Verdadero y la tabla está particionada, los resultados se calculan de manera eficiente para cada partición. |
| partKey | Permite especificar una clave de partición para calcular los resultados en una única partición específica. |
| pctlDef | Especifica una de las cinco definiciones para calcular estadísticas de cuantiles (percentiles). |
| table | Especifica la tabla de entrada para el análisis. |
| whiskerPercentile | Especifica el percentil para los bigotes inferior y superior. Por ejemplo, un valor de 10 establece los bigotes en los percentiles 10 y 90. |
Este bloque de código crea una tabla CAS de muestra llamada 'cars_test' que contiene datos sobre diferentes modelos de coches, incluyendo su tipo, origen, y especificaciones como MPG y peso. Esta tabla se utilizará en los ejemplos siguientes para demostrar el uso de la acción boxPlot.
1 DATA casuser.cars_test; 2 SET sashelp.cars; 3 RUN;
Este ejemplo realiza un análisis de diagrama de cajas para la variable 'MPG_City' de la tabla 'cars_test'. Calcula las estadísticas básicas como la mediana, los cuartiles y los bigotes.
| 1 | PROC CAS; percentile.boxPlot TABLE={name='cars_test'}, inputs={{name='MPG_City'}}; RUN; QUIT; |
Este ejemplo calcula las estadísticas del diagrama de cajas para las variables 'MPG_City' y 'Weight', agrupadas por la variable 'Type'. También habilita la detección de valores atípicos y guarda los resultados en una tabla CAS llamada 'boxplot_results'.
| 1 | PROC CAS; percentile.boxPlot TABLE={name='cars_test'}, inputs={{name='MPG_City'}, {name='Weight'}}, casOut={name='boxplot_results', replace=true}, groupBy={'Type'}, outliers=true; RUN; QUIT; |
Este ejemplo demuestra cómo definir los bigotes del diagrama de cajas utilizando percentiles específicos. Aquí, los bigotes se establecen en los percentiles 10 y 90 para la variable 'Horsepower'.
| 1 | PROC CAS; percentile.boxPlot TABLE={name='cars_test'}, inputs={{name='Horsepower'}}, whiskerPercentile=10; RUN; QUIT; |
Este ejemplo utiliza el método de cálculo 'EXACT' para una mayor precisión y solicita la devolución de hasta 5 valores atípicos reales (no en contenedores) tanto en el extremo inferior como en el superior de la distribución para la variable 'EngineSize'.
| 1 | PROC CAS; percentile.boxPlot TABLE={name='cars_test'}, inputs={{name='EngineSize'}}, method='EXACT', nOutLimit=5; RUN; QUIT; |