Observatorio de Investigación y Desarrollo Tecnológico


  • PERFILES//(NUM. 24, VOL. 1)

    Volumen: 1, Numero: 24, Páginas: 4-11 pp.

    ROBUSTEZ Y POTENCIA DE LA T-STUDENT PARA INFERENCIA DE UNA MEDIA ANTE LA PRESENCIA DE DATOS ATIPICOS

    Abstract

    Previous studies reveal that samples with outliers alter the type I and type II error of a t-Student test for inference of a mean. The methodology that these works use to simulate extreme data consists of mixing two different normal in order to contaminate the data. We think that this technique is not the most appropriate, since, when making this process, the result is not a new normal, which is breaching the main assumption of the test. In this work, this methodology is repeated in order to verify the problems described, but atypical data are also generated from a single normal without the need for any contamination. Using this last methodology, and with a stochastic simulation process, the probability of type I and type II error is estimated, from which it is concluded that the t-Student is a robust test against the presence of outliers and its power does not depend of the number of extreme data generated in the sample.


    Keywords


    outliers, t-Student, mean, inference


    Resumen

    Estudios previos revelan que las muestras con datos atípicos, alteran el error tipo I y tipo II de la prueba t-Student para inferencia sobre una media. La metodología que estos trabajos usan para simular datos extremos consiste en mezclar dos normales distintas con el fin de contaminar los datos. Pensamos que esta técnica no es la más adecuada, puesto que esta nueva muestra no es necesariamente una normal, con lo cual se está incumpliendo con el principal supuesto de la prueba. En el presente trabajo se repite esta metodología con el fin de comprobar los problemas descritos, pero además se generan datos atípicos a partir de una sola normal sin necesidad de realizar ninguna contaminación, usando esta última metodología y mediante un proceso de simulación estocástica se estima la probabilidad de error tipo I y tipo II, a partir de lo cual, contrario a los estudios previos, se concluye que la t-Student es una prueba robusta ante la presencia de datos atípicos y que su potencia no depende del número de datos extremos generados en la muestra.


    Palabras Clave


    atípicos, t-Student, media, inferencia





    Acceder