Press Release: The Power of Parametrics — Journal of Young Investigators

Announcing Undergraduate Research Funding? Submit your applications until April 30th

Press Release: The Power of Parametrics

Press Release: The Power of Parametrics

July 1, 2022

PHOEBE AHN

Not many realize apple seeds contain cyanide, a toxic chemical compound that essentially causes your cells to suffocate. This may come as a surprise, especially to the generations that grew up eating the apple whole, core, seeds, and all. This is a little-known fact since few experience adverse effects, if any at all. This is because of the correlation between cyanide poisoning and body weight; the average dose of cyanide in an apple seed is inconsequential to generate any sort of effect when compared to the average human body weight. So why is body weight important, aside from being able to eat apple seeds without suffocating? Body weight is not just something to be lowered in the summer. Accurate measurements of body weight are essential in the toxicology and health fields, as these quantifications help to determine the minimum threshold of chemicals a person can be exposed to before adverse effects are felt. Loss of body weight can also be an indicator of a chemical causing adverse effects. Currently, the preferred method to analyze body weight data is through parametric tests. One of the main requirements to be able to apply these tests in the first place is normality; the data must have a “bell curve.” However, what happens when the data isn’t normally distributed? Are parametric tests robust enough to overcome possible skews in data? Is it still safe to use the predicted results from these tests when body weight is an important factor for medical procedures? In a study done by Alyssa M. Taylor-LaPole, Helen C. Funny, and Keith R. Shockley from Virginia Wesleyan University and published by the Journal of Young Investigators, these questions were put to the test by analyzing the body weights of rodents among normal and non-normal populations, testing the power of our trusty parametric testing system against the statistical assumption of normality.

Parametric testing is the inclusive term for many of the statistical tests often learned in introductory statistics courses: t-tests, ANOVA, linear regression, and Pearson rank correlation test. In the world of statistics, parametric tests have four main assumptions that must be satisfied in order to be considered valid. The data must have equal variance, independence, no outliers, and be normally distributed. A normal distribution is when the continuous numerical data forms a symmetrical bell-shaped curve, and in general, it is a fairly good approximation of many frequency distributions in biology. A hallmark of a normal distribution is where two-thirds of the data fall between one standard deviation more and less than the mean, causing the density to be the highest exactly at the mean. A data set is usually tested for normality using the Shapiro-Wilk’s test. This is a common testing format that allows one to check whether a continuous variable follows a normal distribution (Whitlock and Schluter 2015, p. 474). However, as nothing happens quite perfectly in nature, outliers and skewed distributions are bound to occur by random chance. 

In order to determine the robustness of parametric tests, this study analyzed a set of data, charting rodent weight gain in a normally distributed and skewed setting. By comparing the data between the normal and skewed data sets, they were able to determine whether parametric tests could distinguish a change in weight for both the types of distributions or just the normal distribution. Essentially, two groups of rodents were created, a control group that received no treatment and a group that received treatment to lower their weight. One set of data collected had a normal distribution and the other was skewed. The experimenters evaluated the ability of parametric tests to detect a 10% difference in body weight between the two sets of body weight data, hypothesizing that the tried and true parametric testing would still be able to detect a 10% difference in rodent body weight. The results of the experiment ended up supporting the hypothesis that parametric tests are robust enough to detect a 10% difference in body weight gain of rodents in skewed data sets.

One might wonder why the robustness of parametric testing is so important. Until now, parametric testing has been bound to the assumption of normality, greatly limiting its use in certain fields such as medicine. Due to our uncertainty about the accuracy of parametric testing in more natural settings, we have resorted to nonparametric testing. However, the pitfall of nonparametric testing is that their requirements are more difficult to satisfy and in general are considered less powerful. The authors of this paper hope that in providing some certainty about the robustness of parametric testing, we can expand on our uses for this test method. In particular, they are hopeful that parametric testing can be performed on data for organ weight analysis, aiding organ transplant operations and toxicology studies. Though statistics may feel distant from everyday activities, with statistical certainty, we can venture and improve upon other fields that have a large effect on the daily lives of many.

References


Comunicado de prensa: El poder de los paramétricos

El primer0 de julio 2022

PHOEBE AHN

Julia Goralsky

Mucha gente no se da cuenta de que las semillas de manzana contienen cianuro, un compuesto químico tóxico que esencialmente hace que las células del cuerpo humano se asfixien. Esto puede ser una sorpresa, especialmente para las generaciones que crecieron comiendo la manzana entera: el carozo, las semillas y todo. Este es un hecho poco conocido porque pocas personas experimentan efectos adversos, si acaso. Esto se debe a la correspondencia que existe entre el envenenamiento por cianuro y el peso corporal; la dosis promedia de cianuro en una semilla de manzana es intrascendente para generar algún tipo de efecto cuando se compara con el peso promedio del cuerpo humano. Entonces, ¿por qué es importante el peso corporal, aparte de la habilidad de comer semillas de manzana sin asfixiarse? El peso corporal no es algo solo para bajar en el verano. Las medidas precisas del peso corporal son indispensables en las áreas de la toxicología y la salud, como estas cuantificaciones ayudan a determinar el umbral mínimo de sustancias químicas a las que una persona puede estar expuesta antes de que sienta algo. La pérdida de peso corporal también puede ser un indicador de que esté causando efectos adversos. Actualmente, el método preferido para analizar datos de peso corporal es a través de pruebas paramétricas. Uno de los principales requisitos para poder aplicar estas pruebas, en primer lugar, es la normalidad; los datos deben tener una "curva de campana." Sin embargo, ¿qué ocurre cuando los datos no se distribuyen normalmente? ¿Las pruebas paramétricas son bastante sólidas como para superar posibles sesgos en los datos? ¿Sigue siendo seguro utilizar los resultados previstos de estas pruebas cuando el peso corporal es un factor importante para los procedimientos médicos? En un estudio hecho por Alyssa M. Taylor-LaPole, Helen C. Funny y Keith R. Shockley de la Virginia Wesleyan University y publicado por la Journal of Young Investigators, estas preguntas se pusieron a prueba analizando el peso corporal de los roedores entre poblaciones normales y no normales, probando el poder de nuestro sistema confiable de pruebas paramétricas contra la suposición estadística de normalidad.

La prueba paramétrica es el término inclusivo para muchas de las pruebas estadísticas que los estudiantes aprenden en los cursos introductorios de estadística: pruebas t, ANOVA, regresión lineal y prueba de correlación de rangos de Pearson. En el mundo de la estadística, las pruebas paramétricas tienen cuatro supuestos principales que deben cumplirse para ser consideradas válidas. Los datos deben tener varianza igual, independencia, sin valores atípicos y con una distribución normal. Una distribución normal es cuando los datos numéricos continuos forman una curva simétrica en forma de campana y, en general, es una aproximación bastante buena de muchas distribuciones de frecuencia en biología. Un sello distintivo de una distribución normal es cuando dos tercios de los datos se encuentran entre una desviación estándar más y menos que la media, lo que hace que la densidad sea la más alta exactamente en la media. Por lo general, se comprueba la normalidad de un conjunto de datos mediante la prueba de Shapiro-Wilk. Este es un formato de prueba común que permite verificar si una variable continua sigue una distribución normal (Whitlock y Schluter 2015, p. 474). Sin embargo, como nada sucede perfectamente en la naturaleza, es probable que se produzcan valores atípicos y distribuciones sesgadas se producen al azar.

Para determinar la sólidez de las pruebas paramétricas, este estudio analizó un conjunto de datos, trazando el aumento de peso de los roedores en un marco distribuido normalmente y un marco sesgado. Después de comparar los datos entre los conjuntos de datos normales y sesgados, pudieron determinar si las pruebas paramétricas podían distinguir un cambio en el peso para ambos tipos de distribuciones o solo para la distribución normal. Esencialmente, se crearon dos grupos de roedores, un grupo de control que no recibió tratamiento y un grupo que recibió tratamiento para bajar el peso. Un conjunto de datos recopilados tenía una distribución normal y el otro estaba sesgado. Los experimentadores evaluaron la capacidad de las pruebas paramétricas para detectar una diferencia del 10 % en el peso corporal entre los dos conjuntos de datos de peso corporal, con la hipótesis que las pruebas paramétricas probadas y verdaderas todavía podrían detectar una diferencia del 10 % en el peso corporal de los roedores. Los resultados del experimento apoyan la hipótesis que las pruebas paramétricas son suficientemente sólidas para detectar una diferencia del 10 % en el aumento de peso corporal de los roedores en conjuntos de datos sesgados.

Es posible que una persona se pregunte por qué la firmeza de las pruebas paramétricas es tan importante. Hasta ahora, han estado ligadas al supuesto de normalidad, limitando mucho su uso en algunos campos como la medicina. Debido a nuestra incertidumbre sobre la precisión de las pruebas paramétricas en marcos más naturales, hemos recurrido a las pruebas no paramétricas. Sin embargo, el obstáculo es que sus requisitos son más difíciles de cumplir, y en general, se consideran menos poderosas. Los autores de este artículo esperan que, al proporcionar alguna certeza sobre la resistencia de las pruebas paramétricas, podamos expandir nuestros usos para este estilo de prueba. En particular, tienen la esperanza que puedan realizarse en los datos para el análisis del peso de los órganos, ayudando a las operaciones de trasplante de órganos y los estudios de toxicología. Aunque las estadísticas pueden parecer lejanas de las actividades cotidianas, con la certeza estadística, podemos atrevernos y mejorar en otros campos que tienen un gran impacto en la vida diaria de muchos.

Fuentes


Share