La importancia de la aleatorización de los especímenes de prueba

¿qué es un ensayo de aleatorización?

¿Qué es un experimento de campo aleatorio? En un experimento aleatorio, una muestra de estudio se divide en un grupo que recibirá la intervención estudiada (el grupo de tratamiento) y otro grupo que no recibirá la intervención (el grupo de control). Por ejemplo, una muestra de estudio puede consistir en todos los votantes registrados en una ciudad concreta. Esta muestra se dividirá aleatoriamente en grupos de tratamiento y de control. Tal vez el 40% de la muestra esté en la lista de correo de la campaña “Get-Out-the-Vote” (GOTV) y el otro 60% de la muestra no reciba los correos de GOTV. El resultado medido -la participación de los votantes- puede entonces compararse en los dos grupos. La diferencia en la participación reflejará la eficacia de la intervención.
¿Qué significa la asignación aleatoria? La clave del diseño de la investigación experimental aleatoria está en la asignación aleatoria de los sujetos del estudio -por ejemplo, votantes individuales, distritos electorales, mercados de medios de comunicación o algún otro grupo- a los grupos de tratamiento o de control. La aleatorización tiene un significado muy específico en este contexto. No se refiere a la elección aleatoria o casual de unos y no de otros. En este contexto, la aleatorización significa que se tiene cuidado para garantizar que no exista ningún patrón entre la asignación de los sujetos a los grupos y las características de dichos sujetos. Cada sujeto tiene la misma probabilidad de ser asignado al grupo de tratamiento (o de control). La aleatorización se consigue generalmente empleando un programa informático que contiene un generador de números aleatorios. Los procedimientos de aleatorización difieren según el diseño de la investigación del experimento. Los individuos o grupos pueden ser asignados aleatoriamente a los grupos de tratamiento o de control. Algunos diseños de investigación estratifican a los sujetos por factores geográficos, demográficos o de otro tipo antes de la asignación aleatoria para maximizar la potencia estadística del efecto estimado del tratamiento (por ejemplo, la intervención GOTV). La información sobre el procedimiento de aleatorización se incluye en el resumen de cada experimento en el sitio web.

Prueba no aleatoria de comprobación de hipótesis

La prueba t de dos muestras es una de las pruebas estadísticas más utilizadas, que evalúa si las diferencias medias entre dos muestras son estadísticamente significativas. Puede utilizarse para comparar dos muestras de muchas métricas de UX, como las puntuaciones SUS, las puntuaciones SEQ y los tiempos de las tareas.
Aunque es fácil realizar una prueba t de dos muestras utilizando calculadoras en línea y paquetes de software fácilmente disponibles (incluidos Excel, R y SPSS), puede ser difícil recordar cuáles son los supuestos y qué riesgos se corren si no se cumplen dichos supuestos.
Al enseñar pruebas estadísticas a los investigadores de UX durante la última década, hemos descubierto que la posible violación de los supuestos es una preocupación común sobre el uso de las pruebas t. En algunos casos, los investigadores informan de los desafíos de las partes interesadas o de los colegas para justificar su uso de las pruebas t debido a la preocupación por el cumplimiento de los supuestos.
Una forma de responder a estas críticas es citar el gran volumen de investigación que demuestra que la prueba t es muy sólida frente a las violaciones de sus supuestos. La figura 1 muestra los supuestos en los que se basa la prueba t de dos muestras.

Prueba de aleatorización frente a la prueba t

Acceso abierto Este artículo se distribuye bajo los términos de la licencia Creative Commons Attribution 4.0 International License (http://creativecommons.org/licenses/by/4.0/), que permite su uso, distribución y reproducción sin restricciones en cualquier medio, siempre que se dé el crédito correspondiente al autor o autores originales y a la fuente, se proporcione un enlace a la licencia Creative Commons y se indique si se han realizado cambios. La renuncia a la Dedicación de Dominio Público de Creative Commons (http://creativecommons.org/publicdomain/zero/1.0/) se aplica a los datos puestos a disposición en este artículo, a menos que se indique lo contrario.
Reimpresiones y permisosAcerca de este artículoCite este artículoNetz, Y., Lidor, R. & Ziv, G. Muestras pequeñas y mayor variabilidad – discutiendo la necesidad de tipos restringidos de aleatorización en las intervenciones de ejercicio en la vejez.

Prueba de aleatorización r

Las pruebas de aleatorización se pueden considerar como otra forma de examinar los datos, y no hacen suposiciones restrictivas sobre las poblaciones. Como ejemplo muy rápido, suponga que tiene dos grupos de puntuaciones. Uno procede de sujetos a los que se les aplicó un tratamiento determinado, y el otro procede de sujetos que no recibieron el tratamiento.
La pregunta es: “¿podemos sacar una conclusión sobre la eficacia del tratamiento observando estos dos grupos de puntuaciones?”. Y no haremos ninguna suposición sobre la distribución de las puntuaciones, aunque sí supondremos que los sujetos fueron asignados a los grupos de forma aleatoria.
Empecemos por suponer que el tratamiento no tuvo absolutamente ningún efecto. Y supongamos que un participante tuvo una puntuación de 27. Si el tratamiento no tuvo efecto, entonces ese 27 tendría la misma probabilidad de provenir del grupo de tratamiento que del grupo de control. Lo mismo ocurre con todas las demás puntuaciones. Así pues, tomemos todos nuestros datos, lancémoslos al aire y dejemos que la mitad caiga en un grupo y la otra mitad en el otro. Este es un ejemplo de lo que esperaríamos si el tratamiento no tuviera ningún efecto. Ahora calculemos la media, o quizás la mediana, de cada grupo, y luego calculemos la diferencia de las medianas (o medias). Anote esa cifra y, a continuación, vuelva a lanzar los datos al aire, sepárelos al azar en dos grupos y calcule de nuevo la diferencia de las medianas. Sigue haciendo esto muchas veces, digamos 10.000, registrando cada vez la diferencia de las medianas. Esas 10.000 diferencias son 10.000 ejemplos de lo que se esperaría si no hubiera efecto del tratamiento.

Acerca del autor

admin

Ver todos los artículos