La computadora como caja negra

Zacarías Miranda Argüello*

“Todos somos muy ignorantes. Lo que ocurre es que no todos ignoramos las mismas cosas”.

–Albert Einstein–

Cuando no existían la computadoras (tanto las primeras versiones como las versiones personales), la estadística se enseñaba igual que ahora con la salvedad de que en ese entonces todos los cálculos, cuadros y gráficos había que realizarlos a mano.

Con el advenimiento de la computadora personal y los programas procesadores de datos como el Spss, Sas, Statistics, Minitab, Epiinfo, Excel, etc., el procesamiento de datos dejó de ser un problema como lo era antes. La enseñanza de la estadística, así como de muchas asignaturas, ya no sólo se compone de enseñar los fundamentos teóricos en que se sustenta, sino de enseñar también un programa de computación como los mencionados anteriormente para el cálculo y procesamiento eficaz y eficiente de los datos. Sin embargo, la solución de este problema dio lugar al surgimiento de otros.

Uno de los problemas que surgió, entre otros (actualización de versiones, actualización de plataformas o ambientes, etc.), es la compatibilidad entre la teoría estadística y la programación de estos programas. Por un lado los estadísticos con la teoría, práctica y enseñanza de la estadística; y, por el otro, los programadores de estos programas con la responsabilidad de adaptar las condiciones teóricas de los modelos estadísticos a un programa de computación o software; ambos que no han llegado a ponerse totalmente de acuerdo y en sintonía.

Un ejemplo de tantos que se pueden mencionar: el Análisis de la Varianza (Anova) y el SPSS (Statistical Package for the Social Sciences) versión 7.5 para Windows. Desde el punto de vista teórico, deben cumplirse tres requisitos para aplicar el Anova a un conjunto de datos: 1) Aleatoriedad, representatividad e independencia de las muestras, 2) Normalidad de la variable dependiente en las diferentes poblaciones o, si no, muestras grandes y 3) Homocedasticidad de las diferentes varianzas poblacionales. Aunque la responsabilidad de que se cumplan estos tres requisitos generales es del estadístico, investigador o grupo investigador en primer lugar; sin embargo, el Spss no orienta mucho sobre el cumplimiento de los mismos.

Sobre el primer requisito, el programa no sabe si las muestras son aleatorias, ni si son lo suficientemente grandes e independientes unas de otras. Sobre el segundo requisito, habrá que salirse del módulo del Anova e ir a otro módulo del menú para probar la hipótesis de que las muestras fueron tomadas de una población normal. Por otro lado al programa tampoco le importa si son tres, 30 ó 300 casos por muestra. De todas formas trabajará y en casos extremos se detendrá enviándonos un mensaje de error muy poco explícito. Y a pesar de que puede realizar el tercer requisito dentro del módulo del Anova; sólo lo realiza si se lo piden, ya que la opción no está ni siquiera predeterminada (como debería estarlo). Además, el Spss puede realizar pruebas de comparación múltiples cuando no son necesarias (no rechazo de Ho, modelo efectos aleatorios) con sólo marcar una casilla. Esto demuestra sólo una cosa: los programas de computación para el procesamiento de datos estadísticos están muy lejos todavía de sustituir al profesor o al especialista en estadística. Muchos piensan y sienten que sólo por el hecho de tener uno de esos programas, ya tienen automáticamente el “conocimiento” necesario para aplicar, entender e interpretar la Estadística.

Otros opinarán, por el contrario, que es necesario saber mucho de estadística antes de utilizar uno de estos programas, a lo que yo estoy totalmente de acuerdo. El hecho de conocer un programa como el Spss y de haber “practicado” un poco con él no quita la responsabilidad de conocer la materia estadística. Cuando se utiliza un programa como el Spss sin un conocimiento adecuado de la estadística, como pasa en muchas ocasiones, se corre el riesgo de, en el mejor de los casos, hacer un análisis limitado que es casi lo mismo como no hacer nada; y, en el peor, de hacer un análisis inadecuado que es casi lo mismo que mentir, salvando las diferencias.

Mi opinión y visión del futuro sobre este tema es que el programa le sirva tanto a un profesor como a un alumno. En ambos casos debería ser un programa tal con unas características docentes tales que el programa vaya en cascada preguntando por requisitos y condiciones de aplicación de acuerdo a la teoría estadística y a algún algoritmo dando por terminada la sesión cuando el programa detecte que no se sabe lo que se está pidiendo o cuando uno se equivoque; o si se quiere ser más flexible, regresándonos hasta donde íbamos de forma correcta. Sólo así, a falta de tutor o profesor (y hasta para los mismos profesores), y por medio del ensayo y error, y en un momento determinado, la computadora dejaría de ser una caja negra de dende cualquier cosa puede salir (desde la mera verdad, pasando por una inocente mentira, hasta el autoengaño de que ya se tiene el procesamiento de los datos y por lo tanto también el análisis e interpretación de los mismos).

Para esto es necesario que los programadores de este tipo de programas se unan a los estadísticos (o a los expertos en la materia de que se trate el programa) para que cada módulo sea productivo también desde el punto de vista docente y que de esta manera el programa mismo no se convierta en una caja negra para cualquiera que sólo sepa meter datos y dar algunas instrucciones sin saber en realidad qué es lo que está haciendo.

* El autor es profesor de estadística de la Universidad Thomas More

ÚLTIMAS NOTICIAS

Editorial

La computadora como caja negra

ÚLTIMAS NOTICIAS

La computadora como caja negra

El contenido de LA PRENSA es el resultado de mucho esfuerzo. Te invitamos a compartirlo y así contribuís a mantener vivo el periodismo independiente en Nicaragua.