Toda investigación recoge datos de algún tipo. Para dar sentido a los datos, hay que analizarlos. El análisis comienza con el etiquetado de los datos en cuanto a su fuente, cómo se recogieron, la información que contienen, etc. Sin embargo, trabajar con datos alfanuméricos puede ser muy engorroso, ya sean cientos de cuestionarios enviados por correo, cifras sobre los índices anuales de accidentes de los cincuenta estados u observaciones del comportamiento de los escolares en el aula. Por este motivo, los datos suelen estar codificados.

La codificación permite al investigador reducir grandes cantidades de información a una forma que pueda ser manejada más fácilmente, especialmente por los programas informáticos. No es necesario codificar todos los datos. Por ejemplo, los índices de accidentes de los cincuenta estados no se codificarían, pero se podría asignar a cada estado un número (del 1 al 50) en lugar de utilizar el nombre del estado. También existen programas informáticos de análisis de contenido que ayudan a los investigadores a codificar los datos textuales para su análisis cualitativo o cuantitativo.

Pasos de la gestión de datos alfanuméricos

Preparar el instrumento de recogida de datos y recoger los datos

Crear el diccionario de datos o el libro de códigos

Preparar las hojas de trabajo de la matriz de datos

Preparar las instrucciones para la introducción y el análisis de los datos.

Ejemplo:  Cuestionario de calidad de vida laboral

  1. Nombre de la División donde trabaja: _____________________________
  2. ¿Cuánto tiempo lleva como empleado en esta empresa? _______años
  3. ¿A cuántas sesiones de formación patrocinadas por el condado ha asistido? _____
  4. ¿Cuál es su clasificación laboral? _____ Gestión _____ Técnico _____ Administrativo
  5. ¿Su puesto es de _____supervisión _____sin supervisión
  6. Sexo _____Femenino _____Masculino
  7. ¿En qué área le gustaría recibir formación adicional? ___________

Pasos

Prepare el diccionario de datos o el libro de códigos

Si los datos se van a introducir en un programa informático, ya sea una hoja de cálculo, una base de datos o un programa estadístico, deben introducirse exactamente de la misma manera para cada persona, cuestionario, estado u otra unidad de análisis.

Muchos programas informáticos tienen límites en cuanto a la forma de introducir, almacenar y recuperar los datos. Estos límites deben reflejarse en el libro de códigos. Por ejemplo, los nombres de las variables a menudo no pueden superar los ocho caracteres. Utilice nombres de variables cortos, preferiblemente con todas las letras. Por lo general, se pueden utilizar tanto números como letras en los nombres de las variables, pero no se pueden utilizar espacios, signos de puntuación u otros caracteres especiales.

Los nombres de las variables que asigne a los datos deben reflejar las definiciones nominales de las propias variables, como «edad», «clase de trabajo», «antigüedad», etc. Puede adoptar una regla como la de utilizar sólo letras minúsculas para cualquier dato alfanumérico que introduzca, o sólo letras mayúsculas. Esto facilitará la escritura de los nombres de las variables más adelante, cuando deba indicar al programa informático qué variables debe analizar.

Los datos pueden almacenarse como letras, lo que se denomina formato alfanumérico. Esto permite almacenar la variable como letras o números o una combinación de ambos. Por ejemplo, se pueden almacenar nombres de pila, como «Amy», «Brad», «Caroline», etc. o combinaciones como números de apartamento (102b), o números de matrícula (3XGJ429), etc.

En ninguno de los dos casos deben introducirse datos con espacios, signos de puntuación o caracteres especiales de ningún tipo. Los números grandes no deben llevar comas, los nombres no deben llevar puntos, guiones, comillas, etc.

El libro de códigos indica al codificador cómo se codificará cada cuestionario para la entrada de datos. Especifica la pregunta del cuestionario de la que se toman los datos, el nombre de la variable, la definición operativa de la variable, las opciones de codificación y el tipo de variable (numérica o alfanumérica) y el número de columnas que requiere la variable.

Variables de Cadena

Las variables de cadena tienen valores que se tratan como texto. Esto significa que los valores de las variables de cadena pueden incluir números, letras o símbolos. En la ventana Vista de Datos, los valores de cadena que falten aparecerán como celdas en blanco. Sin embargo, tenga en cuenta que estas celdas en blanco no son reconocidas por SPSS como valores que faltan en el sistema (es decir, SPSS considera que incluso las cadenas en blanco no faltan). Esto tiene importantes implicaciones si planea utilizar una variable de cadena en un análisis, ya que afectará al tamaño de la muestra.

El investigador tiene que intentar anticipar cómo serán los datos. Una buena idea de esto puede obtenerse haciendo una prueba piloto del instrumento y un simulacro del proceso de recogida de datos. Es importante asegurarse de dejar suficientes columnas para codificar adecuadamente la información de cada variable y proporcionar suficientes variables para captar toda la riqueza, complejidad y variedad de datos que se han recogido.

Si se pregunta a una muestra de estudiantes universitarios por los obstáculos que encuentran al intentar utilizar la biblioteca del campus ¿se les pedirá que enumeren el principal obstáculo, que ordenen todos los obstáculos o que elijan sólo los que les afectan? ¿Y qué pasa si los estudiantes no siguen las instrucciones? Dependiendo de la forma en que se presenten los datos, el investigador tendrá que decidir cómo codificar esta información, utilizando una, dos o muchas variables.

Prepare las hojas de trabajo de la matriz de datos

Cuando los datos se van a introducir en un programa informático para el análisis estadístico, normalmente se hace en forma de matriz. Los nombres de las variables se introducen en la parte superior de las columnas que contendrán los datos de esa variable y los registros de los casos se introducen en las filas. Continuando con el ejemplo anterior tendríamos:

Hojas de trabajo de entrada de datos

Libro de códigos de calidad de vida laboral

Cada número o carácter que se introduce en un programa informático ocupa una columna de espacio. Cada dato puede encontrarse conociendo su ubicación por número de columna en la matriz.

Las columnas 1 a 3 juntas representan el número de identificación del empleado.

La columna 4 representa la división en la que ha trabajado.

Las columnas 5-6 representan la duración del empleo.

Las columnas 7-8 representan el número de clases de formación recibidas (información sobre el número de clases recibidas).

La columna 9 representa la clasificación laboral de la persona.

La número 10 indica si la persona es un supervisor o no.

La columna 11 indica si la persona es hombre o mujer.

La columna 12 indica el tipo de formación que la persona desea recibir en el futuro.

Cada registro, caso, cuestionario u otra unidad de análisis está representado por una sola fila de datos en la matriz. Por ejemplo, la persona 001 se encuentra en la fila 1; la persona 002 en la fila 2; y la persona 003 en la fila 3.

Cada registro debe introducirse exactamente de la misma manera. Si la posición de los datos debe introducirse en columnas fijas, se denomina formato de campo fijo. Si faltan datos para un registro en cualquiera de las variables, hay que introducir algo en ese campo. Normalmente se trata de un número que indica que faltan datos. Para un campo de 1 columna, utilice el número 9; para un campo de dos columnas, utilice 99 y y así sucesivamente. Algunos programas informáticos le permitirán utilizar un punto («.») como marcador de posición que también es un indicador de que faltan datos.

Cuando necesite calcular la duración media del empleo de todos los empleados de su encuesta, la computadora buscará en las columnas 5-6 de cada registro. Tomará lo que encuentre allí e intentará calcular una media. Por lo tanto, es importante que todos los datos sobre la duración del empleo estén en las columnas 5-6 de cada registro y que no haya ningún otro tipo de datos en las columnas 5-6. La computadora no tendrá en cuenta los códigos de datos que falten (es decir, los valores de «99») para calcular la media.

Muchos programas informáticos tienen una limitación de un total de 80 columnas de datos por registro. Esto es un remanente de la época en que los datos se perforaban en tarjetas de cartón que se introducían en lectores de tarjetas, en lugar de introducir los datos directamente en la computadora. Si sus datos requieren más de 80 columnas, tendrá que construir matrices de datos adicionales para registrar el resto de la información de cada registro.

Prepare las instrucciones para la entrada de datos y el análisis de los mismos

La codificación de los datos puede hacerse directamente en el instrumento de recogida de datos y luego transferirse a las hojas de codificación de datos o introducirse directamente en la computadora. Es importante preparar instrucciones detalladas para la codificación de datos y la introducción de datos, especialmente si estas tareas son compartidas o realizadas por varias personas diferentes.

Hay una serie de programas estadísticos, hojas de cálculo y bases de datos que pueden utilizarse para la introducción de datos. La mayoría de los programas guardan los datos y permiten su salida como un archivo de texto plano o ASCII, que es aceptado por la mayoría de los programas estadísticos, como SAS, SPSS o STATA. La mayoría de estos programas están disponibles en una versión de escritorio y muchos también vienen en versiones más económicas para estudiantes, como Student Stata y Mystat.

También hay una serie de productos independientes, como DataPerfect, que pueden programarse fácilmente para que tengan el mismo aspecto que el instrumento de recogida de datos, lo que facilita bastante la introducción de datos y elimina la necesidad de rellenar una matriz de entrada de datos. Estos programas también tienen salvaguardias integradas, de modo que, por ejemplo, no se pueden introducir datos alfanuméricos en una variable que es sólo para datos numéricos. Además, los datos se restringen a un número limitado de columnas, de modo que no se pueden introducir cuatro dígitos en una variable de tres dígitos, etc.

Nuestros especialistas esperan por ti para que los contactes a través del formulario de cotización o del chat directo. También contamos con canales de comunicación confidenciales como WhatsApp y Messenger. Y si quieres estar al tanto de nuestros novedosos servicios y las diferentes ventajas de contratarnos, síguenos en FacebookInstagram o Twitter.

Si este artículo fue de tu agrado, no olvides compartirlo por tus redes sociales.

También te puede interesar: Cómo testear una hipótesis

Trabajando con Datos Alfanuméricos

Trabajando con Datos Alfanuméricos. Foto: Unsplash. Créditos: Gabrielle Henderson

Shares
Abrir chat
1
Escanea el código
Bienvenido(a) a Online Tesis
Nuestros expertos estarán encantados de ayudarte con tu investigación ¡Contáctanos!