INTRODUCIÓN DE DATOS

1. Matriz de datos

Para realizar un análisis estadístico es necesario disponer de una matriz de datos. Dicha matriz se puede estructurar de la siguiente forma:

Variable1

Variable 2

Variable 3

.....

Variable m

Caso 1

Caso 2

Caso 3

.

...

Caso n

Es decir, es una matriz de dimensión n,m, donde n es el número de filas y corresponde a las unidades de análisis, y m que es el número de columnas corresponde a las variables.

Para introducir los datos y después poder analizarlos con el SPSS, se puede utilizar dicho programa, o bien una base de datos, o una hoja de cálculo, o un editor, o un procesador de texto,... para crear un fichero ascii que contenga dicha matriz de datos.

Además se debe crear el "code book" de las variables que en el SPSS se conoce como "definir variables". Este "code book" contiene: el nombre de la variable, el tipo, el formato de lectura, la etiqueta de la variable, la etiqueta de las categorías (cuando la variable es discreta) y la definición de los valores "missing".

2. Introducción de datos con el SPSS

En este apartado se explica cómo introducir con el SPSS, la matriz de datos y el "code book" de las variables. Es aconsejable definir primero las variables y después los datos, aunque este orden no es obligatorio. Ambas operaciones se realizan desde la ventana Archivo.

2.1. Definición de las variables

Una vez activada la ventana Nuevo datos del SPSS, pasamos a definir la variable correspondiente a la columna o celda seleccionada. Para ello pinchar en el menú Datos y dentro del menú que se desplegará, elegir la opción Definir variable..., es decir:

spss1


Una vez hecho esto aparecerá el siguiente menú que se utiliza para introducir el "code book" de la variable seleccionada:

spss2
Este menú tiene 2 partes:

1. Nombre de variable: debe tener como máximo 8 caracteres, que pueden ser alfabéticos o numéricos o el símbolo de subrayado ( _ ) ; la única restricción es que el primer carácter debe ser alfabético, $ o #.

2. Descripción variable: si la descripción de la variable no coincide con la que sale por defecto, se modificará pinchando en las opciones que aparecen en la sección de Cambiar las especificaciones. Estas opciones son:


spss


Tipo: Se utiliza para modificar el tipo de la variable y el formato. Cuando se pincha en Tipo... dentro de Cambiar las especificaciones, aparece la siguiente ventana:

donde se pinchará en el tipo que se desee.

Los tipos de variables más usuales son:

numéricas

Sólo toman valores numéricos. En este caso seleccionar la opción Numérico, Coma, Punto, Notación Científica.

Para formatos numéricos, de coma y de punto, se pueden introducir valores con cualquier número de dígitos decimales (hasta 16) y el valor completo se almacena internamente. El Editor de datos muestra sólo el número definido de dígitos decimales y redondea los valores con más decimales. Sin embargo, el valor completo se utiliza en cualquier cálculo.

Cadena

Pueden contener valores numéricos y alfabéticos. Su longitud es de 8 caracteres como máximo. En este caso seleccionar la opción Cadena.

Para variables de cadena, todos los valores se rellenan por la derecha hasta el ancho máximo. Para una variable de cadena con un ancho de 6, un valor de 'No' se almacena internamente como 'No ' y no es equivalente a ' No '.

Moneda

Tipo especial de dato numérico. En este caso seleccionar la opción Dólar, Moneda Personalizada.

Fecha

Para formatos de fecha, se pueden utilizar guiones, barras, espacios, comas o puntos como separadores entre valores de día, mes y año; se pueden introducir números, abreviaciones de tres letras o nombres completos para el valor de mes. Las fechas del formato general dd-mmm-aa se muestran con guiones como separadores y abreviaciones de tres letras para el mes. Las fechas del formato general dd/mm/aa y mm/dd/aa se muestran con barras como separadores y números para el mes. Internamente, las fechas se almacenan como el número de segundos transcurridos desde el 14 de octubre de 1582. El rango de siglo para las fechas con años de dos dígitos viene determinado por la configuración especificada en Opciones (menú Edición, Opciones, pestaña Datos).

Para formatos de hora, puede utilizar punto y coma, puntos o espacios como separadores de horas, minutos y segundos. Las horas se muestran con punto y coma como separador. Internamente, las horas se almacenan como el número de segundos.

Una vez seleccionado el tipo, se pinchará en el botón de Aceptar, para eliminar esta ventana, se pincha en el botón de Cancelar ; en este caso no se almacenarán las modificaciones hechas en esa ventana. Para obtener información sobre la ventana de Definir variable , se pincha en el botón de Ayuda . (Estos botones funcionan igual en todas las ventanas del SPSS, por lo que no se volverán a comentar a lo largo del manual)

spss3


Etiquetas Se utiliza para definir la etiqueta de la variable, y de los valores que toman las variables en el caso de que éstas sean discretas. Cuando se pincha en Etiquetas... dentro de Cambiar parámetros, aparece la siguiente ventana:


La etiqueta de la variable no puede exceder a 120 caracteres y las de los valores a 60 caracteres.

En el caso de que la variable que se está definiendo sea discreta y se desee poner etiquetas a los valores que toma dicha variable, se especificará el valor a etiquetar en el recuadro situado a la derecha de Valor: y su etiqueta correspondiente en el recuadro situado a la derecha de Etiqueta de valores:

Una vez rellenados estos dos campos se pincha en el botón de Añadir. Si se desea eliminar alguna de estas etiquetas se selecciona dicha etiqueta (pinchando con el ratón en ella) y se pincha en el botón de Borrar. Si se desea hacer alguna modificación en la definición de los valores y sus etiquetas, se selecciona la etiqueta a modificar, se pincha en el campo que se va a modificar (valor o etiqueta), y una vez hecha la modificación se pincha en el botón de Cambiar (Estos botones funcionan igual en todas las ventanas del SPSS, por lo que no se volverán a comentar a lo largo del manual. Dichos botones deberán estar activados para poder pinchar en ellos).

Valores perdidos: Se utiliza para definir los valores missing (ausencia de dato) de la variable que se está describiendo. En SPSS se pueden definir datos perdidos discretos, rangos de valores o una combinación de ellos.

Formato de columna: Se utiliza para definir el formato de las columnas donde se introducirán los valores de la variable: alineación de los datos y ancho de la columna

2.2. Introducción de datos

Los datos se pueden introducir de dos formas diferentes: metiendo todos los valores de una determinada variable, es decir, introducir los datos por columna, o metiendo todos los valores de una determinada unidad de análisis, es decir, introducir los datos por fila.

Introducir los datos correspondientes a una variable

Por defecto, cuando se teclea el primer valor y se pulsa la tecla de Intro éste se almacena en la celda correspondiente a la primera unidad de análisis de la primera variable, el segundo valor se almacena en la celda correspondiente a la segunda unidad de análisis de la primera variable, y así sucesivamente hasta completar todos los datos de la primera variable. Después se activa la segunda variable, y se procede de la misma forma. Y así sucesivamente, hasta completar todos los datos de todas las variables.

Introducir los datos correspondientes a una unidad de análisis

A veces es más cómodo introducir los datos por unidad de análisis en vez de por variable. En este caso, se activará la fila correspondiente a la unidad de análisis y después se pasa a introducir los datos. Es decir, una vez activada una determinada fila, el valor tecleado se almacena en la primera columna de la fila activada, el segundo valor se almacena en la segunda columna, y así sucesivamente hasta completar todos los datos del primer caso.

Si no se ha activado ninguna fila ni ninguna columna, y después de introducir un valor se pulsa la tecla de tabulación, en vez de la tecla de Intro, los datos se almacenarán por fila en lugar de por columna.

3. Almacenar datos

Una vez que se ha introducido la matriz de datos utilizando el SPSS, ésta se puede almacenar en un fichero. El SPSS permite almacenar los datos y el code book de las variables en distintos tipos de ficheros; el tipo que se elija dependerá de lo que se vaya a hacer posteriormente.

Para almacenar los datos, se pincha en el menú Archivo y se selecciona la opción Guardar datos o Guardar como... En ambos casos se abrirá la siguiente ventana:


spss4

Esta ventana tiene 4 partes:

1. Nombre de archivo: es el campo donde se especifica el nombre del fichero donde se van a almacenar los datos. En cuanto a la extensión del nombre del fichero, diremos que en el caso de un fichero SPSS, no es obligatorio mantener las que figuran por defecto (éstas dependen del tipo de fichero), pero si es aconsejable utilizarlas, pues dan idea del tipo de fichero del que se trata.

2. Guardar como tipo: se utiliza para especificar el tipo del fichero en el que se desea almacenar los datos. Al pinchar en el símbolo a la derecha de dicho campo aparece un menú con los tipos de ficheros disponibles.

Los ficheros de datos que se crean con el SPSS se pueden utilizar con otros programas de análisis de datos (BMDP, SAS,..), bases de datos, hojas de cálculo, procesadores de texto, ... y en general, con cualquier programa que lea ficheros ascii.

Explicaremos los tipos de ficheros más utilizados, que son:

· Fichero SPSS: Es un fichero binario que sólo puede crearse y leerse con el SPSS para Windows. Contiene los datos y el code book de las variables: nombre de las variables, las etiquetas de las variables y de los valores, los valores missing y el formato de las variables. Estos ficheros tienen extensión .sav

· Fichero SPSS/PC+: Es un fichero binario que sólo puede crearse y leerse con el SPSS para MS-DOS. Contiene los datos y el code book de las variables. Estos ficheros tienen extensión .sys

· Fichero SPSS portátil: Es un fichero ascii que sólo puede crearse y leerse con el SPSS (versión para Windows o versión para MS-DOS). Contiene los datos y el code book de las variables. Estos ficheros tienen extensión .por

· Fichero Ascii fijo: Es un fichero ascii que sólo contiene la matriz de datos, por lo tanto se podrá leer con cualquier programa de análisis de datos, y en general, con cualquier programa que lea ficheros ascii. Estos ficheros tienen extensión .dat

3. Carpetas: En este campo figura la estructura de subdirectorios de la unidad especificada en el campo Unidades de este menú.

4. Unidades: Este campo se utiliza para especificar la unidad donde se desea almacenar el fichero. Al pinchar en el símbolo t de dicho campo aparece un menú con las unidades disponibles, es decir:

4. Lectura del fichero de datos

Hay veces que ya se dispone del fichero de datos para realizar el análisis estadístico y no es necesario utilizar el SPSS para crearlo. Este fichero puede ser un fichero ascii, en cuyo caso sólo contiene datos, o puede haberse creado con el SPSS (versión de Windows o de MS-DOS), o con una base de datos, o con una hoja de cálculo, en cuyo caso contiene los datos y la definición de variables. Por lo tanto, la forma de leer el fichero dependerá del tipo de fichero de que se trata.

4.1. LECTURA DE UN FICHERO DE DATOS ASCII

Cuando el fichero de datos es un fichero ascii sólo contiene la matriz de datos, por lo que al leerlo habrá que introducir la definición de las variables. En este caso se procederá de la siguiente forma: con el ratón se pincha en el menú Archivo, donde se selecciona la opción Leer datos ASCII...

Los datos ASCII se pueden leer de dos formas: Formato libre y Columnas Fijas.

spss5

spss6

En ambas opciones tenemos un apartado común: Archivo con el botón Examinar. Entonces aparecerá la ventana siguiente:

Esta ventana tiene cuatro partes:

2. Nombre de archivo: es el campo donde se especifica el nombre del fichero donde están almacenados los datos.

3. Archivos de tipo: se utiliza para especificar el tipo del fichero que se vaya a leer. Al pinchar en el símbolo t de dicho campo aparece un menú con los tipos de ficheros que puede leer el SPSS:

4. Buscar en: En este campo figura la estructura de subdirectorios de la unidad especificada en el campo Unidades de este menú.

5. Unidades: Este campo se utiliza para especificar la unidad donde se encuentra el fichero de datos. Al pinchar en el símbolo t de dicho campo aparece un menú con las unidades disponibles.

Formato Fijo:

spss7


Si el formato de archivo que se ha seleccionado es el Fijo, aparecerá la siguiente ventana:


Esta ventana que se utiliza para introducir el code book de las variables y tiene los siguientes campos:

· Nombre: corresponde al nombre que se quiere dar a la variable

· Registro: corresponde al número de registro o línea a partir de la cual se encuentra la variable (muy bueno en caso de que los nombres de las variables correspondan a la primera fila del fichero).

· Columna inicial: corresponde al número de columna en la que empieza la variable

· Columna final: corresponde al número de columna en la que termina la variable, sólo es necesario especificarlo si es distinta a la columna inicial

· Tipo de datos: aquí se especifica el tipo de valores que contiene la variable. Los tipos de datos disponibles se obtiene al pinchar en el símbolo a la izquierda de dicho campo.

· Valor asignado a espacios en blanco para variables numéricas: Este campo se utiliza para definir los espacios en blanco: si se selecciona Perdido por el sistema los espacios en blanco se tratan como missing. Si se selecciona Valor los espacios en blanco se sustituyen por el valor especificado.

Una vez que se han especificado los campos anteriores, pinchar en el botón Añadir. Entonces, estos valores se almacenan en el campo Variables definidas: el primer valor corresponde al registro en el que está la variable, el segundo y tercero corresponde a la columna inicial y final que ocupan los valores de la variable en el fichero de datos, y por último figura el nombre que se ha dado a la variable. A partir de este momento, ya se activa el botón de Borrar y el de Cambiar

FORMATO LIBRE:

Si el formato de archivo que se ha seleccionado es el Libre, aparecerá la siguiente ventana:

spss8

Esta ventana que se utiliza para introducir el code book de las variables y tiene los siguientes campos:

· Nombre: corresponde al nombre que se quiere dar a la variable

· Tipo de datos: aquí se selecciona el tipo de valores que contiene la variable. En este caso (con formato libre), sólo se pueden especificar 2 tipos de valores: Numéricos cuando la variable contiene datos numéricos, y Cadena cuando la variable contiene datos alfanuméricos en cuyo caso se especificará el número de columnas que ocupa.

Una vez que se han especificado los campos anteriores, pinchar en el botón Añadir. Entonces, estos valores se almacenan en el campo Variables definidas: A partir de este momento, se activa el botón de Borrar y el de Cambiar

4.2. LECTURA DE OTRO TIPO DE FICHERO DE DATOS

Cuando el fichero de datos procede del SPSS, o de una base de datos, o de una hoja de cálculo, este contendrá además de la matriz de datos, la definición de las variables. En este caso se procederá de la siguiente forma: con el ratón se pincha en el menú Archivo, donde se selecciona la opción Abrir, y dentro de ésta se selecciona la opción Archivo de tipo...

Aquí se especificará el nombre del fichero de datos, el "lugar " en el que se encuentra, y el tipo de archivo , y después se pincha en el botón Aceptar . Entonces los datos aparecen el la ventana de Datos nuevos, y ya se puede proceder a realizar el análisis estadístico que se desee.

Última modificación: jueves, 7 de junio de 2018, 07:39