jueves, 17 de diciembre de 2015

Convertir tipo de variable

Los comandos destring/tostring permiten pasar variables numéricas a variables de cadena y variables de cadena a variables numéricas.

destring
Para pasar variables de cadena a variables numéricas.

Por sintaxis:

destring var2, replace
- Este comando convertirá los valores de la variable var2 que son de cadena a valores numéricos

destring var2, generate(var2_numerico) 
- Este comando generará una variable var2_numerico con los valores de la variable var2 en valores numéricos

Por menú:
Data/ Create o change data/ Other variable-transformation commands/convert string variables to numeric variables

La ventana de menú destring nos permite algunas opciones como convertir valores a missing, convertir variables porcentuales a fraccionales y tratar las comas como decimales.

 




















tostring  
Para pasar variables numéricas a variables de cadena.

Por sintaxis:

tostring var1, replace
- Este comando convertirá los valores de la variable var1 que son numéricos a valores
de cadena

tostring var1, generate(var1_cadena)
- Este comando generará una variable var1_cadena con los valores de la variable var1 en valores de cadena

Por menú:
Data/ Create o change data/ Other variable-transformation commands/convert numeric variables to string variables

La ventana de menú tostring nos permite algunas opciones como forzar la conversión ignorando los valores perdidos y elegir el formato de los valores de cadena resultantes. 

 


Fusión de archivos

Para realizar fusión de variables utilizo dos comandos que nos permiten fusionar baes de datos, merge y append :

merge  
Este comando nos permite añadir variables a un mismo grupo de observaciones. 
Es decir, añade una o más columnas a una matriz. 
Para poder añadir estas variables es necesario tener una variable clave que permita ser el nexo entre una matriz y otra. Esta variable debe tener la misma codificación en cada archivo.

El resultado de merge, es una matriz con todas las variables.
Además, produce un resultado _merge:
Si _merge = 3 entonces se fusionaron los archivos
Si _merge = 1 ó 2 entonces no se fusionaron los archivos

Teniendo abierto el Archivo de datos 1 e identificada la variable clave, la manera más sencilla de realizar esta operación es:
merge 1:1 var_clave using "C:\..." (Ruta de acceso al archivo 2) 

Se llega por menú a través de:  Data/combine datasets/ Merge two datasets


append  
Este comando nos permite añadir observaciones a un mismo grupo de variables. 
Es decir, añade una o más filas a una matriz. 
Para poder añadir estas observaciones es necesario tener las variables con el mismo nombre.

El resultado de append , es una matriz con todas las variables y observaciones.

Teniendo abierto el Archivo de datos 1 la manera más sencilla de realizar esta operación es:
append using "C:\..." (Ruta de acceso al archivo 2) 

Se llega por menú a través de:  Data/combine datasets/ Append datasets

Gráficos de cajas

Lo hacemos con el comando Boxplot
Puedo hacer un gráfico de cajas desde la sintaxis:
Ejemplos Boxplot de la variable var1
graph box var1

A través del menú:
Graphics/Box plot

 En las pestañas de la ventana Boxplot puedo escribir el nombre del título del gráfico (Titles) así como los títulos del eje y.
También puedo establecer condiciones que las variables deban cumplir para estar en el boxplot en if/in.
Podemos realizar más de un boxplot de una variable 1 según las categorías de una variable 2 en Categories.

Resultando un gráfico de cajas de la variable 1 según la variable 2 categórica (Si/No) 





La sintaxis de este gráfico fue:
graph box var1, over(var2) title(Título del gráfico de caja de la variable 1)

Gráficos de barras

Lo hacemos con el comando Histograma

Puedo hacer un histograma desde la sintaxis:
Ejemplos:
Histograma de la variable var1 que es discreta
histogram var1, discrete

Con etiquetado
histogram var1, discrete xlabel (1 2 3 4, valuelabel)

A través del menú:
Graphics/Histogram 

En las pestañas de la ventana Histogram puedo escribir el nombre del título del gráfico (Titles) así como los títulos de los ejes x e y.
También puedo establecer condiciones que las variables deban cumplir para estar en el histograma en if/in.

 
Resultando un gráfico de barras de la variable 1 continua en 5 (tramos) cortes:

La sintaxis de este gráfico fue:
histogram var1, bin(10) xtitle(Nombre de la variable var1) title(Título del gráfico de la variable 1)



Algunos comandos básicos


BROWSE

Es el visualizador de toda la base de datos

Además, en browse puedo filtrar con el embudo

O por sintaxis visualizar solamente algunas variables usando:
browse var1 var2

También podemos visualizar con alguna condición:
 browse var1 var2 if var2 > x

Ejemplo:

Si quiero los primeros 5 casos browse var1 in 1/5

Si quiero los últimos 5 casos browse var1 in -5/-1


NOTAS


Este comando permite visualizar las notas de la base

Para agregarle una nota a una variable:

notes var1: escribolanota



SUMMARIZE


Es un comando útil para variables cuantitativas
Puedo ir desde el menú: data/describe data/summary statistics

O a través de la sintaxis
summarize var1 var2 var3, detail (si quiero con detalles)


MISSTABLE


Permite conocer si existen valores faltantes:
misstable sum

Cuando unas variable var1 tiene faltantes

Puedo pedirle que me liste otra variable (var2) si la varible var1 tiene faltantes:

list var2 var1 if var1 == .

ó

list var2 var1 if misssing(var1)

domingo, 13 de diciembre de 2015

Renombrar y rotular

Una vez creada una variable, es posible modificar su nombre y adjudicarles etiquetas a la variable y/o a su valores.

Comando rename

Rename es un comando muy sencillo y útil para modificar el nombre de una variable. Simplemente se debe escribir la sintaxis rename, seguido por el nombre de la variable y luego por el nuevo nombre que se le desea asignar:

          rename mold_varnae new_varname
 
Comando label variable

Con frecuencia, al trabajar con una base de datos, no queremos modificar el nombre de una variable sino rotularla, asignarle una etiqueta que nos permita interpretar su significado. Para ello, debemos escribir el comando label variable, el nombre de la variable y entre comillas el nombre de la etiqueta:

         label variable varname ["label"]

Como ocurre en general en STATA, no hay un único modo de hacer las cosas, por lo cual es posible también renombrar las variables o rotularlas mediante el cuadro Propiedades ubicado abajo a la derecha de la pantalla principal, luego de desbloquearlo presionando sobre el candado. 

Al igual que todo lo que se realiza desde el menú, las modificaciones que aquí se hagan también producirán una sintaxis.

 

Estas acciones también se pueden realizar desde el Variables Manager:



Comando label define y label values


Las categorías de las variables categóricas también pueden tener etiquetas y, para ello, es necesario realizar dos pasos. En primer lugar, es preciso crear las etiquetas, asignando a cada categoría un rótulo y especificando un nombre para este grupo de etiquetas.

Como en otros casos, es posible hacer esto mediante la sintaxis:

        label define nombreetiqueta 1 "etiqueta1" 2 "etiqueta2" , etc.

O mediante el menú, en este caso, a través del Manage Value Labels:

 

En segundo lugar, es necesario vincular el sistema de etiquetas creado con una o más variables. Nuevamente, es posible realizar esta acción mediante la sintaxis o a través del menú.

En la sintaxis utilizamos el comando label values, seguido por el nombre de la/s variable/s y luego el nombre de la etiqueta:

        label values nombrevariable nombreetiqueta

Para asignar un sistema de etiquetas a una variable desde el menú, utilizamos el cuadro Propiedades o el Variables Manager, ambas ventanas ya presentadas.


Siguiendo estos procedimientos, es posible y sencillo trabajar con bases de datos ordenadas y claras, lo que permitirá un trabajo más fácil y seguro.