Guia de Stata 2

download Guia de Stata 2

of 37

Transcript of Guia de Stata 2

  • 7/29/2019 Guia de Stata 2

    1/37

    Bioestadstica

    Gua para el Alumno

    Stata 8.0

  • 7/29/2019 Guia de Stata 2

    2/37

    Bioestadstica

    SEMANA I - ASPECTOS GENERALES

    I. Introduccin y manejo bsico de Stata

    A. Elementos bsicos (obtener ayuda, salir)

    Stata 8 presenta formato de mens como de ventanas, estas cuatro ventanas llamadasReview, Variables, Stata Results y Stata command. Si maneja Stata 8 con comandos, estos se

    tipean en la ventana Stata command, y los resultados aparecen en la ventana Stata Results. La

    ventanaReview registra comandos utilizados previamente, los cuales pueden ser reenviados a

    la ventana de Stata commandclickeando sobre ellos. Para obtenerayuda, clickee en el men

    Reviewacumula comandos anteriores, loscuales pueden ser reenviados a la ventanade Stata commandclickeando sobre ellos

    Variables, presenta las variablesde base de datos en uso.

    Stata Result, muestra los corridas de

    aplicar comandos en Stata

    Stata se maneja con comandos, los cuales

    se tipean en la ventanaStata command

  • 7/29/2019 Guia de Stata 2

    3/37

    Bioestadstica

    la opcion Help y siga las instrucciones en pantalla. Para terminar la sesin, cierre el programaclickeando en el botn superior derecho (como cualquier otro programa Windows).

    El programa Stata 8 nos presenta una variedad de iconos, que pueden agilizar el

    manejo y anlisis de una base de datos.

    Para abrir un archivo, use.

    Para guardar archivo que se encuentra en memoria, save

    Para poder imprimir un archivo, print

    Para crear un archivo que guarde bitcoras del Stata Results, log

    Para crear un archivo que guarde programas de ventanaReview, do

    Para abrir ventana de edicin de base de datos, edit

    Para visualizar base de datos en uso, browse

    COMANDO DESCRIPCION

    help Ayuda de programa stata, para comandos.log Uso de archivos de bitcora

    use Abrir una base de datos en stata (extensin .dta)edit Ingreso de datos por medio de ventana de Stata Editorcodebook Muestra variables con estadsticos descriptivosdescribe Describe contenido de datos en memoria o sobre el disco

    Copiar y pegar datos de MS Excel

    save Guarda los datos en disco con extensin *.dtalist Lista de valores de variable

    ... if ...Selecciona observaciones cumpliendo cierta condicion para laejecucion del comando

    drop Borrar variable o dato en memoria

    keep Borra variables o datos no seleccionadoslabel variable Comando de etiqueta de variableslabel define Primer paso para etiquetar valores de una variablelabel values Segundo paso para etiquetar valores de una variable

    Demostracin y explicacin de los comandos de Stata

    En Stata la sintaxis de los comandos es la siguiente:

  • 7/29/2019 Guia de Stata 2

    4/37

    Bioestadstica

    comandolista de variables [ifexpression] [inexpression], [opciones]

    help. Para obtener ayuda de parte del programa stata 8

    Para opciones generales del comando

    . help

    Para ayuda sobre contenido general del uso en stata

    . help contents

    Para ayuda sobre el comando list

    . help list

    log. El siguiente comando nos permite guardar las bitcoras realizadas en el analisis dedatos, en un archivo con la extensin mas adecuada para el usuario.

    . log using "C:\DATA\clase1.txt", text

    ---------------------------------------------------------------------------------------

    log: C:\DATA\clase1.txt

    log type: text

    opened on: 2 Jun 2003, 13:22:48

    use

    Para el uso de la base de datos cancer.dat, escribiremos el comando use, usando ademas la opcinclear, que nos permite cargar la base de datos en memoria aun teniando en uso otra base de datosy guardando los cambio cargados en memoria realizados en esta ultima

    use "C:\Stata\cancer.dta", clear(Patient Survival in Drug Trial)

    edit

    Para ingresar los datos por medio de una ventana tipo hoja de calculo utilizamos el comando edit,

    el cual apertura una ventana de ingreso de datos

    editAl terminar de ingresardatos haga click en el icono

    preserve para no perder el

    ingreso de datos realizado

  • 7/29/2019 Guia de Stata 2

    5/37

    Bioestadstica

    codebookEste comando muestra una lista de las variables sealando el tipo de variable, su rango,

    frecuencias en caso de una variable cualitativa (codificada) media, desviacin estandar y

    percentiles en caso fuera una variable continua.

    Use C:\Stata8\auto.dta, clearcodebookuse "C:\Stata8\auto.dta", clearmpg Mileage (mpg)---------------------------------------------------------------------------------------

    type: numeric (int)range: [12,41] units: 1

    unique values: 21 missing .: 0/74mean: 21.2973

    std. dev: 5.7855percentiles: 10% 25% 50% 75% 90%

    14 18 20 25 29

    rep78 Repair Record 1978---------------------------------------------------------------------------------------

    type: numeric (int)range: [1,5] units: 1

    unique values: 5 missing .: 5/74tabulation: Freq. Value

    2 18 2

    30 318 411 5

    describeEste comando muestra una lista de las variables de la base de datos en uso.

    . describe

    Contains data from miarchi.dta

    obs: 3

    vars: 3 5 Nov 2002 12:35

  • 7/29/2019 Guia de Stata 2

    6/37

    Bioestadstica

    size: 102 (99.9% of memory free)

    -------------------------------------------------------------------------------

    storage display value

    variable name type format label variable label

    -------------------------------------------------------------------------------

    name str20 %20s

    age float %9.0g

    sex str6 %9s

    -------------------------------------------------------------------------------

    Sorted by:

    Copiar de una hoja excel datos a Stata 8

    El programa Stata 8 tiene la facilidad de copiar los datos de una hoja de excell con simplesopciones de copiar y pegar que se utilizan en windows, antes teniendo la ventana de edit activada

    en Stata 8.

    1. Edit, stata82. Cambio de ventana a excell

    3. Seleccionar datos a ser copiados y hacer clic en icono de copiar, ctrl. + C4. cambiar de ventana edit de Stata 85. Hacer clic en icono de pegar, ctrl + V

    savePara guardar datos que se han ingresado

    save miarchi

  • 7/29/2019 Guia de Stata 2

    7/37

    Bioestadstica

    Si no se muestra el directorio donde estara el archivo, por defecto se guarda el archivo en el

    directorio C:\Data. Si el archivo ya habia sido creado anteriormente y se han ingresado datosnuevamente se utiliza la opcion replace

    save miarchi, replace

    list. Presenta los valores de las variables. Si no presenta variables con el comando list, sepresentaran los valores de todas las variables

    use "C:\Stata\auto.dta", clear

    list drug age

    drug age

    1. 1 39

    2. 1 66

    3. 1 704. 1 44

    5. ... ...

    6. ... ...7. ... ...

    ifal final de un orden significa usar slo los datos especificados. ifes permitido con la mayorade los comandos de Stata.

    list drug age if age > 45

    drug age

    2. 1 66

    3. 1 709. 1 48

    11. 1 63

    14. 1 64

    drop. Borra variables valores seleccionados.

    drop variable

    De inmediato desaparece de ventana de variables en memoria

    keep. Borra variables o valores no seleccionados.

    keep variable

    label, sirve para etiquetar datos, variables y valores.

  • 7/29/2019 Guia de Stata 2

    8/37

    Bioestadstica

    label variable age "edad del paciente"

    describe agestorage display value

    variable name type format label variable label

    -------------------------------------------------------------------------------age int %8.0g edad del paciente

    label define. Es utilizado como un primer paso para el etiquetar valores de variables seleccionada

    label define drogas 1 Megacilina 2 Tetracicilna 3 Oxacilina 4 Penicilina

    label values. Es utilizado como segundo paso para el etiquetar valores de variables seleccionada

    label values drug drogas

  • 7/29/2019 Guia de Stata 2

    9/37

    Bioestadstica

    Exploracin y presentacin de datos.

    generate Genera variablereplace Reemplaza valores de variable bajo alguna condicinmerge Ingresa variables o casos de una base patrn a otra

    collapse Calculo de estadsticos descriptivos para variables cuantitativassummarize Anlisis para variable cuantitativa, media, mediana, etctabulate Tabla de frecuencias para variables cualitativastable Tabla de frecuencias simples para variables cualitativasgraph Crea un grafico de cualquier variablescatter Genera grafico de dispersin entre 2 variablesboxplots Grafico de cajasbar Grafico de barraslines Grafico de lineasstacked bar Grafico de barras apiladas

    meanGrabar y editar review.

    Uso del editor de programas (archivo .do)

    Variables:

    Variables Cuantitativas

    o Variable Discretas

    o Variable continuas

    Variables Cualitativas

    o Variable nominal

    o Variable ordinal

    Demostracin y explicacin

    Definicin de tipos de datos, presentacin de datos en tablas de contingencia y resumen,

    presentaciones grficas diversas. Estadstica descriptiva simple: medidas de tendencia central y

    dispersin. Uso de archivos de bitcora (log),

    1. Para el analisis de las variables numericas tenemos el comando summarize, el cual calculaestadisticos de tendencia central, asi como de distribucion.

    Entonces trabajando con el archivo de c:\stata\cancer.dta, tenemos

    generate. Genera una variable que va a ser recodificada , por ejemplo si tenemos en uso elarchivo cancer (c:\stata\cancer.dta) y queremos recodificar la variable age en una nueva variable

    age1 que contenga los intervalos de edad 45-50 51-55 56-60 61a+. Entonces seguimos lospasos correspondientes para el ejemplo

  • 7/29/2019 Guia de Stata 2

    10/37

    Bioestadstica

    Para abrir el archivo canceruse c:\stata\cancer.dta, clear

    Generando la variable age1 con valores iguales a age

    generate age1 = age

    Para reemplazar valores en la nueva variable age1, utilizamos el comando replace, if yoperadores logicos y de relacion

    replace age1 = 0 if age 50 & age 55 & age 60

    . replace age1 = 0 if age 50 & age 55 & age 60(11 real changes made)

    summarize. El presente comando es una opcin para obtener estadsticosdescriptivos para variables cuantitativas.

    . summarize age

    Variable | Obs Mean Std. Dev. Min Max-------------+-----------------------------------------------------

    age | 48 55.875 5.659205 47 67

    . summarize studytime age

    Variable | Obs Mean Std. Dev. Min Max-------------+-----------------------------------------------------studytime | 48 15.5 10.25629 1 39

    age | 48 55.875 5.659205 47 67

    . summarize age, detail

    Patient's age at start of exp.

    -------------------------------------------------------------

    Percentiles Smallest

    1% 47 47

    5% 48 48

  • 7/29/2019 Guia de Stata 2

    11/37

    Bioestadstica

    10% 49 48 Obs 48

    25% 50.5 49 Sum of Wgt. 48

    50% 56 Mean 55.875

    Largest Std. Dev. 5.659205

    75% 60 65

    90% 65 67 Variance 32.0266

    95% 67 67 Skewness .316106699% 67 67 Kurtosis 2.125197

    Para generar estadsticos para una determinada variable cuantitativa, necesitamos colocar losestadisticos sobre un parentecis

    merge. El comando nos ayuda a unir informacin entre bases de datos relacionadas.

    Ejemplo: uno a uno merge

    . use ds1

    . merge using ds2

    collapse. Reporta estadsticas sobre tendencia central.

    El siguiente ejercicio muestra como se podra solicitar las estadsticas descriptivas.

    collapse (mean) age (median) systolic, by (drug)

    tabulate. Para trabajar variables cualitativas como factores, sexo, grupos de edad, etc

    . tabulate drug

    Drug type |

    (1=placebo) | Freq. Percent Cum.

    ------------+-----------------------------------

    1 | 20 41.67 41.67

    2 | 14 29.17 70.83

    3 | 14 29.17 100.00

    ------------+-----------------------------------

    Total | 48 100.00

    Freq, representa al numero pacientes por tipo de droga que se recet, percent, el porcentaje depacientes que fue tratado por algn tipo de droga. Cum., el porcentaje acumulado.

    tabulate died, summarize( age)

    1 if | Summary of Patient's age at start

    patient | of exp.

  • 7/29/2019 Guia de Stata 2

    12/37

    Bioestadstica

    died | Mean Std. Dev. Freq.

    ------------+------------------------------------

    0 | 54.176471 5.4340971 17

    1 | 56.806452 5.6475325 31

    ------------+------------------------------------

    Total | 55.875 5.6592045 48

    Table. Este comando calcula frecuencias simple, adems puede calcular otros estadsticosealados por el usuario, utilizando la opcin contents

    . table drug, contents (mean age)

    ----------------------

    Drug Used | mean(age)

    ----------+-----------

    1 | 46.6

    2 | 45.6667

    3 | 46.6667

    4 | 42.1875----------------------

    Para poder realizar grficos tenemos el comando graph, y sus diferentes variedades segn el tipode grfico que se quiere realizar.

    Histograma

    Ejemplo:

    histogram age

    Fraction

    Patient's age at start of exp.47 67

    0

    .3125

    Automticamente el programa Stata8 divide el grafico en 5 barras, depende del usuario el numero

    de intervalos que se desean obtener, esto utilizando la opcin bi {graph age, bi(7) }.

    Grafico de dispersin

    scatter studytime age

  • 7/29/2019 Guia de Stata 2

    13/37

    Bioestadstica

    Grafico de cajas

    graph box age, over(drug)

    Monthstodeathorendofexp.

    Patient's age at start of exp.47 67

    1

    39

    47

    67

    Patient's age at start of exp.

    1 2 3

  • 7/29/2019 Guia de Stata 2

    14/37

    Bioestadstica

    Grafico de Linea

    line birthrt year

    do.Archivo donde se archivan los programas ejecutados en sesin de Stata, para ello debemos hacerclic en la parte superior derecha de la ventana de Review y hacer clic en la opcin Save Review

    Contents.

    livebirthsper1000women

    year194019431946194919521955195819611964196719701973197619791982198519881991

    6.60003

    45.1002

  • 7/29/2019 Guia de Stata 2

    15/37

    Bioestadstica

    SEMANA II DESCRIPCIN DE DATOSBases de Datos

    Inteligencia.dta

    Base de datos referida a investigacin sobre la relacin entre la desnutricin crnica (talla para la

    edad) y rendimiento intelectual del menor

    Para observar que tipo de variables se trabajan en esta base de datos utilizaremos el comando

    coodebok

    use "C:\inteligencia.dta", clear

    . codebook

    sex Sex 0=F 1=M

    ------------------------------------------------------------------------------type: numeric (byte)

    range: [0,1] units: 1unique values: 2 missing .: 0/143

    ------------------------------------------------------------------------------tester Psych Tester------------------------------------------------------------------------------

    range: [1,6] units: 1unique values: 6 missing .: 0/143

    ------------------------------------------------------------------------------wtotal WISC Total------------------------------------------------------------------------------

    range: [55,128] units: 1unique values: 49 missing .: 0/143

    ------------------------------------------------------------------------------grade_n GRADE LEVEL NUMERIC------------------------------------------------------------------------------

    range: [2,5] units: 1unique values: 4 missing .: 3/143

    ------------------------------------------------------------------------------haz1999 Height-for-age Z-score 1999------------------------------------------------------------------------------

    range: [-3.48,1.17] units: .01unique values: 114 missing .: 0/143

    ------------------------------------------------------------------------------edutype SCHOOL TYPE 1=PUBLIC 2=PRIVATE 3=ATTENDED BOTH------------------------------------------------------------------------------

    range: [1,3] units: 1unique values: 3 missing .: 2/143

    ------------------------------------------------------------------------------eduback EVER BEEN HELD BACK IN SCHOOL 1=YES 2=NO------------------------------------------------------------------------------

    range: [1,2] units: 1unique values: 2 missing .: 2/143

  • 7/29/2019 Guia de Stata 2

    16/37

    Bioestadstica

    ------------------------------------------------------------------------------momedu MATERNAL EDUCATION 1=NONE 2=PI 3=PC 4=SI 5=SC 6=SUPERIOR 7=TECHNICAL------------------------------------------------------------------------------

    range: [1,7] units: 1unique values: 7 missing .: 2/143

    ------------------------------------------------------------------------------dadedu PATERNAL EDUCATION 0=UNKNOWN 2=PI 3=PC 4=SI 5=SC 6=SUPERIOR 7=TECHNICAL

    ------------------------------------------------------------------------------range: [0,7] units: 1

    unique values: 7 missing .: 2/143

    Malaria.dta

    Base de datos con el objetivo de determinar cuales con los factores de riesgoque condicionan la no adherencia a tratamiento antimalarico

    . use "C:\Marco C\stata_group\curso de stata\bses\malaria.dta", clear

    . codebook

    ------------------------------------------------------------------------------edad Edad del paciente------------------------------------------------------------------------------

    range: [9,80] units: 1unique values: 49 missing .: 0/125

    ------------------------------------------------------------------------------personal Personal de salud que atendio al paciente------------------------------------------------------------------------------

    range: [1,5] units: 1unique values: 4 missing .: 1/125

    tabulation: Freq. Numeric Label1 1 practicante62 3 tcnico de enfermeria43 4 enfermera18 5 mdico1 .

    ------------------------------------------------------------------------------malapf Ha tenido anteriormente malaria por Plasmodium falciparum?------------------------------------------------------------------------------

    range: [1,3] units: 1unique values: 3 missing .: 0/125

    tabulation: Freq. Numeric Label46 1 Si65 2 No14 3 no tuvo malaria

    ------------------------------------------------------------------------------

    dos_qkg Dosis de quinina segun kg------------------------------------------------------------------------------

    range: [0,2] units: 1unique values: 3 missing .: 1/125

    tabulation: Freq. Numeric Label3 0 Subdosis

    106 1 Correcto15 2 Sobredosis1 .

  • 7/29/2019 Guia de Stata 2

    17/37

    Bioestadstica

    ------------------------------------------------------------------------------dos_tkg Dosis de Tetraciclina segun kg------------------------------------------------------------------------------

    range: [0,2] units: 1unique values: 3 missing .: 1/125

    tabulation: Freq. Numeric Label4 0 Subdosis

    115 1 Correcto5 2 Sobredosis1 .

    ------------------------------------------------------------------------------cumfinal Cumplimiento de toma de pastillas en

    todo el periodo de tratamiento------------------------------------------------------------------------------

    range: [1,2] units: 1unique values: 2 missing .: 0/125

    tabulation: Freq. Numeric Label90 1 Cumplio35 2 No cumplio

    ------------------------------------------------------------------------------

    eess (unlabeled)------------------------------------------------------------------------------

    range: [1,4] units: 1unique values: 4 missing .: 0/125

    Neumona.dta

    . use "C:\Neumonia.dta", clear

    . codebook

    ------------------------------------------------------------------------------tipo caso------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 0/193

    tabulation: Freq. Numeric Label128 0 control65 1 caso

    ------------------------------------------------------------------------------edad2 edad------------------------------------------------------------------------------

    range: [0,2] units: 1unique values: 3 missing .: 0/193

    tabulation: Freq. Numeric Label73 0 mayor 1 ao94 1 2 a 11 meses26 2 menor 2 meses

    ------------------------------------------------------------------------------desnutri desnutrici------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 2/193

  • 7/29/2019 Guia de Stata 2

    18/37

    Bioestadstica

    tabulation: Freq. Numeric Label177 0 no14 1 si2 .

    ------------------------------------------------------------------------------antibio1 recibio tto antibitico------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 0/193

    tabulation: Freq. Numeric Label139 0 si54 1 no

    ------------------------------------------------------------------------------hospital (unlabeled)------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 0/193

    tabulation: Freq. Numeric Label91 0 si102 1 no

    ------------------------------------------------------------------------------estable1 fue llevado a establecimiento salud------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 0/193

    tabulation: Freq. Numeric Label146 0 si47 1 no

    ------------------------------------------------------------------------------completo (unlabeled)------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 11/193

    tabulation: Freq. Numeric Label124 0 si58 1 no11 .

    ------------------------------------------------------------------------------fajaba (unlabeled)------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 1/193

    tabulation: Freq. Numeric Label40 0 no152 1 si1 .

    ------------------------------------------------------------------------------

    pesonuev (unlabeled)------------------------------------------------------------------------------

    range: [0,1] units: 1unique values: 2 missing .: 0/193

    tabulation: Freq. Numeric Label173 0 no bajo peso al nacer20 1 bajo peso al nacer

  • 7/29/2019 Guia de Stata 2

    19/37

    Bioestadstica

    Tabaco.dta

    . use "C:\tabaco.dta", clear

    . codebook

    ------------------------------------------------------------------------------id_regregines------------------------------------------------------------------------------

    range: [1,4] units: 1unique values: 4 missing .: 0/2458

    tabulation: Freq. Numeric Label584 1 lima metropolitana693 2 resto costa624 3 sierra557 4 selva

    ------------------------------------------------------------------------------

    inf_sexo inf_sexo------------------------------------------------------------------------------

    range: [1,2] units: 1unique values: 2 missing .: 0/2458

    tabulation: Freq. Value1061 11397 2

    ------------------------------------------------------------------------------inf_edad inf_edad------------------------------------------------------------------------------

    range: [12,64] units: 1unique values: 53 missing .: 0/2458

    ------------------------------------------------------------------------------p35 cul es el nivel de educacin alcanzado por ud.?------------------------------------------------------------------------------

    range: [1,10] units: 1

    unique values: 10 missing .: 0/2458examples: 5 secundaria incompleta

    5 secundaria incompleta6 secundaria completa8 superior no universitario completa

    ------------------------------------------------------------------------------p47_a siente ud. qu puede contar con su familia cuando tiene

    dificultades o preocupa------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 5 missing .: 0/2458

    tabulation: Freq. Numeric Label177 1 no487 2 a veces440 3 casi siempre

    1348 4 siempre6 88 no sabe

  • 7/29/2019 Guia de Stata 2

    20/37

    Bioestadstica

    ------------------------------------------------------------------------------p47_b se rene con su familia para conversar sobre logros

    personales y familiares?------------------------------------------------------------------------------

    range: [1,88] units: 1

    unique values: 5 missing .: 0/2458tabulation: Freq. Numeric Label

    251 1 no652 2 a veces488 3 casi siempre

    1058 4 siempre9 88 no sabe

    ------------------------------------------------------------------------------p47_c se rene con su familia para conversar sobre dificultades

    personales y familiar------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 5 missing .: 0/2458

    tabulation: Freq. Numeric Label295 1 no697 2 a veces488 3 casi siempre966 4 siempre12 88 no sabe

    ------------------------------------------------------------------------------p47_d su familia discute violentamente, es decir, con agresiones verbales?------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 5 missing .: 0/2458

    tabulation: Freq. Numeric Label1581 1 no725 2 a veces69 3 casi siempre77 4 siempre6 88 no sabe

    ------------------------------------------------------------------------------p47_e las decisiones importantes se toman en conjunto aqu en casa?------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 5 missing .: 0/2458

    tabulation: Freq. Numeric Label288 1 no406 2 a veces550 3 casi siempre

    1201 4 siempre

    13 88 no sabe------------------------------------------------------------------------------p47_f al momento de tomar decisiones importantes, su familia toma encuenta sus opini------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 5 missing .: 0/2458

    tabulation: Freq. Numeric Label225 1 no487 2 a veces

  • 7/29/2019 Guia de Stata 2

    21/37

    Bioestadstica

    477 3 casi siempre1263 4 siempre

    6 88 no sabe------------------------------------------------------------------------------p47_g su familia muestra inters por sus sentimientos y afectos?------------------------------------------------------------------------------

    range: [1,88] units: 1

    unique values: 5 missing .: 0/2458tabulation: Freq. Numeric Label

    179 1 no297 2 a veces421 3 casi siempre

    1541 4 siempre20 88 no sabe

    ------------------------------------------------------------------------------p47_h siente que su familia lo/la quiere?------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 5 missing .: 0/2458

    tabulation: Freq. Numeric Label

    119 1 no131 2 a veces242 3 casi siempre

    1950 4 siempre16 88 no sabe

    ------------------------------------------------------------------------------p47_i se renen en familia para compartir momentos juntos por lo menos

    una vez por se------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 5 missing .: 0/2458

    tabulation: Freq. Numeric Label240 1 no610 2 a veces485 3 casi siempre

    1114 4 siempre9 88 no sabe

    ------------------------------------------------------------------------------p58 cundo fue la primera vez que ud. Fum cigarrillos?------------------------------------------------------------------------------

    range: [1,4] units: 1unique values: 4 missing .: 0/2458

    tabulation: Freq. Numeric Label19 1 durante los ltimos 30 das61 2 hace ms de un mes pero menos de

    un ao1576 3 hace ms de un ao

    802 4 nunca ha fumado------------------------------------------------------------------------------p59 qu edad tena ud. cuando fum cigarrillos por primera vez?------------------------------------------------------------------------------

    range: [6,88] units: 1unique values: 43 missing .: 802/2458

    examples: 161825.

  • 7/29/2019 Guia de Stata 2

    22/37

    Bioestadstica

    ------------------------------------------------------------------------------p85 en su grupo de amigos ms cercanos, con qu frecuencia toman bebidas

    alcohlica------------------------------------------------------------------------------

    range: [1,9] units: 1

    unique values: 9 missing .: 1/2458tabulation: Freq. Numeric Label

    18 1 todos los das501 2 los fines de semana112 3 algunos das de la semana79 4 los fines de semana198 5 algunas veces al mes

    1124 6 solo en ocaciones especiales4 7 otro

    392 8 no toman bebidas alcohlicas29 9 no tiene amigos1 .

    ------------------------------------------------------------------------------

    p86 de acuerdo a lo que ud. conoce en su barrio, cmo es el consumo debebidas alco

    ------------------------------------------------------------------------------range: [1,88] units: 1

    unique values: 5 missing .: 0/2458tabulation: Freq. Numeric Label

    642 1 intenso1135 2 moderado548 3 leve35 4 no consumen98 88 no sabe

    ------------------------------------------------------------------------------p87 cundo fue la primera vez que ud. Tom bebidas alcohlicas?------------------------------------------------------------------------------

    range: [1,4] units: 1unique values: 4 missing .: 0/2458

    tabulation: Freq. Numeric Label27 1 durante los ltimos 30 das78 2 hace ms de un mes pero menos de

    un ao2207 3 hace ms de un ao146 4 nunca ha consumido bebidas

    alcohlicas------------------------------------------------------------------------------p88 la primera vez que ud. tom bebidas

    alcohlicas qu tipo de bebida tom?------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 11 missing .: 146/2458

    examples: 1 cerveza malta1 cerveza malta4 vino / sangra7 otro

  • 7/29/2019 Guia de Stata 2

    23/37

    Bioestadstica

    ------------------------------------------------------------------------------p89 qu edad tena ud., cuando tom por primera vez (bebida alcohlicacirculada e------------------------------------------------------------------------------

    range: [1,88] units: 1

    unique values: 47 missing .: 146/2458examples: 14

    161821

    ------------------------------------------------------------------------------p90 con quin estaba ud. la primera vez que tom (bebida alcoholica

    circulada en------------------------------------------------------------------------------

    range: [1,88] units: 1unique values: 12 missing .: 146/2458

    examples: 3 con compaeros de trabajo4 con otro grupo de amigos

    7 con sus padres y hermanos8 con otros familiares

    ------------------------------------------------------------------------------p91 qu lo motivo a tomar (bebida

    alcoholica circulada en p-88)...por prime

    ------------------------------------------------------------------------------range: [1,88] units: 1

    unique values: 15 missing .: 146/2458examples: 3 para pasarla bien / estar en onda

    5 curiosidad5 curiosidad11 por querer esperimentar nuevas sensaciones

    ------------------------------------------------------------------------------p92 y, cundo fue la ltima vez que tom

    alguna bebida alcohlica?------------------------------------------------------------------------------

    range: [1,3] units: 1unique values: 3 missing .: 146/2458

    tabulation: Freq. Numeric Label953 1 durante los ltimos 30 das852 2 hace ms de un mes pero menos de

    un ao507 3 hace ms de un ao146 .

    ------------------------------------------------------------------------------fac_1_po factor de expansin

    ------------------------------------------------------------------------------range: [28.806734,23127.695] units: 1.000e-06

    unique values: 539 missing .: 0/2458

  • 7/29/2019 Guia de Stata 2

    24/37

    Bioestadstica

    Estadstica descriptiva intermedia.

    generate * Genera variable

    replace * Reemplaza valores de variable bajo alguna condicintabulate * Tabla de frecuencias para variables cualitativastable * Tabla de frecuencias simples para variables cualitativastab1 Produce una tabla de frecuencia para cada variable en varlisttab2 Produce todas los posibles cruces de variable de los varlisttabsum Produce tablas de estadsticas descriptivas en una dos vassummarize * Anlisis para variable cuantitativa, media, mediana, etcmeans Reporta la media aritmtica, geomtrica y armnicacentile Calcula los centiles de varlist especificados por la list en centile( )ci Calcula el error estndar e intervalos de confianza de los varlist

    cii Es la forma inmediata de cistem Grafico de tallos y hojas

    qqplotPlano de quintiles de variable1 en contraste con los quintiles devariable2

    graph (*) Crea un grafico de cualquier variableplot Produce un grafico de dispersin entre dos variablescompare Realiza un conteo de las diferencia y similitudes entre la var1 y var2inspect Proporciona un resumen rpido de una variable numrica(*) Comando que se uso en anterior clase

    tab1

    Ejemplo: Se desea generar una tabla de frecuencias para las variables sex eduback dadedu

    use "C:\inteligencia.dta", cleartab1 sex eduback dadedu

    -> tabulation of sex

    Sex 0=F 1=M | Freq. Percent Cum.------------+-----------------------------------

    0 | 67 46.85 46.851 | 76 53.15 100.00

    ------------+-----------------------------------Total | 143 100.00

    -> tabulation of eduback

    EVER BEEN |HELD BACK |

  • 7/29/2019 Guia de Stata 2

    25/37

    Bioestadstica

    IN SCHOOL |1=YES 2=NO | Freq. Percent Cum.------------+-----------------------------------

    1 | 34 24.11 24.112 | 107 75.89 100.00

    ------------+-----------------------------------Total | 141 100.00

    -> tabulation of dadedu

    PATERNAL |EDUCATION |0=UNKNOWN |2=PI 3=PC |4=SI 5=SC |6=SUPERIOR |7=TECHNICAL | Freq. Percent Cum.------------+-----------------------------------

    0 | 6 4.26 4.262 | 8 5.67 9.93

    3 | 18 12.77 22.704 | 18 12.77 35.465 | 72 51.06 86.526 | 8 5.67 92.207 | 11 7.80 100.00

    ------------+-----------------------------------Total | 141 100.00

    tab2

    Ejemplo: Se desea obtener todos los posibles cruces entre las variables sex eduback dadedu

    . tab2 sex eduback dadedu

    -> tabulation of sex by eduback

    | EVER BEEN HELD BACKSex 0=F | IN SCHOOL 1=YES 2=NO

    1=M | 1 2 | Total-----------+----------------------+----------

    0 | 16 50 | 661 | 18 57 | 75

    -----------+----------------------+----------

    Total | 34 107 | 141

    -> tabulation of sex by dadedu

    | PATERNAL EDUCATION 0=UNKNOWN 2=PI 3=PC 4=SI 5=SCSex 0=F | 6=SUPERIOR 7=TECHNICAL

  • 7/29/2019 Guia de Stata 2

    26/37

    Bioestadstica

    1=M | 0 2 3 4 5 | Total-----------+-------------------------------------------------------+----------

    0 | 2 4 12 6 33 | 661 | 4 4 6 12 39 | 75

    -----------+-------------------------------------------------------+----------Total | 6 8 18 18 72 | 141

    | PATERNAL EDUCATION| 0=UNKNOWN 2=PI 3=PC| 4=SI 5=SC 6=SUPERIOR

    Sex 0=F | 7=TECHNICAL1=M | 6 7 | Total

    -----------+----------------------+----------0 | 3 6 | 661 | 5 5 | 75

    -----------+----------------------+----------Total | 8 11 | 141

    -> tabulation of eduback by dadedu

    EVER BEEN |HELD BACK | PATERNAL EDUCATION 0=UNKNOWN 2=PI 3=PC 4=SI 5=SCIN SCHOOL | 6=SUPERIOR 7=TECHNICAL1=YES 2=NO | 0 2 3 4 5 | Total-----------+-------------------------------------------------------+----------

    1 | 0 2 4 8 16 | 342 | 6 6 14 10 56 | 107

    -----------+-------------------------------------------------------+----------Total | 6 8 18 18 72 | 141

    | PATERNAL EDUCATIONEVER BEEN | 0=UNKNOWN 2=PI 3=PCHELD BACK | 4=SI 5=SC 6=SUPERIORIN SCHOOL | 7=TECHNICAL1=YES 2=NO | 6 7 | Total-----------+----------------------+----------

    1 | 0 4 | 342 | 8 7 | 107

    -----------+----------------------+----------Total | 8 11 | 141

    tabsum

    Ejemplo: Se desea conocer las estadsticas descriptivas de la variable haz1999 por genero

  • 7/29/2019 Guia de Stata 2

    27/37

    Bioestadstica

    use "C:\inteligencia.dta", cleartabulate sex, summarize(haz1999)

    | Summary of Height-for-age Z-score| 1999

    Sex 0=F 1=M | Mean Std. Dev. Freq.------------+------------------------------------

    0 | -1.318209 .76393306 671 | -1.0518421 .91865512 76

    ------------+------------------------------------Total | -1.1766434 .85719075 143

    Ejemplo: Se desea conocer las estadsticas descriptivas de la variable haz1999por genero y tipo de escuela

    . tabulate sex eduback, summarize(haz1999)

    Means, Standard Deviations and Frequencies of Height-for-age Z-score 1999

    | EVER BEEN HELD BACK| IN SCHOOL 1=YES

    Sex 0=F | 2=NO1=M | 1 2 | Total

    -----------+----------------------+----------0 | -1.320625 -1.2946 |-1.3009091| .90374383 .7133457 | .75644661| 16 50 | 66

    -----------+----------------------+----------1 |-1.0472222 -1.0389474 |-1.0409333| .93760524 .9226373 | .91987245| 18 57 | 75

    -----------+----------------------+----------Total |-1.1758824 -1.1584112 |-1.1626241

    | .91831901 .83748067 | .85432818| 34 107 | 141

    means

    Ejemplo: Se desea obtener las medias aritmetica, geometrica y armonica de la variable haz1999

    . use "C:\inteligencia.dta", clear

    . means haz1999 sex

    Variable | Type Obs Mean [95% Conf. Interval]

    -------------+----------------------------------------------------------haz1999 | Arithmetic 143 -1.176643 -1.318345 -1.034942| Geometric 11 .3026761 .1656504 .5530494| Harmonic 11 .2014677 .116911 .7279985

    -------------+----------------------------------------------------------

    centile

    Ejemplo: Se desea conocer los centiles para los percentiles 5, 50 y 95

  • 7/29/2019 Guia de Stata 2

    28/37

    Bioestadstica

    use "C:\inteligencia.dta", clearcentile haz1999, centile(5 50 95)

    -- Binom. Interp. --Variable | Obs Percentile Centile [95% Conf. Interval]

    -------------+-------------------------------------------------------------haz1999 | 143 5 -2.578 -3.123029 -2.386474

    | 50 -1.1 -1.29 -.9526722| 95 .312 -.0852884 .5685576

    ci

    Ejemplo: Se desea obtener los intervalos de confianza al 95% de confianza de las variableshaz1999 wtotal

    use "C:\inteligencia.dta", clear. ci haz1999 wtotal

    Variable | Obs Mean Std. Err. [95% Conf. Interval]-------------+---------------------------------------------------------------haz1999 | 143 -1.176643 .0716819 -1.318345 -1.034942wtotal | 143 88.93007 1.047604 86.85916 91.00098

    cii

    Ejemplo: Se desea estimar un intervalo de confianza de la proporcin de muerte por accidentes si

    de 10 accidentes registrados 2 causaron fallecimientos.

    . cii 10 2

    -- Binomial Exact --Variable | Obs Mean Std. Err. [95% Conf. Interval]

    -------------+---------------------------------------------------------------| 10 .2 .1264911 .0252107 .5560955

    Ejemplo: Se desea calcular un intervalo de confianza en 166 observaciones, con una media de

    19509 y una desviacin estndar de 4379.

    . cii 166 19509 4379

    Variable | Obs Mean Std. Err. [95% Conf. Interval]-------------+---------------------------------------------------------------

    | 166 19509 339.8763 18837.93 20180.07

    stem

  • 7/29/2019 Guia de Stata 2

    29/37

    Bioestadstica

    Ejemplo: Se desea obtener una grafico de tallos y hojas para observar si la variable haz1999 para

    determinar su distribucin.

    use "C:\inteligencia.dta", clear. stem haz1999

    Stem-and-leaf plot for haz1999 (Height-for-age Z-score 1999)haz1999 rounded to nearest multiple of .01plot in units of .01

    -3** | 48-3** | 34-3** | 13-2** | 84-2** | 68,65-2** | 58,57,56,46,42,41-2** | 39,37,37,36,32,32,26-2** | 18,17,16,14,13,04,00,00-1** | 99,88,87,87,83,81-1** | 78,76,75,75,66,66,61,60-1** | 57,56,56,53,51,51,50,47,46,45,42,41,41-1** | 38,38,37,37,34,29,29,27,26,25,22,20-1** | 19,18,18,17,15,10,09,08,07,05,02,00-0** | 96,96,96,96,96,95,93,91,90,88,88,88,87,86,86,85,84,83,82,80,80

    -0** | 76,74,74,71,68,66,66,66,66,63,60-0** | 56,54,51,49,49,49,43,41,41,41-0** | 37,36,29,24,23,22,21-0** | 18,12,11,08,050** | 06,070** | 21,24,33,34,390** | 51,570** | 620** |1** | 17

    plot

    Ejemplo: Se desea evaluar grficamente la existencia de alguna posible asociacin entre las

    variables haz1999 y wtotal

    use "C:\inteligencia.dta", clear. plot haz1999 wtotal

    1.17 +H | *e |i |g | * * *h | * * * * *t | * *- | * * * * * * * *f | ** * * ** ****o | * * *** ** * *r | * * * ****** *** * * * ** **- | * * * * * * * * * * *a | **** * ** **** * * * *g | * * * ** * *** *

    e | * * * * * * *| * * * * * *Z | * * * * ** * *- | * * * *s | *c | *-3.48 + * *

    +----------------------------------------------------------------+

    55 WISC Total 128

    compare

  • 7/29/2019 Guia de Stata 2

    30/37

    Bioestadstica

    Ejemplo: Se desean comparar las variables haz y wtotal

    use "C:\inteligencia.dta", clear. compare haz1999 wtotal

    ---------- difference ----------count minimum average maximum

    ------------------------------------------------------------------------haz1999

  • 7/29/2019 Guia de Stata 2

    31/37

    Bioestadstica

    Revisin de los conceptos y mtodos de prueba de hiptesis. Asociacin

    csPara estudios cohorte transversal cohorte con incidencia acumulada, se

    calcula una estimacin puntual del RR asi como su intervalo de confianza.

    Realiza una prueba de hiptesis donde Ho: RR = 1

    cc Para estudios caso-control, se calcula una estimacin puntual del OR asi comosu intervalo de confianza. Realiza una prueba de hiptesis donde Ho: OR = 1

    csiRealiza el calculo de riesgos relativos colocando valores observados de una

    tabla 2x2

    cciRealiza el calculo de odds ratios colocando valores observados de una tabla

    2x2

    taboddsUsado para determinar la homogenidad de los OR en los diferentes niveles de

    la variable exposicin. Determina si existe tendencia con respecto a los OR.Realiza

    mhoddsSe utiliza para calcular odds ratios cuando la variable exposicin tiene mas de

    dos niveles. Ademas calcula estadstico de Mantel _ Haenzel

    csEste comando es usado para estudio de cohorte transversal cohorte, donde tenemos un grupoexpuesto y grupo no expuesto, adems podemos incorporar variables de ajuste bajo la opcion by,

    para calcular RR en cada uno de los grupos. Una nota importante en este calculo es que la

    variable exposicin tiene que estar codificado como 0 y 1.

    Trabajaremos con la base de datos del estudio de adherencia del tratamiento a la enfermedad de

    malaria, donde el objetivo de la investigacin es determinar los RR para la incidencia

    proporcin de no adherencia a tratamiento antimalarico para la variable exposicin (Dosis) .

    Donde nuestra hiptesis nula es:

    La exposicin de dosis mal administrada presenta un RR = 1 respecto de la no adherencia al

    tratamiento

    Entonces para abrir la base de datos de la investigacin de no adherencia a tratamiento de Malaria

    usamos el comando use

    use "C:\malaria.dta", clear

    Ya que la variable dosis por presenta se construye de dos variables entonces tenemos que

    generar la variable dosis con el comandogenerate dosis = ( dos_qkg>1 | dos_tkg>1)

    Adems generaremos antes la variable presencia de la enfermedad en esta base de datos presencia

    de no adherencia, donde 1 presencia de adherencia y 2 presencia de no adherencia.

    generate cumple = (cumfinal == 2)cs cumple malpf

  • 7/29/2019 Guia de Stata 2

    32/37

  • 7/29/2019 Guia de Stata 2

    33/37

    Bioestadstica

    Proportion Exposed: Proporcin de exposicin, para casos y controles

    Odds ratio: El valor calculado de la razn de productos cruzados.

    El cuadro nos dice que rechazamos la hiptesis nula que nos dice que Ho: OR = 1

    Adems podemos decir que la baja de peso en grupo casos es 2.6 veces mas que la baja de pesoen el grupo control

    csiEl uso del comando csi, esta restringido para estudios de cohorte donde tenemos los valores para

    una tabla 2 x 2, este realiza el calculo de los riesgos relativos as como de su intervalo deconfianza.

    csi #a #b #c #d

    Sea que tenemos los valores para el calculo de los RR, similares al ejemplo de cs

    cci

  • 7/29/2019 Guia de Stata 2

    34/37

    Bioestadstica

    El uso del comando csi, esta restringido para estudios de casos y controles donde tenemos los

    valores para una tabla 2 x 2, este realiza el calculo del odds ratio as como de su intervalo deconfianza. Este adems puede calcular el estadstico exacto de Fisher.

    cci #a #b #c #d

    taboddsSe utiliza en estudio de caso control para calcular odds ratios cuando la variable exposicin tienemas de dos niveles.

    Utiliza test de homogeneidad para determinar que los OR calculados son iguales entre los

    diferentes niveles de exposicin

    Utiliza el test de tendencia asumiendo que la variable exposicin tiene un orden , teniendo comohipotesis nula que no hay un incremento del OR cuando el nivel de exposicin se eleva

    Realiza el test de Mantel-Haenszel para ajuste de OR con respecto a una tercera variable que

    podra ser confusora.

    Usaremos la base de datos de malaria como ejemplo teniendo en cuenta que esta base de datos

    proviene de un estudio de Cohorte. El ejemplo no es exactamente el mas apropiado.

    Usamos el comando use para abrir las base de datos de malaria

    use "C:\malaria.dta", clear

    El objetivo de utilizar este comando es el de determinar odds ratio para las tres categoras en la

    variable antecedentes de malaria (si tuvo malaria Pf, tuvo otra malaria, no tuvo nunca malaria)

  • 7/29/2019 Guia de Stata 2

    35/37

  • 7/29/2019 Guia de Stata 2

    36/37

  • 7/29/2019 Guia de Stata 2

    37/37