Este tema es de nivel
BASICO
Temas->>Epidemiología analítica
 
Estudios de Casos y controles III
TEMA
EPIDEMIOLOGIA
ANALITICA

Estructura y análisis de la información en los estudios de casos y controles
La lógica de este diseño consiste en comparar la frecuencia de exposición a la(s) variable(s) independiente(s) estudiadas en casos y controles. Esta comparación, apoyada por la hipótesis de trabajo, busca encontrar evidencia de una mayor tasa de exposición entre los sujetos casos en comparación con los controles si el factor estudiado se comporta como un "factor de riesgo" 1

Si la presencia del factor de exposición reduce el riesgo (factor protector), la frecuencia de exposición entre los controles debiera ser mayor que la encontrada entre los casos.

El análisis dependerá de la existencia de matching en el diseño. En el caso no pareado, la unidad de análisis corresponde a cada individuo en ambos grupos y la comparación de individuos de uno y otro grupo se efectėa libremente.

Si hay matching la comparación de las unidades de análisis se establece entre pares de observaciones (un caso, un control), tríos si la relación entre casos y controles es 1:2 ( un caso, dos controles) y así sucesivamente.

El esquema general de análisis en una tabla tetracórica en un estudio de casos y controles es el siguiente

Esquema básico de información en un estudio de casos y controles

Variable
independiente

Variable dependiente
 
 
Presente
Ausente
TOTAL
Presente
a
b
F1 (a+b)
Ausente
c
d
F2 (c+d)
Total
C1 (a+c)
C2 (b+d)
n


En este caso, cada celda corresponde a:

Celda a: Sujetos enfermos con antecedente de exposición
Celda b: Sujetos sanos con antecedente de exposición
Celda c: Sujetos enfermos sin antecedente de exposición
Celda d: Sujetos sanos sin antecedente de exposición.
Celda C1: Total de casos
Celda C2: Total de controles
Celda F1 : Total de sujetos expuestos
Celda F2 : Total de sujetos no expuestos.

Nótese que el nėmero total de sujetos en ambos grupos (Casos y Controles) son fijados a priori por el investigador (C1 y C2).

Un primer análisis de esta tabla, considerando la hipótesis de trabajo, permite una rápida evaluación de la tendencia de los resultados.
Si la exposición estudiada confiere riesgo, se espera encontrar una concentración de individuos en la celda a (expuestos y enfermos) y celda d (no expuestos y sanos).
En estas celdas se produce concordancia con la hipótesis de trabajo (exposición/daño, no exposición/no daño).

Caso no pareado: estructura de la tabla tetracórica
En este caso, la comparación de individuos se realiza libremente, comparando la totalidad de los casos con la totalidad de los controles. Esto es válido independientemente del nėmero de controles seleccionados por cada caso. Veamos la estructura de los datos en situaciones hipotéticas de estudios con relación 1:1 y 1:2 entre casos y controles respectivamente:

Caso no pareado, relación 1:1 entre casos y controles.

 
Casos
Controles
1
E
N
2
E
N
3
N
N
4
N
N
5
E
E
6
E
N
7
E
N
8
E
N
9
N
E
10
N
E


(E = expuesto N = No expuesto)

Exposición
Casos
Controles
 
Positiva
6
3
9
Negativa
4
7
11
 
10
10
20

Caso no pareado, relación 1:2 entre casos y controles.

Casos
Controles
1
E
1-N
11-N
2
E
2-N
12-E
3
N
3-N
13-E
4
N
4-N
14-N
5
E
5-E
15-N
6
E
6-N
16-N
7
E
7-N
17-E
8
E
8-N
18-N
9
N
9-N
19-N
10
N
10-E
20-N

Exposición
Casos
Controles
 
Positiva
6
5
11
Negativa
4
15
19
 
10
20
30

En la situación de pareamiento o matching, cambia: la estructura de la base de datos, las tablas de distribución de frecuencias, así como las tablas de contingencia (que sólo es de 2 x 2 para el caso de matching 1 : 1), varían en su estructura general. Se presentan figuras con la apariencia en casos de matching 1 : 1 y más de un control por cada caso:

Caso pareado, relación 1:1 casos-controles

Casos-Controles
1
E-N (Caso Expuesto; Control No expuesto)
2
E-N
3
N-N (Caso y control No expuestos)
4
N-N
5
E-E (Caso y Control expuestos)
6
E-N
7
E-N
8
E-N
9
N-N
10
N-E

Originando la siguiente tabla tetracórica:

 
Controles
 
 
Exp +
Exp -
 
Casos
Exp +
1
5
6
 
Exp -
1
3
4
 
2
8
10*


(*): 10 pares de comparaciones, equivalentes a 20 sujetos

Caso pareado, relación 1:2 entre casos y controles.

Casos-Controles
1
E-N-N
2
E-N-E
3
N-N-N
4
N-N-N
5
E-E-E
6
E-N-N
7
E-N-N
8
E-N-N
9
N-N-E
10
N-E-N

Distribuyéndose de esta manera en la tabla de contingencia

 
Controles expuestos
 
0 indiv
1 indiv
2 indiv Total
Casos
Exp +
4
1
1
6
 
Exp -
2
2
0
4
 
6
3
1
10*


(*): 10 tríos de observaciones (30 observaciones)

Cálculo de la tasa de exposición
El primer cálculo a desarrollar es el de las tasas de exposición entre los sujetos casos y los controles, de acuerdo al siguiente planteamiento:

Esquema básico de información en un estudio de casos y controles

Variable
independiente

Variable dependiente
 
 
Presente
Ausente
TOTAL
Presente
a
b
F1 (a+b)
Ausente
c
d
F2 (c+d)
Total
C1 (a+c)
C2 (b+d)
N

Tasa Exposición en casos = a / C1 x 100 o bien = a/(a+c)
Tasa Exposición en controles = b / C2 x 100 o bien = b/ (b+d)

La valoración estadística de las tasas de exposición encontradas puede efectuarse mediante la aplicación de un test de comparación de proporciones, la que determinará si la diferencia existente puede o no se explicada por el azar (H0) o por la presencia de la variable independiente en estudio (H1).

Establecimiento de asociación entre las variables en estudio
Luego del paso anterior se procede a establecer la existencia de asociación utilizando el test de de Mantel - Haenszel, con su correspondiente corrección de continuidad de Yates si fuera el caso 2 .

= (| ad * bc| ý n)
       
        C1 C2  F1  F2

El valor obtenido tiene un grado de libertad:

( gl = [columnas - 1] x [filas - 1])

Teniendo como punto de corte 5,991 para este valor, con un 95% de confianza.
Vale decir, si el valor de Chi cuadrado calculado excede este valor, se está en condiciones de poder rechazar la hipótesis de nulidad H0 (falta de asociación) en favor de H1 (asociación), con 95% de confianza.

Habitualmente en todo caso, la hipótesis de asociación suele haber sido comprobada previamente al desarrollo del protocolo. El paso siguiente es el cálculo del odds ratio. El odds ratio tiene la característica de cuantificar la magnitud de riesgo.

Cálculo de la razón de chances u Odds Ratio (OR)
En la literatura epidemiológica esta medida de riesgo es reconocida con las siguientes denominaciones: odds ratio, razón de disparidad, razón de desigualdades, razón de productos cruzados, riesgo relativo estimado, desigualdad relativa, razón de momios y otras más 3 .

- Elaboración de los componentes de esta razón:

- La "chance" (odds) de tener la enfermedad (Odds1), segėn se esté o no expuesto al factor corresponde a:

Odds1 = a/C1 (enfermos expuestos en relación con el total de enfermos)
     
               c/C1 (enfermos no expuestos en relación con el total de enfermos)

Lo que equivale a :

Odds1 = a/ ( a+c )

               c/ ( a+c )

- Equivalentemente la "chance" de no tener la enfermedad, segėn se esté o no expuesto al factor (Odds2) corresponde a :

Odds1 = b/ C2 (sanos expuestos en relación con el total de sanos).

              d/ C2 (sanos no expuestos en relación con el total de sanos)

Equivalente a:

Odds2 = b/ (b+d )

              d/ ( b+d )

- Por tanto, el valor del odds ratio, que corresponde al cuociente (razón ) entre estas dos "chances (u Odds), corresponde a:

OR = a x d

          a x c

Este indicador de riesgo es llamado también "razón de productos cruzados", aludiendo así a la distribución que adoptan en la tabla 2 x 2 los términos del numerador y denominador 4 . El valor calculado carece de unidades de medidas.

Interpretación del valor de OR calculado
Estrictamente hablando el odds ratio indica la magnitud de asociación entre exposición y outcome (en otras palabras, el riesgo de haber estado expuesto dada la enfermedad). Esta interpretación es compleja y difícil de entender, por lo que se permite su interpretación considerando el riesgo asociado o no a la exposición.
Como el odds ratio es un buen estimador del riesgo relativo (calculado en estudios prospectivos), se utiliza esta propiedad para facilitar la comprensión del indicador.

Si el cuociente calculado determina un valor de 1, esto significa que no hay asociación entre las variables analizadas (la exposición positiva o negativa no hace diferencia respecto al riesgo de enfermar).

Un valor mayor que 1 indica una mayor frecuencia de exposición de la variable independiente entre los enfermos (casos). Por tanto, el factor actėa asociándose con un mayor riesgo de enfermar.

Finalmente, si el valor del OR calculado es inferior a 1, esto indica mayor frecuencia de exposición entre los sujetos sanos (controles). En este caso, la presencia del factor se asocia reduce el riesgo de enfermar (actuando como un factor de protección).

La valoración estadística de las asociaciones encontradas debe realizarse mediante el cálculo de los correspondientes intervalos de confianza.

De acuerdo con esto, la interpretación final del OR queda dada por el siguiente esquema:

- Interpretación del valor de odds ratio

Valor
odds ratio
Intervalo de confianza
Tipo de asociación
Inferior
Superior
1
   
No evidencia de asociación
Mayor de 1
>1
>1
Significativa, riesgo
Mayor de 1
< 1
> 1
No significativa
Menor de 1
< de 1
< de 1
Significativa, protección
Menor de 1
< de 1
> de 1
No significativa

Para el cálculo del intervalo de confianza se recurre a diferentes métodos. Uno de los más utilizado es el Woolf que utiliza la siguiente fórmula;

IC OR = (Ln OR) ± Z 1/a+1/b+1/c+1/d

Ejemplo: Contreras 5 y colaboradores estudian y difunden el resultado de una investigación destinada a valorar el nivel de protección conferido por la vacuna antisarampión utilizando un diseño de estudio de casos y controles. Para ello, los autores identifican a 48 niños con el antecedente de sarampión y 48 controles, en quienes indagan por el antecedente de vacunación previa, obteniendo los siguientes resultados:

- Asociación sarampión con antecedente de vacunación: casos y controles

Exposición
Sarampión
 
 
SI
NO
 
Vacunación +
34
46
80
Vacunación -
14
2
16
48
48
96

En este caso, la "tasa de exposición a la vacuna" equivale a:

- Entre los casos : ( 34/48) * 100 = 71%
- Entre los controles : (46/48) * 100 = 96%

El cálculo del valor de odds ratio (OR) para este caso en particular está dado por la expresión:

OR = a x d

          b x c

vale decir = 34 x 2  =  68 = 0,10
   
          46 x 14    644

O bien:
Odds Exposición en Enfermos : 34/48 / 14/48 = 2,42 Odds Exposición entre Controles : 46/48 / 46/48 = 23

OR = 0,10

-Cálculo del intervalo de confianza para el OR calculado.
Ln OR : -2.30

Error standard : Ln OR = 1/a+1/b+1/c+1/d

(ES) = 0.62
        = 0.789

Intervalo de confianza calculado al 95%, equivale a:

IC OR = (Ln OR) ± Z Ln ES
IC OR = (Ln OR) ± 1,96 (0,789)
IC OR = (Ln OR) ± 1,55
            = -2.30 ± 1,55

IC OR =
IC OR = 0,021- 0,47

Luego el intervalo en el cual se mueve el valor de OR calculado fluctėa entre 0,021 y 0,47, ambos valores inferiores a 1, con un 95% de confianza.

Por tanto la asociación encontrada es de carácter significativo y su lectura correspondería a una disminución significativa del riesgo de contraer sarampión en presencia del factor "vacunación" antisarampionosa.

El test de Chi cuadrado (),efectuado entre la variable vacunación y sarampión (medidas dicotómicamente ambas) arroja un valor de p 0,002 (valor de 10,8, con un grado de libertad), lo que permite rechazar H0 (variables no asociadas) en favor de H1 (las variables están asociadas).

Finalmente, si quisiéramos calcular el nivel de protección conferido por esta vacuna en la población estudiada, ésta estaría dada por la siguiente expresión:

Porcentaje de protección = 1 - OR,

- siendo el valor 1 el valor basal asumiendo que la vacuna no ejerce ningėn tipo de protección. En nuestro caso, se obtiene un valor de 0,9 equivalente a un 90% de protección entre los niños estudiados en presencia del antecedente de vacunación. Los límites del intervalo de confianza corresponderían a:

Límite inferior: 1 - 0,47 = 53% de protección
Límite superior: 1 - 0,021 = 97,9% de protección

En términos de notación, este resultado se expresa en términos de nivel de protección, como 90% (Intervalo de confianza al 95%: entre: 53% - 97,9%)

Direccionalidad de la asociación estudiada
Dado que este diseño se inicia a partir de la variable dependiente y explora retrospectivamente en el tiempo la presencia o ausencia de exposición en ambos grupos, no es posible conocer entre los casos la tasa de incidencia de la enfermedad o daño en cuestión 6 . Para conocer el nėmero de casos nuevos de la enfermedad o condición en estudio en un período de tiempo determinado se requiere iniciar un seguimiento de individuos sanos o libres de la condición en estudio, observando la aparición de eventos a lo largo de un período de tiempo preestablecido.

En el diseño de casos y controles, el estudio se inicia a partir de un nėmero fijo de sujetos enfermos o portadores de la condición a estudiar, ignorándose el momento en el cual apareció la enfermedad.
Por tanto, por definición, dada la direccionalidad del estudio (retrospectiva), no es posible el cálculo de tasas de incidencia.

Consideración de variables de confusión.
Siendo el objetivo de este diseño establecer la existencia de asociaciones entre variables, es de suma importancia descartar que las asociaciones evaluadas no estén dadas por variables independientes que participan indirectamente en la cadena causal pero que en ėltimo tiempo, no la explican.

Nos referimos específicamente a aquellas variables que se encuentran vinculadas simultáneamente con la variable dependiente e independiente en estudio. Estas variables de confusión pueden dar origen al establecimiento de asociaciones spėreas, derivadas del efecto de estas variables. Para su control, se puede recurrir a:

  • Control a priori de las variables, en la etapa de diseño del estudio (matching)
  • Análisis de la exposición y el outcome de acuerdo a los niveles o estratos que adopte la variable de confusión (análisis estratificado),
  • Ajustando los datos, a posteriori utilizando ajuste directo o indirecto,
  • Utilizando técnicas de multivariadas (análisi multivariado),
  • En diseños experimentales, asignando aleatoriamente la exposición entre los sujetos participantes.

Análisis de datos en estudios casos y controles con matching
Si el estudio ha incorporado la modalidad de matching de frecuencia, es decir, el ingreso al estudio de los controles estuvo condicionado por algunas restricciones generales previas (igual sexo, similar grupo etario, vecindario comėn u otras), se puede aplicar el mismo procedimiento utilizado en la modalidad no pareada o sin matching.

En el caso de matching individual utilizando un control por cada caso, la información se distribuye de acuerdo a pares de observaciones segėn el esquema previamente comentado.

 
Controles
 
   
Expuestos
No expuestos
 
Casos Expuestos
1 (n11)
5 (n10)
6
  No expuestos
1 (n01)
3(n00)
4
   
2
8
10*


(*): 10 pares de comparaciones, equivalentes a 20 sujetos

Correspondiendo cada celda a:

  • Celda n11: caso y control expuestos
  • Celda n10: Controles no expuestos, casos sí.
  • Celda n01: caso no expuesto, control sí.
  • Celda n00 : Caso no expuesto, control no expuesto

En esta modalidad se asume que las celdas que muestran concordancia no aportan información respecto al estudio de asociación, por lo que se utilizan solamente las celdas n10 y n01.

OR = n10 / n01 = 5/1

Si la información no es correctamente distribuida en las correspondientes celdas, la tabla tetracórica presentaría la siguiente conformación:

 
Casos
Controles
Exp +
6
2
 
Exp -
4
8
 
 
10
10
 

Originando un valor erróneo de odds ratio dado por:

      OR = 6 x 8    = 6

       2 x 4

Test de para el caso pareado
Su cálculo corresponde a la siguiente expresión:

= ( n10 - n01)

        (n10 + n01)

Cuando el nėmero de estratos es mayor a uno, los cálculos se hacen de mayor complejidad, siendo conveniente la utilización de software específico.

Cálculo del intervalo de confianza
Existen diversos métodos para su cálculo. Se presentan a continuación otros métodos corrientemente utilizados:

a) ICOR = ( 1 ± 1,96/)

b) ICOR = e (OR ± 1,96 x varianza)

La varianza se calcula de acuerdo a :

Varianza OR = (1/ n10 + 1/ n01 )


  1. Factor de riesgo: atributo o característica de un sujeto o un grupo de ellos que les confiere un mayor riesgo particular de adquirir una determinada enfermedad o condición.
    | Volver al texto |
  2. El test de chi cuadrado tiene algunas restricciones para el caso de variables categóricas. La corrección de continuidad de Yates se usa en el caso de tablas de contingencia en las que se encuentran celdas con bajo nėmero de observaciones.
    | Volver al texto |
  3. Aėn cuando la acepción más correcta es "Razón de Chances" puesto que establece la diferencia entre probabilidad y "chance", se usará la denominación OR, por su frecuente utilización en literatura biomédica.
    | Volver al texto |
  4. Esta medida de riesgo puede también calcularse en estudios prospectivos y su derivación es simple
    | Volver al texto |
  5. Contreras R y cols. Efectividad de la vacuna antisarampión en el terreno: un estudio de casos y controles. Rev. Chil. Pediatría;61(1):3-7, 1990.
    | Volver al texto |
  6. De hecho, se ignora cuando los casos portadores de la enfermedad o condición en estudio aparecieron y, por cierto, las poblaciones a partir de las cuales pudiera calcularse una tasa de incidencia
    | Volver al texto |

Web Gabriel Rada. Revisado 2007 Tomás Merino.

OBJETIVOS DE LA LECTURA

1. Reconocer la estructura básica de análisis de un estudio C & C.
2. Establecer la diferencia de estructura en caso pareado y no pareado.
3. Conocer la elaboración de niveles de evidencia:

  • Estadística (asociación)
  • Epidemiológica (Riesgo)

4. Chi cuadrado de Mantel-Haenszel
5. Elaboración e interpretación de Odds ratio.
6. El análisis del caso pareado

•Estudios de cohortes
•Estudios de cohortes II
•Casos
y controles

•Casos
y controles II

•Casos
y controles III

•Intervalos de confianza
•Variables confundentes
•Análisis estratificado

OTROS TEMAS
•Introductorios
•Instrumentales introductorios
•Paradigmas epidemiológicos
•Indicadores de riesgo EPI
•Investigación y EPI
•Epidemiología descriptiva
•Epidemiología analítica
•Estudios experimentales
BREVES
Utilizando la tabla de 2 x 2, responda:
 
Casos
Controles
Exp +
25
15
Exp -
75
85
 
100
100


1. ¿Cuál es la Odds de exposición en los casos?
2. ¿Cuál es la Odds de exposición en controles?
3. ¿Cuál es el Odds Ratio?

CONCEPTOS CLAVES
1. El análisis de estudios de C & C necesita del planteamiento claro de un hipótesis de trabajo.
2. La estructura básica del análisis univariado es mediante una tabla de 2 x 2
3. Hay diferentes niveles de análisis de evidencia, los que se inician con la comparación de tasas de exposición.
4. Es posible el cálculo del Odds Ratio, el que da la magnitud el riesgo encontrado.
5. El cálculo de intervalos de confianza permite concluir estadísticamente respecto del valor del Odds Ratio.
6. Este diseño no permite establecer la temporalidad en la ocurrencia de exposición y outcome por la orientación retrospectiva de la bėsqueda de información