Cómo estimar la diferencia entre dos proporciones

  1. Educación
  2. Matemáticas
  3. Estadísticas
  4. Cómo estimar la diferencia entre dos proporciones

Libro Relacionado

Por Deborah J. Rumsey

Para estimar la diferencia entre dos proporciones de población con un intervalo de confianza, se puede utilizar el Teorema del Límite Central cuando los tamaños de la muestra son suficientemente grandes (normalmente, cada uno de al menos 30). Cuando una característica estadística, como la opinión sobre un tema (apoyo/no apoyo), de los dos grupos que se comparan es categórica, la gente quiere informar sobre las diferencias entre las dos proporciones de la población – por ejemplo, la diferencia entre la proporción de mujeres y hombres que apoyan una semana laboral de cuatro días. ¿Cómo se hace esto?

Se estima la diferencia entre dos proporciones de población, p1 – p2, tomando una muestra de cada población y usando la diferencia de las dos proporciones de la muestra,

más o menos un margen de error. El resultado se denomina intervalo de confianza para la diferencia de dos proporciones de población, p1 – p2.

La fórmula para un intervalo de confianza (IC) para la diferencia entre dos proporciones de población es la siguiente

y n1 son la proporción y el tamaño de la muestra de la primera muestra, y

y n2 son la proporción y el tamaño de la muestra de la segunda muestra. El valor z* es el valor apropiado de la distribución normal estándar para su nivel de confianza deseado. (Consulte la siguiente tabla para los valores de z*).

Valores de z* para Varios Niveles de ConfianzaNiveles de Confianza Valor de z*80%1.2890%1.645 (por convención)95%1.9698%2.3399%2.58Para

calcular un IC para la diferencia entre dos proporciones de población, haga lo siguiente:

  1. Determine el nivel de confianza y encuentre el valor z* apropiado.
  2. Encuentre la proporción de la muestra para la primera muestra tomando el número total de la primera muestra que están en la categoría de interés y dividiéndola por el tamaño de la muestra, n1. Del mismo modo, busque para la segunda muestra.
  3. Tome la diferencia entre las proporciones de la muestra,
  4. Encuentra y divide eso por n1. Encuentra y divide eso por n2. Sume estos dos resultados y tome la raíz cuadrada.
  5. Multiplica z* por el resultado del Paso 4. Este paso te da el margen de error.
  6. El extremo inferior de la IC es menos el margen de error, y el extremo superior de la IC es más el margen de error.

La fórmula que se muestra aquí para un CI para p1 – p2 se usa bajo la condición de que ambos tamaños de muestra sean lo suficientemente grandes para aplicar el Teorema del Límite Central y le permitan usar un valor z*; esto es cierto cuando se estiman proporciones usando encuestas a gran escala, por ejemplo. Para muestras de tamaño pequeño, los intervalos de confianza están fuera del alcance de un curso introductorio de estadística.

Suponga que usted trabaja para la Cámara de Comercio de Las Vegas y desea calcular con un 95% de confianza la diferencia entre el porcentaje de todas las mujeres que han ido a ver a un imitador de Elvis y el porcentaje de todos los hombres que han ido a ver a un imitador de Elvis, con el fin de ayudar a determinar cómo debe comercializar sus ofertas de entretenimiento.

  1. Debido a que desea un intervalo de confianza del 95%, el valor de z* es 1,96.
  2. Suponga que su muestra aleatoria de 100 mujeres incluye 53 mujeres que han visto a un imitador de Elvis, así que es 53 dividido por 100 = 0.53. Suponga también que su muestra aleatoria de 110 hombres incluye 37 hombres que alguna vez han visto a un imitador de Elvis, así que es 37 dividido por 110 = 0.34.
  3. La diferencia entre estas proporciones de la muestra (mujeres – hombres) es de 0,53 – 0,34 = 0,19.
  4. Tome 0.53 ∗ (1 – 0.53) para obtener 0.2941. Entonces divídelo por 100 para obtener 0,0025. Luego tome 0.34 ∗ (1 – 0.34) para obtener 0.2244. Entonces divídelo por 110 para obtener 0,0020. Sume estos dos resultados para obtener 0.0025 + 0.0020 = 0.0045. Luego encuentra la raíz cuadrada de 0.0045 que es 0.0671.
  5. 1.96 ∗ 0.0671 le da 0.13, o 13%, que es el margen de error.
  6. Su intervalo de confianza del 95% para la diferencia entre el porcentaje de mujeres que han visto a un imitador de Elvis y el porcentaje de hombres que han visto a un imitador de Elvis es de 0.19 o 19% (que usted obtuvo en el Paso 3), más o menos 13%. El extremo inferior del intervalo es 0.19 – 0.13 = 0.06 o 6%; el extremo superior es 0.19 + 0.13 = 0.32 o 32% Para interpretar estos resultados dentro del contexto del problema, se puede decir con un 95% de confianza que un porcentaje más alto de mujeres que de hombres han visto a un imitador de Elvis, y la diferencia en estos porcentajes está entre el 6% y el 32%, basado en su muestra.La tentación es decir: «Bueno, yo sabía que una mayor proporción de mujeres ha visto a un imitador de Elvis porque esa proporción de la muestra era de 0,53 y para los hombres era sólo de 0,34″. ¿Por qué necesito un intervalo de confianza?» Todo lo que esos dos números te dicen es algo sobre esas 210 personas muestreadas. También es necesario tener en cuenta la variación utilizando el margen de error para poder decir algo sobre toda la población de hombres y mujeres.

Por supuesto, hay algunos tipos que no admitirían que han visto a un imitador de Elvis (aunque probablemente hayan fingido ser uno haciendo karaoke en algún momento). Esto puede crear algún sesgo en los resultados.

Note que usted podría obtener un valor negativo para

Por ejemplo, si hubieras cambiado los machos y las hembras, habrías obtenido -0.19 por esta diferencia. Está bien, pero puede evitar diferencias negativas en las proporciones de la muestra haciendo que el grupo con la mayor proporción de la muestra sirva como primer grupo (aquí, las mujeres).

Sin embargo, incluso si el grupo con la mayor proporción de muestra sirve como primer grupo, a veces se obtienen valores negativos en el intervalo de confianza. Supongamos en el ejemplo anterior que sólo 0.43 de las mujeres han visto a un imitador de Elvis. Así, la diferencia en proporciones es de 0,09, y el extremo superior del intervalo de confianza es de 0,09 + 0,13 = 0,22, mientras que el extremo inferior es de 0,09 – 0,13 = -0,04. Esto significa que la verdadera diferencia está razonablemente entre un 22% más de mujeres y un 4% más de hombres. Está demasiado cerca para decirlo con seguridad.