- Educación
- Matemáticas
- Estadísticas
- Cómo desglosar las estadísticas categóricas utilizando tablas bidireccionales
Libro Relacionado
Por Deborah J. Rumsey
Puede desglosar los datos categóricos utilizando tablas de dos vías (también conocidas como tablas de contingencia, tabulaciones cruzadas o tabulaciones cruzadas) para resumir la información estadística sobre diferentes grupos. Los datos categóricos (también conocidos como datos cualitativos) capturan las cualidades o características de un individuo, como el color de los ojos, el género, el partido político o la opinión de una persona sobre algún tema (normalmente se utilizan categorías como»De acuerdo»,»En desacuerdo»,»Sin opinión» o»Sin opinión», o alguna variación de éstos).
Los datos categóricos tienden a caer en grupos o categorías de forma bastante natural. «Los»partidos políticos», por ejemplo, suelen tener cuatro grupos en Estados Unidos: Demócrata, republicano, independiente y otros. Los datos categóricos a menudo provienen de los datos de las encuestas, pero también pueden ser recopilados en experimentos. Por ejemplo, en una prueba experimental de un nuevo tratamiento médico, los investigadores pueden usar tres categorías para evaluar el resultado del experimento: ¿El paciente mejoró, empeoró o se mantuvo igual mientras se sometía al tratamiento?
Los datos categóricos se resumen a menudo informando el porcentaje de personas que entran en cada categoría. Por ejemplo, los encuestadores pueden reportar estadísticas de afiliación política dando el porcentaje de republicanos, demócratas, independientes y otros. Para calcular el porcentaje de individuos en una cierta categoría, encuentre el número de individuos en esa categoría, divida por el número total de personas en el estudio, y luego multiplique por 100%. Por ejemplo, si una encuesta de 2.000 adolescentes incluyera 1.200 mujeres y 800 hombres, los porcentajes resultantes serían (1.200 ÷ 2.000) ∗ 100% = 60% mujeres y (800 ÷ 2.000) ∗ 100% = 40% hombres.
Puede desglosar más los datos categóricos creando algo llamado tablas bidireccionales. Las tablas bidireccionales son tablas con filas y columnas. Resumen la información de dos variables categóricas a la vez, como el género y el partido político, de modo que se puede ver (o calcular fácilmente) el porcentaje de individuos en cada combinación de categorías y utilizarlas para hacer comparaciones entre grupos.
El gobierno de los EE.UU. calcula y resume cargas de datos categóricos usando tabulaciones cruzadas. En esta tabla se muestran los datos típicos de edad y género, reportados por la Oficina del Censo de los Estados Unidos para una encuesta realizada en 2009. (Normalmente, la edad se consideraría una variable numérica, pero la forma en que el gobierno de Estados Unidos la reporta, la edad se divide en categorías, lo que la convierte en una variable categórica).
Población de EE.UU., desglosada por edad y género (2009)
Grupo de edad Hombres%Mujeres%Total%Total%Menores de 510,887,0087.1910,412,6486.6921,299,6566.945-910,535,9006.9610,073,7346.4820,609,6346.7110-1410,222,5226.759,751,0426.2719,973,5646.5115–1911,051,2897.3010,486,5486.7421,537,8377.0220–2411,093,5527.3210,446,0076.7221,539,5597.0225–2911,115,5607.3410,562,1596.7921,677,7197.0630–3410,107,9746.679,780,6296.2919,888,6036.4835–3910,353,0166.8410,185,3356.5520,538,3516.6940–4410,504,1396.9410,487,4666.7420,991,6056.8445–4911,295,5247.4611,535,5687.4222,831,0927.4450–5410,677,8477.0511,083,5447.1321,761,3917.0955–599,204,6666.089,770,3606.2818,975,0266.1860–647,576,9335.008,234,9905.2915,811,9235.1565–695,511,1643.646,273,1564.0311,784,3203.8470–744,082,2262.704,925,5213.179,007,7472.9375–793,149,2362.084,176,2922.687,325,5282.3980–842,298,2601.523,524,0742.275,822,3341.9085–891,266,8990.842,395,4981.543,662,3971.1990-94424,8820.281,077,3810.691,502,2630.4995-9982,1350.05319,8420.21401,9770.13100+8,7580.0155,2660.0464,0240.02Total151,449,490100.00155,557,060100.00307,006,550100.00Se
pueden examinar muchas facetas diferentes de la población de los EE.UU. mirando y trabajando con diferentes números de la tabla. Por ejemplo, en cuanto al género, se observa que las mujeres superan ligeramente a los hombres: la población en 2009 era del 50,67% de mujeres (divida el número total de mujeres por el tamaño total de la población y multiplíquelo por el 100%) y 49.
33% hombres (dividir el número total de hombres por el tamaño total de la población y multiplicar por 100%). También puede ver la edad: El porcentaje de la población total menor de 5 años fue de 6.94% (dividir el número total de menores de 5 años por el tamaño total de la población y multiplicarlo por 100%). El grupo más numeroso es el de los 45-49 años, que representan el 7,44% de la población.
A continuación, puede explorar una posible relación entre el género y la edad comparando varias partes de la tabla. Puede comparar, por ejemplo, el porcentaje de mujeres con el de hombres en el grupo de edad de 80 años o más. Debido a que estos datos se reportan en incrementos de 5 años, usted tiene que hacer un poco de matemáticas para obtener su respuesta, sin embargo. El porcentaje de población femenina de 80 años y más (ver columna 7 de la tabla) es 2,27% + 1,54% + 0,69% + 0,21% + 0,04% = 4,75%. El porcentaje de hombres de 80 años o más (véase la columna 5 del cuadro) es del 1,52% + 0,84% + 0,28% + 0,05% + 0,01% = 2,70%. Esto muestra que el grupo de edad de las mujeres de 80 años y más es aproximadamente 76% mayor que el de los hombres (porque[4.75 – 2.70] ÷ 2.70 = 0.76).