Ajuste demográfico por posestratificación

Post-stratification demographic adjustment
 
Víctor Alfredo Bustos y de la Tijera*
 
*Instituto Nacional de Estadística y Geografía, alfredo.bustos@inegi.org.mx

PDF EPUB Edición: Vol. 9 número especial 2018.

PDF EPUB 

El tamaño promedio de los hogares en el Módulo de Condiciones Socioeconómicas 2015 decreció más de lo que sería razonable esperar, según el crecimiento poblacional establecido en las proyecciones del Consejo Nacional de Población (CONAPO); como consecuencia, se ajustó al alza el número de hogares para que el tamaño de población coincidiese con el proyectado por el CONAPO. En otras palabras, suponiendo que las respuestas recogidas (por ejemplo: número de miembros del hogar) son precisas, los hogares pequeños están sobrerrepresentados en la muestra; por su parte, los grandes están subrepresentados. Acción: corregir los tamaños relativos de estas subpoblaciones con base en ejercicios estadísticos recientes, como la Encuesta Intercensal 2015. Es decir, corregir los tamaños relativos de distintas subpoblaciones a través de ajustes menores a los factores de expansión y no considerar solo el tamaño poblacional proyectado.

Palabra clave: posestratificación

 

The average household size in the Socioeconomic Conditions Module 2015 decreased, according to the population growth established in the CONAPO projections, more than it would be reasonable to expect. As a consequence, the number of households was adjusted upwards so that the population size coincides with that projected by CONAPO. In other words, assuming the collected responses (eg, household members) are accurate, small households are over-represented in the sample. For their part, the large are underrepresented. Action: Correct the relative sizes of these sub-populations based on recent statistical exercises, such as the Intercensus Survey 2015. That is, to correct the relative sizes of different sub-populations through minor adjustments to the expansion factors and not only consider the projected population size.

Key word: post-stratification.

 
Principales resultados y conclusión
El tamaño promedio de los hogares, después de la posestratificación, coincide con el del levantamiento del 2014. Algo semejante ocurre con los tamaños promedio de los hogares por estrato socioeconómico; por otro lado, los tamaños de las entidades federativas experimentan pequeños cambios cuya significancia está por ser establecida. De este modo, el número total de hogares requerido para cubrir la proyección poblacional del CONAPO para el 2015 se reduce de manera que, en lugar del crecimiento anual incluido en la publicación original del MCS 2015 de 3.3%, se tiene un incremento de solo 1.3%, que está en coincidencia con el crecimiento poblacional para el mismo periodo, que es de 1.29 por ciento.
 
1. Introducción
 
Una de las características más notorias del Módulo de Condiciones Socioeconómicas (MCS) 2015 fue el hecho de que el tamaño promedio de los hogares resultara menor que lo que era demográficamente razonable esperar. Lo anterior dio lugar a una nueva ponderación de las personas, de modo que el total poblacional producido por el MCS coincidiera con las proyecciones demográficas del Consejo Nacional de Población (CONAPO) para ese año. Una consecuencia no deseada, resultado de la calibración por población del MCS 2015 de la misma manera en que se hacía en los proyectos Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH)-MCS anteriores, fue que el número de hogares entre los levantamientos del 2014 y 2015 creciera 3.3 por ciento.1 Para aquellas encuestas, cuya unidad de análisis es el individuo, el ajuste al alza de los factores de expansión no había tenido consecuencias. No obstante, el MCS incluyó, además, al hogar como unidad de análisis, por lo que dicho crecimiento no podía ser aceptado. Cabe hacer notar, sin embargo, que la práctica de ajustar del mismo modo los factores de expansión en anteriores levantamientos del MCS había estado ya presente; por ejemplo, en el del 2014, el Módulo reportó un total de poco más de 32.1 millones de hogares; por su parte, la Encuesta Intercensal (EIC) 2015, levantada seis meses después, solamente expandió a poco más de 31.9 millones de hogares. 
 
Como quiera que sea, la expansión a más de 33 millones de hogares (según se publicó en julio del 2016) dejó en claro que en ese levantamiento pudieron estar presentes una o más circunstancias alternativas. Entre las múltiples hipótesis planteadas para explicar el comportamiento en apariencia anómalo del ingreso corriente total (ICT) en el levantamiento del 2015 estuvo, precisamente, el de la alteración de la estructura demográfica de los hogares en relación con levantamientos anteriores. Es esta consideración la que da lugar al ejercicio que se reporta en este trabajo.
 
2. Metodología
 
2.1 Su aplicación
 
El procedimiento elegido para corregir las estructuras demográficas del MCS es el conocido como posestratificación. La motivación detrás de dicho procedimiento está dada por el hecho de que, al referirse a muestras aleatorias de poblaciones finitas, la aleatoriedad presente da lugar a desviaciones, más o menos grandes, de las estructuras demográficas en la muestra de, por ejemplo, las obtenidas mediante ejercicios censales recientes. Cuando los resultados de la encuesta están condicionados por las estructuras demográficas captadas en la muestra, se busca acercarlas a las poblacionales mediante la modificación de los factores de expansión, bajo el supuesto de que las respuestas recogidas (por ejemplo: número de miembros del hogar) son precisas. De este modo, los factores asociados a poblaciones subrepresentadas en la muestra ven incrementado su valor; en tanto que, los de las poblaciones sobrerrepresentadas lo verán reducido.
 
Para el caso que nos ocupa, en vista de que, como ya se mencionó, el hogar es también unidad de estudio del MCS, no podríamos simplemente modificar las ponderaciones de los individuos, pues ello daría lugar a más de una nueva ponderación para el hogar. Del mismo modo, el uso del promedio de los factores asociados a cada uno de los integrantes podría llevar a la cancelación del efecto deseado. Por lo anterior, se decidió llevar a cabo una posestratificación de hogares en lugar de individuos. Más aún, la publicación reciente de los resultados de la EIC 2015 dio lugar a tabulados al nivel de los hogares. Ya que el tamaño promedio de los hogares debía ser corregido, se hizo uso de tabulados que hicieran referencia a esta variable. Sin embargo, se añadieron dos más (sexo y edad del jefe del hogar) con el fin de aumentar la consistencia de los resultados.
 
2.2 Nota técnica
 
  • Descripción del software y paquetes usados para la obtención de los resultados. Se hizo uso del paquete Stata para hacer los ajustes de los factores de expansión del Módulo. La instrucción utilizada se ejemplifica enseguida: svyset upm [pweight = factor], strata(est_ socio) fpc(nh_1) poststrata(pstpst) postweight(pstwt) vce(linearized) singleunit(certainty) || folioviv. En esta instrucción, la variable factor se refiere a los factores de expansión del MCS 2015; est_socio, a los estratos sociodemográficos en los que se clasifican las unidades primarias de muestreo; la variable nh_1, a los tamaños de dichos estratos; pstpst, al identificador de cada uno de los 156 grupos formados a partir de las combinaciones dadas por el sexo y el grupo de edad del jefe del hogar, así como por el tamaño del mismo, en el que se ubica cada hogar de acuerdo con las variables utilizadas para posestratificar; la variable pstwt representa al tamaño de cada uno de esos grupos.
  • Fuentes utilizadas. La Encuesta Intercensal 2015 aporta resultados sobre estructuras relevantes a nuestro problema. La tabla 1 muestra la información que da lugar a las variables pstspst y pstwt incluidas en la definición de la posestratificación.

rde_25_art01_t1

3. Resultados
 
3.1 Resultados a nivel nacional, por entidad federativa y por decil con la nueva base del MCS 2015
 
La tabla 2 presenta el resultado de realizar la misma posestratificación en las bases de datos correspondientes al 2014 y 2015. Queda de manifiesto, de esta manera, que el levantamiento del 2014 dio lugar a una muestra mucho más consistente con la EIC 2015. Las primeras tres columnas de datos muestran los resultados obtenidos directamente de las bases de datos de cada año; las últimas presentan el efecto de la posestratificación. A nivel nacional, para el 2014, la posestratificación modifica en solamente dos el total nacional de hogares y en poco menos de 30 mil el de la población. Para ese mismo año, los tamaños promedio de los hogares tanto a nivel nacional como por estrato socioeconómico muestran modificaciones menores. En contraste, los cambios que sufre la base de datos en relación con las cantidades anteriores para el 2015 son de destacar: el número total de los hogares pasa de 33 218 037 a solo 32 567 268; sin embargo, el de las personas crece en casi 30 mil. De este modo, el tamaño promedio de los hogares, tanto a nivel nacional como por estrato socioeconómico, mostraría una mayor consistencia con los resultados obtenidos para el 2014. Bajo las anteriores condiciones, tanto el crecimiento poblacional como el del número de hogares entre el 2014 y 2015 se encontrarían cercanos a 1.3%, lo que contrasta con las publicaciones originales de resultados para las que los mencionados incrementos son, respectivamente, de 1.2 y 3.3 por ciento.
rde_25_art01_t2
La figura 1 exhibe las discrepancias entre las estructuras relativas por grupo de edad y sexo del jefe del hogar que resultan de la base de datos original del MCS 2015 y de la EIC 2015, en las columnas primera y segunda, respectivamente, de cada grupo de edad. Por su parte, las columnas segunda y tercera exhiben la coincidencia entre la EIC y el propio MCS 2015 posestratificado. Este resultado no debe sorprendernos ya que, como se indicó con anterioridad, entre los elementos usados en la posestratificación están precisamente la edad y el sexo del jefe del hogar.
rde_25_art01_f1
Algo semejante ocurre con la información presentada en la figura 2, ya que se refiere a otra de las variables utilizadas en el ejercicio de posestratificación; ésta ratifica lo que ya se había comentado con anterioridad en relación con la priorización en el MCS 2015 de los hogares de menor tamaño por encima de aquellos con un gran número de integrantes. De aquí se desprende el menor tamaño promedio de los hogares y la consecuente problemática que hemos tratado de atender.
rde_25_art01_f2
Queda claro que, al menos en términos de las variables demográficas comentadas hasta ahora, el ejercicio de posestratificación tiene un efecto favorable en los mayores niveles de agregación. Con el fin de ratificar o rectificar la anterior apreciación, enseguida se muestran resultados a nivel estatal por lo que toca a la distribución espacial de la población, así como las estructuras por edad y sexo de los jefes de los hogares en cada una de las entidades federativas, así como su comparación con los resultados publicados para esos mismos niveles por la EIC 2015.
 
La figura 3 exhibe la manera en que la posestratificación da lugar a un mayor promedio del número de integrantes del hogar que el que dio como resultado la base de datos original del MCS 2015. Asimismo, muestra las correcciones a las que da lugar la posestratificación, así como los efectos de la misma; además, se les compara con los levantamientos del 2014 y 2015 del MCS y con otro ejercicio de corrección demográfica realizado por el maestro Benito Romo, también del área de investigación del INEGI.
rde_25_art01_f3
Por su parte, la figura 4 exhibe, en términos relativos debido a los diferentes tamaños poblacionales de cada momento, los tamaños de los totales de hogares por entidad federativa para el 2015. La consistencia es evidente, aunque se presentan variaciones de distintas magnitudes. Cabe recordar que la comparación tiene lugar entre diferentes versiones de un ejercicio de muestreo aleatorio en poblaciones finitas por lo que, de cualquier manera, existe un elemento de incertidumbre alrededor de cada valor.
rde_25_art01_f4
Por último, la figura 5 presenta la comparación de estructuras por edad y sexo para el total de la población. Los proyectos que se comparan son la EIC y el MCS posestratificado, ambos del 2015. De nuevo, aunque estas variables no fueron incluidas como condiciones en la posestratificación, se aprecia una coincidencia dentro de márgenes razonables. Las mayores diferencias se aprecian para ambos sexos en los grupos de edades jóvenes.
rde_25_art01_f5
La tabla 3 muestra el efecto de la posestratificación en los incrementos identificados como relevantes a lo largo de los trabajos de análisis de los resultados del MCS 2015. A saber, el ingreso promedio por perceptor (IPP), el promedio del número de perceptores por hogar (PH), el número de hogares (H) y, finalmente, el total del ICT. Esta información se presenta con desgloses por estrato socioeconómico, por tamaño de localidad y por decil de ingresos. En todos los casos, la posestratificación da lugar a un menor incremento 2014-2015 para el ICT. Lo mismo ocurre para el IPP y para H. La única excepción a lo anterior se da para el número promedio de perceptores por hogar, para el cual el incremento es mayor en todos los casos. 
rde_25_art01_t3
4. Validación y evaluación de la metodología
 
Como se indicó en el texto, la corrección aportada por la posestratificación para el MCS 2014 es irrelevante, como lo muestra la figura 6. El número de hogares por entidad presenta diferencias pequeñas en todos los casos.
rde_25_art01_f6
En la figura 7 se muestran los errores relativos, definidos enseguida, correspondientes a las discrepancias mostradas en la figura 6: 
rde_25_art01_f7
 
RDEee_post_f01

donde 14p se refiere a la base de datos posestratificada del 2014 y j, a alguna entidad federativa. Por supuesto, los errores relativos de mayor magnitud se presentan principalmente para los estados más pequeños (Baja California, Baja California Sur, Colima y Quintana Roo; solo para esta entidad dicho error resulta ligeramente mayor a 3%). Aunque menor a 2%, el error de mayor consideración es el que se presenta para el estado de México. Si se llegara a considerar que el tamaño de los errores cometidos al posestratificar es excesivamente grande, aún es posible repetir el ejercicio, pero entidad por entidad. La información requerida para este fin está contenida en la tabla Hogares 3 de la Encuesta Intercensal 2015, una parte de la cual se reproduce en la tabla 4.
rde_25_art01_t4
5. Conclusión y comentarios finales
 
La posestratificación corrige deficiencias en la demografía de los hogares. Sin embargo, a pesar de que su efecto en algunas variables fue menor para el levantamiento del 2014, el cual fue realizado para emparejar el piso por así decirlo, pensando en comparaciones que no favorezcan a ninguno de los ejercicios (ver tabla 5). Los efectos son reducidos cuando ambas bases de datos son posestratificadas.
rde_25_art01_t5 rde_25_art01_f8
 
Más aún, tiene un efecto en la dirección correcta sobre variables asociadas al ingreso, aunque de magnitudes relativamente pequeñas.
 
Por otro lado, variables como el número promedio de perceptores por hogar toman valores mayores con respecto al MCS 2015 original.
 
6. Anexo: pobreza multidimensional y carencias
 
Por lo que toca a temas de pobreza multidimensional, el efecto de posestratificar la base de datos del MCS 2015 es relativamente pequeño. Las tablas 6 a 9 se refieren a la pobreza multidimensional y a las carencias, de interés del CONEVAL, respectivamente. En ellas se presentan los valores de algunas estadísticas acerca de las diferencias entre los porcentajes que se obtienen entre las bases de datos del MCS 2015 original y la posestratificada. Es de observarse que, salvo por un par de casos, todos estos valores se encuentran por debajo de un punto porcentual.

Por lo anterior, es necesario enfatizar que se ha de realizar un análisis a profundidad en relación con el efecto de la posestratificación sobre todas las variables relevantes.
rde_25_art01_t6
rde_25_art01_t7
rde_25_art01_t9
 
_____
 
1 El crecimiento en el número de hogares entre el 2014 y 2015 es significativo: los intervalos de confianza estimados son (31 918 332, 32 382 468) y (32 997 771, 33 438 303) para el 2014 y 2015, respectivamente.

Víctor Alfredo Bustos y de la Tijera

Autor

De nacionalidad mexicana, es licenciado en Actuaría por la Facultad de Ciencias de la Universidad Nacional Autónoma de México (UNAM), maestro en Estadística e Investigación de Operaciones por el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la UNAM y doctor en Estadística por la London School of Economics. Ha sido catedrático en la Facultad de Ciencias de la UNAM, profesor-investigador del IIMAS, así como profesor en la School of Business Administration de la Temple University, el Instituto Tecnológico Autónomo de México (ITAM) y el Instituto Tecnológico y de Estudios Superiores de Monterrey, además de catedrático-investigador en el Centro de Investigación y Docencia Económicas (CIDE) y profesor invitado en el Centro Científico de IBM de México. Ingresó al Instituto Nacional de Estadística y Geografía (INEGI) en 1991, donde actualmente es investigador en la Dirección General Adjunta de Investigación. Sus áreas de interés son, entre otras: el ajuste de modelos a partir de encuestas, donde destaca la estimación de la distribución del ingreso con datos de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH), compatible con las cuentas nacionales; la estimación para dominios pequeños en temas como la desocupación y la migración; la clasificación multivariada con aplicación a la medición del bienestar y la marginación; y la construcción de índices temporales multivariados para seguir la evolución de una economía mediante criterios explícitos.


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *