Procedimiento de muestreo
Las encuestas se diferencian de otras técnicas de recolección de información estadística, principalmente porque se aplican a una muestra y no a la totalidad de los elementos de una población. El diseño muestral forma parte de la fase de diseño y comprende las actividades necesarias para calcular el tamaño de muestra, definir el tipo de muestreo y realizar la selección de las empresas que integrarán la muestra.
Dominio de estudio
Denotan subconjuntos de la población que han sido planeados específicamente en el diseño de la muestra, los cuales para esta encuesta son a nivel nacional, considerando los siguientes:
* Nacional-grupos de sectores de actividad económica3
* Nacional-tamaño de la empresa
Donde el tamaño de la empresa se refiere a lo establecido de acuerdo con la publicación en el Diario Oficial de la Federación (DOF).4
A continuación, se presenta el tamaño de la empresa bivariada y grupos de sectores de actividad económica por rangos de personal ocupado y total de ingresos por suministro de bienes y servicios (M000A):
Tamaño de la empresa bivariada por rangos de personal ocupado e ingresos Cuadro 1
Tamaño de la empresa: Grande
Grupos de sectores de actividad económica: Industriales
Personal ocupado, Rango por número de trabajadores = Más de 250
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Más de $372.22
Tamaño de la empresa: Grande
Grupos de sectores de actividad económica: De comercio
Personal ocupado, Rango por número de trabajadores = Más de 100
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Más de $372.22
Tamaño de la empresa: Grande
Grupos de sectores de actividad económica: De servicios
Personal ocupado, Rango por número de trabajadores = Más de 100
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Más de $372.22
Tamaño de la empresa: Mediana
Grupos de sectores de actividad económica: Industriales
Personal ocupado, Rango por número de trabajadores = Desde 51 hasta 250
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Desde $148.90 hasta $372.22
Tope máximo combinadob = 359.99
Tamaño de la empresa: Mediana
Grupos de sectores de actividad económica: De comercio
Personal ocupado, Rango por número de trabajadores = Desde 31 hasta 100
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Desde $148.90 hasta $372.22
Tope máximo combinadob = 344.99
Tamaño de la empresa: Mediana
Grupos de sectores de actividad económica: De servicios
Personal ocupado, Rango por número de trabajadores = Desde 51 hasta 100
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Desde $148.90 hasta $372.22
Tope máximo combinadob = 344.99
Tamaño de la empresa: Pequeña
Grupos de sectores de actividad económica: Industriales
Personal ocupado, Rango por número de trabajadores = Desde 11 hasta 50
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Desde $5.97 hasta $148.89
Tope máximo combinadob = 139.00
Tamaño de la empresa: Pequeña
Grupos de sectores de actividad económica: De comercio
Personal ocupado, Rango por número de trabajadores = Desde 11 hasta 30
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Desde $5.97 hasta $148.89
Tope máximo combinadob = 137.00
Tamaño de la empresa: Pequeña
Grupos de sectores de actividad económica: De servicios
Personal ocupado, Rango por número de trabajadores = Desde 11 hasta 50
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Desde $5.97 hasta $148.89
Tope máximo combinadob = 139.00
Tamaño de la empresa: Micro
Grupos de sectores de actividad económica: Todas
Personal ocupado, Rango por número de trabajadores = Hasta 10
Total, de ingresos por suministro de bienes y servicios (M000A) deflactados (diciembre 2018), Rango de monto (Millones de pesos)a = Hasta $5.96
Tope máximo combinadob = 6.36
Se deflactan los ingresos utilizando el Índice Nacional de Precios Productor (INPP) de diciembre de 2018 con junio de 2009 para poder llevar los límites de ingresos de 2009 a diciembre de 2018 que es la información que tenemos en el marco actual.
https://fundar.org.mx/wp-content/uploads/2022/04/Nota_Metodologica_2023.pdf
b Tope máximo combinado = (Trabajadores) X 10 % + Total de ingresos por suministro de bienes y servicios (M000A) x 90 por ciento.
Marco de muestreo
El marco se integró a partir de las empresas que cumplen con al menos una de las condiciones de los siguientes grupos conforme a los resultados de los Censos Económicos 2019:
Condición por grupo de estudio Cuadro 2
Grupo Condición
I. Empresas que tienen información en al menos una de las 27 variables de gastos (ver Anexo A) y/o en 13 variables de ingresos (ver Anexo B) referentes a bienes y servicios en el extranjero.
II. Pertenece a algún grupo holding, grupo empresarial, grupo financiero, empresa controladora, con participación de capital extranjero en el capital social o en procesos integrados con empresas ubicadas en otros países (ver Anexo C).
a) Presenta «semejanza estadística»5 con el grupo I.
b) Cuentan con personal ocupado mayor a 1 000 (ver Anexo D).
Se obtuvo un marco de 9 796 empresas que cumplen las características de la población objeto de estudio que provienen del Marco Estadístico Nacional de Unidades Económicas (MENUE),6 distribuidas por dominio, grupos de sectores de actividad económica y tamaño de la empresa, como se presenta a continuación:
Distribución por grupos de sectores de actividad económica Cuadro 3
Grupos de sectores de actividad económica (Empresas)
Total = 9 796
Industriales = 5 154
De comercio = 2 384
De servicios = 2 258
Distribución por tamaño de la empresa Cuadro 4
Tamaño de la empresa (Empresas)
Total = 9 796
Grande = 3 461
Mediana = 2 122
Pequeña = 3 859
Micro = 354
Esquema de muestreo
Fue probabilístico y estratificado con selección independiente en el estrato por dominio de estudio:
• Probabilístico: las unidades de muestreo tienen una probabilidad conocida y distinta de cero de ser seleccionadas
• Estratificado: las unidades de muestreo con características similares se agrupan para formar estratos
Estratificación
Se definió una variable auxiliar nombrada bienes y servicios en el extranjero, para el grupo I usando la suma de las 40 variables cuantitativas de gastos e ingresos en el extranjero (ver Anexo A y B); para los grupos II.a y II.b se define la variable auxiliar nombrada bienes y servicios totales como la suma de las variables de total de gastos por consumo de bienes y servicios (K000A) y total de ingresos por suministro de bienes y servicios (M000A).
Con estas variables auxiliares7 se realizó una primera estratificación usando el método de Dalenius Hodges8 a cinco estratos, con el objetivo de definir las empresas en el estrato 1 de certeza para los grupos I y II.a. Del proceso de estratificación anterior se definió como certeza todas las empresas que cumplen con el siguiente criterio:
• Grupo I: con valor de la variable de bienes y servicios en el extranjero mayor o igual a 33 404.57 miles de pesos o personal ocupado mayor a 1 000
• Grupo II.a: con valor de la variable de bienes y servicios totales mayor o igual a 1 960 393.31 miles de pesos o personal ocupado mayor
a 1 000
• Grupo II.b: se determina como certeza
Posteriormente se realizó una segunda estratificación del marco de muestreo con el proceso de Dalenius Hodges,8 sin considerar la certeza ya definida.
Tamaño de la muestra
Se calculó de manera independiente para los grupos de sectores de actividad económica y tamaño de la empresa considerando los siguientes parámetros para el grupo y variable de interés.
Porcentaje de los parámetros Cuadro 5
Parámetros
Nivel de confianza = 95.0 %
Coeficiente de Variación (CV) 2.5 %
Tasa de no respuesta esperada (TNR), grupo I y II.a = 25.0 %
Variable de interés: grupo I = Bienes y servicios en el extranjeroc
Variable de interés: grupo II.a = Bienes y servicios totalesd
c Bienes y servicios en el extranjero = Total de ingresos por suministro de bienes y servicios (de las 13 variables de ingresos seleccionadas M000C_MARCO) + Total de gastos por consumo de bienes y servicios (de las 27 variables de gastos seleccionadas K000C_MARCO).
d Bienes y servicios totales = Total de gastos por consumo de bienes y servicios (K000A) + Total de ingresos por suministro de bienes y servicios (M000A).
Nota: El texto (sub) y (sup) en las fórmulas significa lo siguiente:
(sub) = subíndice
(sup) = superíndice
La expresión9 que se utilizó para calcular el tamaño de la muestra en cada dominio es la siguiente:
nd = [(sumatoria, desde h=2, hasta H(sub)d, de (N(sub)dh*S(sub)dh))(sup)2/((CV(sup)2(sub)d*T(sup)2(sub)d)+sumatoria, desde h=2, hasta H(sub)d, de (N(sub)dh*S(sup)2(sub)dh))]*(1/TR(sub)d)
Donde:
n(sub)d = tamaño de la muestra en el d-ésimo dominio
H(sub)d = número de estratos10 en el d-ésimo dominio
N(sub)dh = total de empresas en el marco, en el h-ésimo estrato, en el d-ésimo dominio
S(sub)dh = desviación estándar del h-ésimo estrato, del d-ésimo dominio para la variable de interés
CV(sub)d = coeficiente de variación del d-ésimo dominio
T(sub)d = total de la variable de interés en el d-ésimo dominio
S(sup)2(sub)dh = varianza del h-ésimo estrato, del d-ésimo dominio
TR(sub)d = 1-TNR(sub)d en el d-ésimo dominio
TNR(sub)d = tasa de no respuesta en el d-ésimo dominio
El tamaño de la muestra resultante para cubrir todos los dominios se obtiene después de realizar la afijación correspondiente a nivel grupos de sectores de actividad económica, tamaño de la empresa y estrato.
Afijación de la muestra
Para cada dominio de estudio se distribuyó la muestra en cada estrato por el método de Neyman,11 considerando la variable de bienes y servicios en el extranjero para el grupo I, así como bienes y servicios totales para el grupo II.a utilizando la siguiente expresión:
n(sub)dh = n(sub)d * ((N(sub)dh*S(sub)dh)/ sumatoria, desde h=2, hasta H(sub)d, de (N(sub)dh*S(sub)dh))
Donde:
n(sub)dh = tamaño de la muestra en el h-ésimo estrato, en el d-ésimo dominio
n(sub)d = tamaño de la muestra en el d-ésimo dominio
N(sub)dh = total de empresas en el marco, en el h-ésimo estrato, en el d-ésimo dominio
S(sub)dh = desviación estándar del h-ésimo estrato del d-ésimo dominio
H(sub)d = número de estratos10 en el d-ésimo dominio
El tamaño de la muestra total afijado que cubre los dominios fue de 5 997 empresas.
La distribución de la muestra por dominio, grupos de sectores de actividad económica, tamaño de la empresa y estrato, se presenta a continuación:
Distribución por grupos de sectores de actividad económica Cuadro 6
Grupos de sectores de actividad económica (Empresas)
Total = 5 997
Industriales = 3 358
De comercio = 1 374
De servicios = 1 265
Distribución por tamaño de la empresa Cuadro 7
Tamaño de la empresa (Empresas)
Total = 5 997
Grande = 2 576
Mediana = 1 036
Pequeña = 2 101
Micro = 284
Nota: No se contemplaron 182 empresas con problemática en los eventos de la ECIS 2021, ECIS 2022 y la ECIS 2023.
Anexos
A. 27 Variables cuantitativas de gastos de bienes y servicios en el extranjero de los CE 2019
Variablea Descripción
K841C Gastos por servicios de transporte por ductos (extranjero)
K842C Gastos por servicios de distribución (extranjero)
K317C Materias primas importadas consumidas propiedad de terceros (extranjero)
K510C Gastos por alquiler de bienes muebles (extranjero)
K520C Gastos por alquiler de bienes inmuebles (extranjero)
K531C Gastos por alquiler de equipo de transporte (extranjero)
K551C Gastos por alquiler de maquinaria y equipo para la exploración y extracción de petróleo (extranjero)
K590C Gastos por alquiler de otros bienes muebles (extranjero)
K610C Pagos a otra razón social que contrató y le proporcionó personal a este establecimiento (extranjero)
K620C Gastos por honorarios o comisiones sin sueldo o salario (extranjero)
K631C Gastos por servicios contables, legales y de administración (extranjero)
K632C Gastos por servicios profesionales de ingeniería técnica y de detalle (extranjero)
K635C Gastos por asesoría comercial, mercadotecnia y servicios conexos (extranjero)
K710C Gastos por maquila (extranjero)
K790C Gastos a terceros por servicios de exploración y perforación (extranjero)
K810C Gastos por publicidad (extranjero)
K950C Gastos por reparaciones y refacciones para mantenimiento corriente (extranjero)
K961C Gastos por fletes de productos vendidos (extranjero)
K962C Gastos por fletes de minerales vendidos (extranjero)
K991C Gastos de capacitación al personal (extranjero)
K999C Otros gastos por consumo de bienes y servicios (extranjero)
K832C Gastos por servicios de alimentación para tripulación y pasaje abordo (extranjero)
K931C Gastos por regalías (extranjero)
K633C Gastos por servicios logísticos (extranjero)
S530C Gastos por la exploración y prospección minera en campos mineros, petroleros y/o de gas con recursos propios (extranjero)
S531C Pagos a terceros por la exploración y prospección minera en campos mineros, petroleros y/o de gas (extranjero)
S532C Gastos por la exploración y prospección minera en campos mineros, petroleros y/o de gas con inversiones extranjeras (extranjero)
a El valor de las variables de gastos se especifican en miles de pesos.
B. 13 Variables cuantitativas de ingresos de bienes y servicios en el extranjero de los CE 2019
Variablea Descripción
M200C Ingresos por la prestación de servicios (extranjero)
M210C Servicio de transporte de pasajeros (extranjero)
M220C Servicio de transporte de carga (extranjero)
M230C Servicio de mensajería y paquetería (extranjero)
M241C Ingresos por la perforación de pozos petroleros y/o de gas (extranjero)
M242C Ingresos por otros servicios relacionados con la minería (extranjero)
M243C Ingresos por servicios de exploración y prospección minera en campos mineros, petroleros y/o de gas (extranjero)
M633C Ingresos por servicios logísticos (extranjero)
M823C Ingresos por transportación por ductos (extranjero)
M531C Ingresos por alquiler de equipo de transporte (extranjero)
M700C Ingresos por maquila (extranjero)
M999C Otros ingresos por suministro de bienes y servicios (extranjero)
M931C Ingresos por regalías (extranjero)
a El valor de las variables de ingresos se especifican en miles de pesos.
C. 3 Variables cualitativas de los CE 2019
Variable Descripción
G411A Indique si este establecimiento pertenece a algún grupo como: holding, grupo empresarial, grupo financiero, empresa controladora, entre otros
D311A Indique si existe participación de capital extranjero en el capital social de este establecimiento
D315A ¿Durante 2018 este establecimiento participó en procesos integrados mediante contratos o programas de colaboración económica con empresas ubicadas en otros países?
D. 10 Variables adicionales de los CE 2019
Variablea Descripción
K310A Materias primas y auxiliares consumidas propias (total)
K310C Materias primas y auxiliares consumidas propias (extranjero)
K000A Total de gastos por consumo de bienes y servicios (total)
K000C Total de gastos por consumo de bienes y servicios (extranjero)
M000A Total de ingresos por suministro de bienes y servicios (total)
M000C Total de ingresos por suministro de bienes y servicios (extranjero)
M310A Ventas netas de productos elaborados con materias primas propias (total)
M310C Ventas netas de productos elaborados con materias primas propias (extranjero)
K961A Gastos por fletes de productos vendidos (total)
H001A Total de personal ocupado (H000A+I000A)
a El valor de las variables de ingresos y gastos se especifican en miles de pesos.
3 En ediciones anteriores de esta encuesta, se denominaba gran sector.
4 Estratificación bivariada referente a la publicada en el Diario Oficial de la Federación (DOF) por la Secretaría de Economía el 30 de junio de 2009.
https://www.gob.mx/cms/uploads/attachment/file/50882/A539.pdf
5 Por el método: Jaccard, P. (1901) étude comparative de la distribution florale dans une portion des Alpes et du Jura. Bulletin de la Société Vaudoise des Sciences Naturelles, 37, 547-579.
6 Versión actualizada con el Registro Estadístico de Negocios de México (RENEM) de 07 de diciembre de 2020.
7 El valor de las variables de ingresos y gastos se especifican en miles de pesos.
8 Dalenius T. and Hodges J. Minimum Variance Stratification. Journal of the American Statistical Association Vol. 54, No. 285, 1959, pp. 88-101.
9 William G. Cochran, Técnicas de muestreo, 1980, pp. 135 y 136.
10 Excluye el estrato 1, definido como certeza.
11 William G. Cochran, Técnicas de muestreo, 1977, pp. 105 - 109.
Factores de expansión
Cálculo de factores de expansión
Se definió como el inverso de la probabilidad de seleccionar una empresa del h-ésimo estrato, del d-ésimo dominio de estudio.
La expresión de cálculo12 que se utiliza para el dominio-estrato es la siguiente:
f(sub)dh = N(sub)dh/n(sub)dh
Donde:
f(sub)dh = factor de expansión del h-ésimo estrato, del d-ésimo dominio
N(sub)dh = total de empresas en el marco, en el h-ésimo estrato, en el d-ésimo dominio
n(sub)dh = tamaño de la muestra en el h-ésimo estrato, en el d-ésimo dominio
Ajuste por no respuesta13
Se realizó a nivel dominio-estrato, como se presenta a continuación:
f '(sub)dh = f(sub)dh * n(sub)dh/nr(sub)dh
Donde:
f '(sub)dh = factor de expansión con ajuste por no respuesta del h-ésimo estrato, del d-ésimo dominio
f(sub)dh = factor de expansión del h-ésimo estrato, del d-ésimo dominio
n(sub)dh = tamaño de la muestra, en el h-ésimo estrato, en el d-ésimo dominio
nr(sub)dh = número de empresas con respuesta en el h-ésimo estrato, en el d-ésimo dominio
Estimadores
El estimador total nacional de la característica X se calcula con base en la fórmula:14
t^(sub)d = sumatoria, desde h=1, hasta H(sub)d * sumatoria, desde i=1, hasta n(sub)dh, de (f(sub)dh*x(sub)dhi)
Para la estimación de proporciones, tasas y promedios se utiliza el estimador de razón:15
R^(sub)d = X^(sub)d/Y^(sub)d
X^(sub)d y Y^(sub)d se definen en forma análoga a t^(sub)d.
Donde:
t^(sub)d = total estimado en el d-ésimo dominio
H(sub)d = número de estratos en el d-ésimo dominio
n(sub)dh = tamaño de la muestra en el h-ésimo estrato, en el d-ésimo dominio
f(sub)dh = factor de expansión del h-ésimo estrato, del d-ésimo dominio
x(sub)dhi = valor de la característica de interés en la i-ésima empresa, en el h-ésimo estrato, en el d-ésimo dominio
R^(sub)d = estimador de razón en el d-ésimo dominio
X^(sub)d= estimador total de la característica X del d-ésimo dominio
Y^(sub)d = estimador total de la característica Y del d-ésimo dominio
El estimador de la varianza del estimador del total de la característica X es
V^(t^(sub)d) = sumatoria, desde h=1, hasta H(sub)d, de N(sup)2 (sub)dh (1-n(sub)dh/N(sub)dh)* s(sup)2(sub)dh/n(sub)dh donde s(sup)2(sub)dh = 1/n(sub)dh-1 * sumatoria, desde i=1, hasta n(sub)dh [x(sub)dhi - Xmedia(sub) dh)(sup)]2
Donde:
V^(t^(sub)d)= varianza estimada del total estimado del d-ésimo dominio
(t^(sub)d) = total estimado en el d-ésimo dominio
H(sub)d = número de estratos en el d-ésimo dominio
N(sub)dh = total de empresas en el marco, en el h-ésimo estrato, en el d-ésimo dominio
n(sub)dh = tamaño de la muestra en el h-ésimo estrato, en el d-ésimo dominio
s(sup)2(sub)dh = varianza muestral del h-ésimo estrato, del d-ésimo dominio
x(sub)dhi = valor de la característica de interés en la i-ésima empresa, en el h-ésimo estrato, en el d-ésimo dominio
Xmedia(sub)dh = media muestral del h-ésimo estrato, del d-ésimo dominio
El estimador de la varianza del estimador de razón16 R^ de las características X y Y por dominio está dado por
V^(R^(sub)d) = 1/Y^ (sup)2(sub)d sumatoria, desde h=1, hasta H(sub)d, de ((N(sub)dh(N(sub)dh - n(sub)dh)/ n(sub)dh(n(sub)dh-1)) (sumatoria, desde i=1, hasta n(sub)dh [(x(sub)dhi - Xmedia(sub)dh) - (R^(sub)d(y(sub)dhi - Ymedia(sub)dh)](sup)2
Donde:
V^(R^(sub)d) = varianza del estimador de razón R^ del d-ésimo dominio
R^(sub)d = estimador de razón R^ del d-ésimo dominio
Y^(sub)d = estimador de total de la característica Y del d-ésimo dominio
H(sub)d = número de estratos en el d-ésimo dominio
N(sub)dh = total de empresas en el marco, en el h-ésimo estrato, en el d-ésimo dominio
n(sub)dh = tamaño de la muestra en el h-ésimo estrato, en el d-ésimo dominio
x(sub)dhi = valor de la característica de interés en la i-ésima empresa, en el h-ésimo estrato, en el d-ésimo dominio
Xmedia(sub)dh = media muestral del h-ésimo estrato, del d-ésimo dominio
y(sub)dhi = característica Y a estimar reportada en la i-ésima empresa, en el h-ésimo estrato, en el d-ésimo dominio
Ymedia(sub)dh = media muestral del h-ésimo estrato, del d-ésimo dominio
Error de estimación: EE^ = (raíz cuadrada de(V^(t^(sub)d))
Coeficiente de variación: CV^ = EE^/t^(sub)d
Intervalo de confianza: (t^(sub)d - Z(sub)1-a/2 raíz cuadrada de (V^(t^(sub)d)), t^(sub)d + Z(sub)1-a/2 raíz cuadrada de (V^(t^(sub)d)))
Donde:
EE^ = error de estimación
V^(t^(sub)d) = varianza estimada del total estimado del d-ésimo dominio
CV^ = coeficiente de variación
t^(sub)d = total estimado en el d-ésimo dominio
Z(sub)1-a/2 = valor de la distribución normal estándar para una determinada confianza
12 Sharon L. Lohr, Muestreo: Diseño y Análisis, 1972, p. 142.
13 Sharon L. Lohr, Muestreo: Diseño y Análisis, 1972, p. 264.
14 Kirk M. Wolter, Introducción a la estimación de la varianza, 2007, pp. 11-16.
15 Kirk M.Wolter, Introducción a la estimación de la varianza, 2007, p.240.Recuperado de https://www.stata.com/manuals15/svyvarianceestimation.pdf#svyvarianceestimation p. 6
16 Ibíd.