Los censos nacionales de población y vivienda son la operación estadística fundamental para el diseño de políticas públicas. Históricamente, el principal desafío metodológico ha sido la omisión censal (subcobertura). En respuesta a una omisión reportada del 3% en la reciente enumeración, el Instituto Nacional de Estadística e Informática (INEI) ha anunciado una estrategia innovadora: la habilitación de una plataforma de «autocensado» (self-enumeration) vía internet para las viviendas no contactadas. Este artículo analiza las implicaciones de esta decisión.
Si bien la medida representa un avance pragmático hacia un modelo censal híbrido (mixto) y busca mitigar el error de cobertura cuantitativo, introduce desafíos significativos en términos de calidad del dato, sesgo de selección y la brecha digital. El análisis concluye que, aunque la iniciativa es positiva para modernizar la recolección de datos, su éxito dependerá de la capacidad del INEI para validar y ponderar esta nueva fuente de datos (autogestionada) frente a los datos
1. Introducción:
La realización de un censo nacional es un ejercicio logístico y estadístico de máxima complejidad. Su objetivo es alcanzar una cobertura universal de todas las viviendas y habitantes en un territorio definido. Sin embargo, en la práctica, todos los censos experimentan un grado de omisión censal, definida como el fracaso en enumerar a personas o viviendas que debieron ser incluidas (UNECE, 2020).
Tradicionalmente, la omisión censal (subcobertura) se corrige ex post facto mediante encuestas de post-empadronamiento (EPE) y ajustes estadísticos (ponderaciones). El reciente anuncio del INEI de que el 3% de viviendas omitidas podrá registrarse activamente por internet rompe con este paradigma. En lugar de ajustar la muestra, el INEI busca recuperar el dato directo del omitido.
Este artículo evalúa críticamente esta nueva estrategia, situándola en el debate global sobre la modernización de los censos y la transición de métodos de entrevista cara a cara (PAPI/CAPI) a métodos de autollenado por internet (CAWI – Computer-Assisted Web Interviewing).
[Imagen de un flujograma comparando el censo tradicional (enumerador) vs. el censo híbrido (enumerador + autocensado web)]
2. Análisis Metodológico: El Giro hacia el Censo Híbrido:
La decisión del INEI de implementar una solución digital para la subcobertura es, en efecto, la adopción de un modelo de censo híbrido o mixto. Este modelo combina diferentes modos de recolección de datos.
2.1. El Autocensado (Self-Enumeration)
El núcleo de la propuesta es el «autocensado». En este modelo, la responsabilidad de registrar la información se transfiere del enumerador (agente capacitado) al respondiente (jefe de hogar).
Ventajas Potenciales:
Reducción de Costos: Disminuye el costo de re-visita de enumeradores.
Conveniencia: El respondiente puede completar el censo en el momento que le sea más conveniente, reduciendo la no-respuesta por «ausencia».
Velocidad: Los datos ingresan directamente al sistema, eliminando la digitación.
Desafíos Inmediatos:
Calidad del Dato: El respondiente no está capacitado. Existe un alto riesgo de error de medición si las preguntas son compleas (ej. «material de construcción predominante», «condición de ocupación»).
Validación de Identidad: El INEI debe implementar un sistema robusto para asegurar que la vivienda que se registra (a) realmente fue omitida y (b) no se duplica.
3. El Problema del Sesgo de Selección y la Brecha Digital:
El desafío más significativo de esta estrategia no es técnico, sino estadístico: el sesgo de selección.
La omisión censal del 3% no es un grupo homogéneo ni aleatorio. La literatura estadística demuestra que la omisión afecta desproporcionadamente a ciertos perfiles:
Hogares en zonas de difícil acceso (rurales, periurbanos).
Hogares en edificios de alta seguridad (gated communities) con difícil acceso para el enumerador.
Hogares unipersonales o con alta movilidad.
Poblaciones vulnerables (sin vivienda fija, migrantes).
La estrategia de recuperación vía internet (autocensado) solo será accesible para un subconjunto de ese 3% omitido: aquellos con conectividad a internet y alfabetización digital.
3.1. El Sesgo Introducido
Es altamente probable que las viviendas omitidas del Perfil 2 (alta seguridad, nivel socioeconómico alto) tengan mayor capacidad y disposición para autocensarse por internet que las viviendas del Perfil 1 o 4.
[Imagen de un gráfico ilustrando la brecha digital en el acceso a internet entre zonas urbanas y rurales]
Si el INEI incorpora estos datos directamente, corre el riesgo de sobrerrepresentar las características de los hogares omitidos con acceso digital, y seguir subrepresentando a los hogares omitidos sin acceso. La omisión cuantitativa (el 3%) podría bajar, pero la omisión cualitativa (la representatividad de grupos vulnerables) podría, paradójicamente, empeorar.
4. Discusión e Implicaciones:
La implementación de un sistema de autocensado web por parte del INEI es una señal de modernización necesaria. Muchos países (como EE.UU. o Canadá) ya operan bajo un modelo «Internet First». Sin embargo, estos países lo hacen como primera opción de recolección, no como última opción de recuperación.
La decisión del INEI plantea preguntas críticas que deben ser abordadas con transparencia metodológica:
Integración de Datos: ¿Cómo se ponderarán e integrarán estos datos de autocensado con los datos recopilados por enumeradores? La fuente (y por ende la calidad) es distinta.
Validación: ¿Qué mecanismos de control de calidad se usarán para limpiar y validar las respuestas autogestionadas?
El 3% Inaccesible: ¿Qué estrategia se usará para el subgrupo del 3% omitido que tampoco tiene acceso a internet? ¿Se asumirá que ese grupo es estadísticamente similar al que sí respondió por la web?
5. Conclusión:
El anuncio del INEI de permitir el censado por internet para el 3% de viviendas omitidas es un hito en la historia censal peruana. Representa un esfuerzo loable por reducir el error de cobertura y modernizar las herramientas de recolección de datos.
No obstante, esta estrategia no está exenta de riesgos metodológicos severos. El principal desafío es el sesgo de selección inherente a la brecha digital. El éxito de esta medida no debe medirse por cuántas personas del 3% logran registrarse, sino por la capacidad del INEI para demostrar que esta nueva fuente de datos no introduce más sesgos de los que resuelve.
El INEI debe publicar la metodología detallada de cómo tratará estos datos para asegurar la confianza pública en la calidad final del censo, que sigue siendo el pilar para la distribución de recursos y la toma de decisiones en el país.
Leave a comment