En el contexto de la actualización de CEPALSTAT[1], es importante el mantener nuevos elementos en los portales estadísticos, para la difusión, utilización y seguimiento de indicadores de la región. Un elemento fundamental dentro de las nuevas funcionalidades de CEPALSTAT es la posibilidad de desplegar información geoespacial de los indicadores estadísticos que contiene, tanto a nivel nacional, como también a distintas desagregaciones territoriales o político administrativas que existen en los países de la región.
Dentro de esta dimensión de indicadores estadísticos geoespaciales, uno de los principales se encuentra en DEPUALC, Base de datos de Distribución Espacial de la Población y Urbanización en América Latina y el Caribe, producida y gestionada por el CELADE-División de Población de la CEPAL, cuya construcción y actualización es un aporte a la acumulación de información y explotación de fuentes censales a escala de ciudades y aglomerados metropolitanos, así como a divisiones administrativas mayores. Actualmente, se han sistematizado los antecedentes más elementales sobre la localización de la población regional, se ha individualizado a la población de todas las localidades de la región que han tenido 20 mil o más habitantes en algún momento censal desde 1950. Además, incluye información sobre la población total, urbana, rural y del conjunto de localidades que reúnen entre 2 mil y 20 mil habitantes de cada división administrativa mayor, y un conjunto de indicadores sociodemográficos, educativos y de equipamiento a nivel de ciudades, DAM[2] y área urbano-rural.
Es por esto, que la integración de los datos de DEPUALC a la Plataforma CEPALSTAT proporcionará el acceso a los datos estadísticos de ciudades y subdivisiones de cada país de la región, al público que utiliza la información producida y publicada por CEPAL.
Este documento, presenta como se realizó ese proceso de integración usando REDATAM 7 Process como software de procesamiento para la batería de indicadores que posee DEPUALC para los países del Caribe de la ronda de censos del 2010. Dentro de estas nuevas funcionalidades que cuenta REDATAM, utilizamos la cláusula TABOP, el cual nos permite simplificar la escritura de la programación de una sintaxis en la creación de indicadores y sus desagregaciones.
Procesamiento de indicadores para países del caribe
Para la migración de la base de datos DEPUALC, se calcularon una batería de indicadores sociodemográficos, migración, educativos y de equipamiento del hogar para los países que contaban con información para la ronda de censos de población 2010, los cuales fueron los siguientes:
- Aruba 2010
- Antigua y Barbuda 2011
- Islas Caimán 2010
- Granada 2011
- Jamaica 2011
- San Cristóbal y Nevis 2011
- Santa Lucía 2010
- Monserrat 2011
- San Vicente y Las Granadinas 2012
- Trinidad y Tobago 2011
- Barbados 2010
Este análisis se realizó a nivel de División Administrativa Mayor (DAM) lo cual no presenta mayores problemas debido a que las primeras divisiones de los países caribeños presentan un reducido número unidades territoriales.
Para la creación de los indicadores, se estructuró la base de tal manera que cada uno de los indicadores que se presentan, tengan su código de país, año censal, indicador, decimales, orden, sexo, zona, y grupos de edad a los cuales se les asigna un código el que servirá de filtro para unidades administrativas y área urbano-rural (Tabla 1).
Tabla 1: Ejemplo de codificación de categorías
Con estos filtros se pudo generar la base de datos que contiene el valor para cada uno de los indicadores y sus distintas desagregaciones (Tabla 2)
Tabla 2: Ejemplo de estructura base de datos
A partir de esta estructura, se generaron los indicadores de DEPUALC que permitieran la alimentación de la base de datos CEPALSTAT por medio de una tabla en formato DBF.
Proceso de generación de indicadores
Como ya se mencionó antes, REDATAM generó una forma sencilla de crear indicadores, lo que permite reducir la sintaxis de los programas, lo que posibilita generar los indicadores en menor tiempo y esfuerzo. Para lograr esta optimización, se aplica la cláusula TABOP, que facilita la combinación de filtros que permiten generar una tabla de numerador y otra de denominador, facilitando la generación de un indicador calculado con otras variables (filtros).
Revisemos el caso del indicador “Índice de masculinidad”, para este caso se usó la siguiente sintaxis:
// Hombres
TABLE TOTHOM FREQ DAME.MUN
FILTER SEX = 1 AND VIVIENDA.AREA = 1
TALLY PERSON
// Mujeres
TABLE TOTMUJ FREQ DAME.MUN
FILTER SEX = 2 AND VIVIENDA.AREA = 1
TALLY PERSON
Se define a la población Masculina y Femenina que vive en el área urbana (numerador y denominador).
Y para el cálculo final de índice de masculinidad, se escribe la siguiente sentencia.
// Índice de masculinidad
TABLE INDSEXRAT AS TABOP OF (TOTHOM / TOTMUJ) * 100
Como resultado, se obtiene una tabla final con la relación entre hombres y mujeres y área urbano-rural, como en este ejemplo de Haití 2003 (Tabla 3)
Tabla 3: Índice de masculinidad
Del mismo modo, se puede realizar el cálculo de Tasa de conclusión primaria que corresponde a los jóvenes entre 15 y 19 años con educación primaria, dividido por el total de jóvenes de 15 a 19 años (numerador y denominador).
// Jóvenes entre 15 y 19 años primaria
TABLE QUINTO FREQ DAM.REDCODE
FILTER PERSON.AGE > 14 AND PERSON.AGE < 20 AND (PERSON.NIVELEDU > 6)
TALLY PERSON
WEIGHT PERSON.WGHT
// Jóvenes entre 15 y 19 años
TABLE EDADQUIN FREQ DAM.REDCODE
FILTER PERSON.AGE > 14 AND PERSON.AGE < 20
TALLY PERSON
WEIGHT PERSON.WGHT
El cálculo de Tasa se obtiene por:
// Tasa de Conclusión Primaria
TABLE TASAPRIM AS TABOP OF (QUINTO/EDADQUIN)*100
Como resultado obtenemos el siguiente indicador (Antigua y Barbuda 2011):
Tabla 4: Tasa de Conclusión Primaria
El uso de la cláusula TABOP en un comando que aplica a las tablas de salida, es una mejora para las operaciones entre tablas y constantes, siempre que esas tablas estén previamente definidas en el programa. Este tipo de programa es el que se utiliza para todas las salidas de indicadores sociodemográficos, educativos, equipamiento del hogar y migración.
Integración de datos en CEPALSTAT (Formato SIDRA)
El formato SIDRA, permite generar un formato ASCII, el cual permite incluir una seria de campos que pueden ser llenados por variables relacionadas, es el sistema óptimo para la construcción de la base que permite alimentar la base de datos CEPALSTAT, ya que el sistema despliega información geoespacial de los indicadores estadísticos, tanto a nivel nacional, como también a las distintas desagregaciones territoriales.
Los parámetros SIDRA permiten ocupar campos con un valor y una posición en la tabla de resultados con esto se puede obtener la salida que se desea. Como se aprecia en la tabla siguiente, este formato se utiliza para la base DEPUALC.
Tabla 5: Formato de salida SIDRA
Para el mismo ejemplo del indicador “índice de masculinidad” la tabla de salida que continua después del TABOP se define de la siguiente forma.
SIDRA "C:\...\hti-2003-ind-102.TXT" APPEND
SIDRAPARM "T=332 A=2003 V=102 D=4 N=2 O=3 C0=0 C1=0 C2=0"
Al generar el archivo ASCII, se obtiene el valor del indicador con los parámetros que se desean (país, año del censo, valor, ubigeo, nivel, orden, sexo, área, grupo etario). El uso de la cláusula TABOP y el formato SIDRA de salida, nos permite acortar los pasos en la programación y en la generación del indicador, de una manera más amigable para estructurar la base de datos, por consiguiente, simplifica la carga de información en la base CEPALSTAT, lo cual facilita la integración de la información.
Comentarios finales
El uso de Redatam a través de la cláusula TABOP y el formato de salida SIDRA facilitan la migración de los datos de DEPUALC a la base CEPALSTAT, pues permite crear los indicadores y sus desgregaciones en forma rápida y simple y exportarlos disminuyendo la posibilidad de errores a la hora de manejar las tablas en otras aplicaciones, ya que estas funciones permiten calcular y ordenar los indicadores que necesitamos.
Esto, finalmente permite mejorar los procesos de programación de indicadores, lo que facilito la carga de datos dentro de la base de CEPALSTAT ya que se genera un archivo de salida txt común para todos los indicadores.
Referencias
- Distribución Espacial de la Población y Urbanización en América Latina y El caribe (DEPUALC) https://celade.cepal.org/bdcelade /depualc/
- Metodología óptima para la generación de indicadores utilizando Redatam, Alejandra Silva Asistente de Investigación, CELADE Alexandra Martínez Consultora CELADE
- Calculando indicadores derivados de matrices de migración interna reciente: el uso de TABOP y TABLELIST de Redatam 7, Mario Acuña, Asistente de investigación, CELADE Laura García, Consultora, CELADE