Pasar al contenido principal
Disponible enEspañol

Integración de los datos de DEPUALC - CARIBE a la Plataforma CEPALSTAT utilizando Redatam

22 de noviembre de 2021|Enfoques

La plataforma de la Distribución Espacial de la Población y Urbanización en América Latina y el Caribe (DEPUALC) consiste en una base de datos con información sobre la cantidad de habitantes y nivel de urbanización de las localidades pobladas a escala de división administrativa mayor (DAM) de acuerdo con los resultados de los censos desde 1950 a 2010. Identifica todos aquellos centros poblados (ciudades o aglomerados metropolitanos) que superaron los 20 mil habitantes en algún momento dentro del período temporal considerado. Dada la importancia de difundir esta información es que se comenzó a trabajar en la integración de los datos de DEPUALC con la plataforma CEPALSTAT facilitando el acceso a los datos de quienes utilizan la información estadística producida y publicada por CEPAL. Este documento describe el proceso que se está realizando con Redatam como software de procesamiento para la creación de la batería de indicadores que posee DEPUALC y que se integrará a CEPALSTAT. Se trabajó con varios de los países del Caribe que tenían disponible la base de datos de la ronda de censos del 2010.

En el contexto de la actualización de CEPALSTAT[1], es importante el mantener nuevos elementos en los portales estadísticos, para la difusión, utilización y seguimiento de indicadores de la región. Un elemento fundamental dentro de las nuevas funcionalidades de CEPALSTAT es la posibilidad de desplegar información geoespacial de los indicadores estadísticos que contiene, tanto a nivel nacional, como también a distintas desagregaciones territoriales o político administrativas que existen en los países de la región.

Dentro de esta dimensión de indicadores estadísticos geoespaciales, uno de los principales se encuentra en DEPUALC, Base de datos de Distribución Espacial de la Población y Urbanización en América Latina y el Caribe, producida y gestionada por el CELADE-División de Población de la CEPAL, cuya construcción y actualización es un aporte a la acumulación de información y explotación de fuentes censales a escala de ciudades y aglomerados metropolitanos, así como a divisiones administrativas mayores. Actualmente, se han sistematizado los antecedentes más elementales sobre la localización de la población regional, se ha individualizado a la población de todas las localidades de la región que han tenido 20 mil o más habitantes en algún momento censal desde 1950. Además, incluye información sobre la población total, urbana, rural y del conjunto de localidades que reúnen entre 2 mil y 20 mil habitantes de cada división administrativa mayor, y un conjunto de indicadores sociodemográficos, educativos y de equipamiento a nivel de ciudades, DAM[2] y área urbano-rural.

Es por esto, que la integración de los datos de DEPUALC a la Plataforma CEPALSTAT proporcionará el acceso a los datos estadísticos de ciudades y subdivisiones de cada país de la región, al público que utiliza la información producida y publicada por CEPAL.

Este documento, presenta como se realizó ese proceso de integración usando REDATAM 7 Process como software de procesamiento para la batería de indicadores que posee DEPUALC para los países del Caribe de la ronda de censos del 2010. Dentro de estas nuevas funcionalidades que cuenta REDATAM, utilizamos la cláusula TABOP, el cual nos permite simplificar la escritura de la programación de una sintaxis en la creación de indicadores y sus desagregaciones.

Procesamiento de indicadores para países del caribe

Para la migración de la base de datos DEPUALC, se calcularon una batería de indicadores sociodemográficos, migración, educativos y de equipamiento del hogar para los países que contaban con información para la ronda de censos de población 2010, los cuales fueron los siguientes:

  • Aruba 2010
  • Antigua y Barbuda 2011
  • Islas Caimán 2010
  • Granada 2011
  • Jamaica 2011
  • San Cristóbal y Nevis 2011
  • Santa Lucía 2010
  • Monserrat 2011
  • San Vicente y Las Granadinas 2012
  • Trinidad y Tobago 2011
  • Barbados 2010

Este análisis se realizó a nivel de División Administrativa Mayor (DAM) lo cual no presenta mayores problemas debido a que las primeras divisiones de los países caribeños presentan un reducido número unidades territoriales.

Para la creación de los indicadores, se estructuró la base de tal manera que cada uno de los indicadores que se presentan, tengan su código de país, año censal, indicador, decimales, orden, sexo, zona, y grupos de edad a los cuales se les asigna un código el que servirá de filtro para unidades administrativas y área urbano-rural (Tabla 1).

Tabla 1: Ejemplo de codificación de categorías
Tabla 1: Ejemplo de codificación de categorías

Con estos filtros se pudo generar la base de datos que contiene el valor para cada uno de los indicadores y sus distintas desagregaciones (Tabla 2)

Tabla 2: Ejemplo de estructura base de datos
Tabla 1: Ejemplo de codificación de categorías

A partir de esta estructura, se generaron los indicadores de DEPUALC que permitieran la alimentación de la base de datos CEPALSTAT por medio de una tabla en formato DBF.

Proceso de generación de indicadores

Como ya se mencionó antes, REDATAM generó una forma sencilla de crear indicadores, lo que permite reducir la sintaxis de los programas, lo que posibilita generar los indicadores en menor tiempo y esfuerzo. Para lograr esta optimización, se aplica la cláusula TABOP, que facilita la combinación de filtros que permiten generar una tabla de numerador y otra de denominador, facilitando la generación de un indicador calculado con otras variables (filtros).

Revisemos el caso del indicador “Índice de masculinidad”, para este caso se  usó la siguiente sintaxis:

// Hombres
TABLE  TOTHOM FREQ   DAME.MUN 
FILTER SEX = 1 AND  VIVIENDA.AREA = 1
TALLY  PERSON
// Mujeres
TABLE  TOTMUJ FREQ   DAME.MUN
FILTER SEX = 2 AND VIVIENDA.AREA = 1
TALLY  PERSON

Se define a la población Masculina y Femenina que vive en el área urbana (numerador y denominador).

 Y para el cálculo final de índice de masculinidad, se escribe la siguiente sentencia.

// Índice de masculinidad
TABLE INDSEXRAT AS TABOP OF (TOTHOM / TOTMUJ) * 100 

Como resultado, se obtiene una tabla final con la relación entre hombres y mujeres y área urbano-rural, como en este ejemplo de Haití 2003 (Tabla 3)

Tabla 3: Índice de masculinidad
Tabla 1: Ejemplo de codificación de categorías

Del mismo modo, se puede realizar el cálculo de Tasa de conclusión primaria que corresponde a los jóvenes entre 15 y 19 años con educación primaria, dividido por el total de jóvenes de 15 a 19 años (numerador y denominador).

// Jóvenes entre 15 y 19 años primaria
TABLE  QUINTO FREQ   DAM.REDCODE
FILTER PERSON.AGE > 14 AND PERSON.AGE < 20 AND (PERSON.NIVELEDU > 6)
TALLY  PERSON
WEIGHT PERSON.WGHT
// Jóvenes entre 15 y 19 años
TABLE EDADQUIN FREQ  DAM.REDCODE
FILTER PERSON.AGE > 14 AND PERSON.AGE < 20
TALLY  PERSON
WEIGHT PERSON.WGHT

El cálculo de Tasa se obtiene por:

// Tasa de Conclusión Primaria
TABLE TASAPRIM  AS TABOP OF (QUINTO/EDADQUIN)*100

Como resultado obtenemos el siguiente indicador (Antigua y Barbuda 2011):

Tabla 4: Tasa de Conclusión Primaria
Tabla 1: Ejemplo de codificación de categorías

El uso de la cláusula TABOP en un comando que aplica a las tablas de salida, es una mejora para las operaciones entre tablas y constantes, siempre que esas tablas estén previamente definidas en el programa. Este tipo de programa es el que se utiliza para todas las salidas de indicadores sociodemográficos, educativos, equipamiento del hogar y migración.

Integración de datos en CEPALSTAT (Formato SIDRA)

El formato SIDRA, permite generar un formato ASCII, el cual permite incluir una seria de campos que pueden ser llenados por variables relacionadas, es el sistema óptimo para la construcción de la base que permite alimentar la base de datos CEPALSTAT, ya que el sistema despliega información geoespacial de los indicadores estadísticos, tanto a nivel nacional, como también a las distintas desagregaciones territoriales.

Los parámetros SIDRA permiten ocupar campos con un valor y una posición en la tabla de resultados con esto se puede obtener la salida que se desea. Como se aprecia en la tabla siguiente, este formato se utiliza para la base DEPUALC.

Tabla 5: Formato de salida SIDRA
Tabla 1: Ejemplo de codificación de categorías

Para el mismo ejemplo del indicador “índice de masculinidad” la tabla de salida que continua después del TABOP se define de la siguiente forma.

SIDRA     "C:\...\hti-2003-ind-102.TXT" APPEND
SIDRAPARM "T=332 A=2003 V=102 D=4 N=2 O=3 C0=0 C1=0 C2=0"

Al generar el archivo ASCII, se obtiene el valor del indicador con los parámetros que se desean (país, año del censo, valor, ubigeo, nivel, orden, sexo, área, grupo etario). El uso de la cláusula TABOP y el formato SIDRA de salida, nos permite acortar los pasos en la programación y en la generación del indicador, de una manera más amigable para estructurar la base de datos, por consiguiente, simplifica la carga de información en la base CEPALSTAT, lo cual facilita la integración de la información.

Comentarios finales

El uso de Redatam a través de la cláusula TABOP y el formato de salida SIDRA facilitan la migración de los datos de DEPUALC a la base CEPALSTAT, pues permite crear los indicadores y sus desgregaciones en forma rápida y simple y exportarlos disminuyendo la posibilidad de errores a la hora de manejar las tablas en otras aplicaciones, ya que estas funciones permiten calcular y ordenar los indicadores que necesitamos.

Esto, finalmente permite mejorar los procesos de programación de indicadores, lo que facilito la carga de datos dentro de la base de CEPALSTAT ya que se genera un archivo de salida txt común para todos los indicadores.

Referencias

  • Distribución Espacial de la Población y Urbanización en América Latina y El caribe (DEPUALC)   https://celade.cepal.org/bdcelade /depualc/
  • Metodología óptima para la generación de indicadores utilizando Redatam, Alejandra Silva Asistente de Investigación, CELADE Alexandra Martínez Consultora CELADE
  • Calculando indicadores derivados de matrices de migración interna reciente: el uso de TABOP y TABLELIST de Redatam 7, Mario Acuña, Asistente de investigación, CELADE Laura García, Consultora, CELADE

.


[1] https://estadisticas.cepal.org/cepalstat/portada.html

[2] En el caso del censo de Haití 2003 se cosideraron las DAMEs y el aglomerado urbano de Puerto Principe.