https://economiatyp.uam.mx/index.php/ETYP | Economía, Teoría y Práctica
http://dx.doi.org/10.24275/ETYPUAM/NE/542021/Parada | (54), 137-159, enero-junio 2021

Artículos

 

Globalización comercial y desigualdad: un análisis con Árboles Clasificadores

Trade Globalization and Inequality: A Classification Trees Analysis

Ana Cecilia Parada Rojas*

Jorge Omar Razo de Anda**

Humberto Ríos Bolívar***


* Escuela Superior de Economía, Instituto Politécnico Nacional, México. E-mail: acecilia.parada@gmail.com. ORCID: 0000-0003-1079-3502.

** Escuela Superior de Economía, Instituto Politécnico Nacional, México. E-mail: jorgerazodeanda@gmail.com. ORCID: 0000-0002-1566-1878.

*** Escuela Superior de Economía, Instituto Politécnico Nacional, México. E-mail: hrios@ipn.mx. ORCID: 0000-0002-7872-7037.


Resumen:

Este documento analiza el fenómeno de la desigualdad en el ingreso mediante un enfoque de interacción multidimensional, cuyas dimensiones son componentes derivadas de un proceso de globalización comercial. Para tal propósito, se utiliza una metodología de Redes Complejas, donde la confiabilidad del análisis recae en el proceso de modelado Bootstrapping, el cual consiste en discriminar Árboles Clasificadores con base en su eficiencia y estabilidad, construidos a partir de un muestreo aleatorio. Los resultados indican que cambios de desigualdad en el ingreso, derivados de una mayor integración económica, dependen del crecimiento urbano y del estado de derecho en países mayormente agrícolas; en países con un fuerte sector servicios dependen de su capacidad para trasformar su mano de obra calificada en exportaciones de alta tecnología y crecimiento económico.

Palabras clave: Desigualdad, Globalización comercial, Arboles de Decisión Clasificadores.

Clasificación JEL: C44, D33, E25, F1, F2.

Abstract:

This paper analyzes the income inequality phenomenon through a multidimensional interaction approach whose dimensions are components of a trade globalization process. A Complex Networks methodology is used. The analysis reliability lies in Bootstrapping process, which consists of identifying Classification Trees from a random sampling, by their efficiency and stability. Results indicate that the income inequality changes, derived from greater economic integration, depend on urban growth and the rule of law in agricultural countries; in countries with a strong service sector they depend on the ability to transform their qualified labor into high-tech exports and economic growth.

Keywords: Income Inequality, Globalization Trade, Classification and Regression Tree (CART).

JEL Classification: C44, D33, E25, F1, F2.

 

Recibido: 25/03/2019.
Aceptado: 08/04/2020.

 
 

Introducción

El estudio de la desigualdad en el ingreso es un tema que permanentemente está en el debate de la vida académica y en la discusión de la política pública; más allá del debate y de la discusión, el tema se ha vuelto una prioridad para la mayoría de los países del mundo. Se trata de un fenómeno complejo que surge y se transmite a partir de múltiples causas económicas y sociales, y se manifiesta mediante una connotación negativa asociada a un marcado sesgo en la concentración de los ingresos de las personas. En la actualidad existen estudios que advierten de un marcado aumento en la desigualdad atribuido al proceso de globalización (Harrison y Hanson, 1999; Ravallion, 2018 y Dorn et al., 2018) y que se potencializaron con el cambio tecnológico (Bourguignon, 2017) principalmente en materia de tecnologías de la información y comunicación (Dollar, 2004 y Aghion et al., 2018).

A partir de la década de los años ochenta y de una tendencia hacia los tratados del libre comercio, se percibieron incrementos de desigualdad en el ingreso de los hogares dentro de los países (International Monetary Fund, 2007; Atkinson, Piketty y Saez, 2011). La hipótesis de este trabajo indica que la globalización comercial tiene distintos efectos sobre la desigualdad dependiendo del periodo de estudio, las características de los datos y de las circunstancias de cada país, específicamente la estructura del mercado laboral, la educación de la fuerza de trabajo, el tipo de exportaciones pero también sus instituciones y políticas sociales. Por lo que el objetivo de este trabajo es analizar cómo interactúan los diferentes factores que influyen en el efecto sobre la desigualdad cuando aumenta la globalización comercial.

Existe una amplia variedad de trabajos que analizan este tema, a través de paneles de datos econométricos (Jauch y Watzka, 2016; Asteriou et al., 2014; Dorn et al., 2018; Mushtaq y Bruneau, 2019) con diferentes enfoques y conclusiones que además descuidan las características específicas de los países (Jauch y Watzka 2016). En este trabajo utilizamos un algoritmo de machine learning que discrimina variables independientes por sí solo para encontrar un modelo árbol clasificador que además es más eficiente (Varian, 2014). Este tipo de modelos no paramétricos es ampliamente utilizado en áreas como la biología (Mu et al., 2018), medicina (Nahar y Ara, 2018) o finanzas (Fiévet y Sornette, 2018 y Ma y Lv, 2019) pero poco común en el análisis de fenómenos sociales como la globalización.

Este documento contribuye a la comprensión del fenómeno de la desigualdad en el ingreso al proporcionar primero una delimitación de los efectos derivados de una mayor interacción comercial. Se construye un índice de globalización comercial utilizando la distancia de Mahalonobis, con base en el cual se filtran las circunstancias donde este índice presenta aumentos. Posteriormente se construyen y discriminan árboles clasificadores, mediante una técnica de minera de datos, flexible y no paramétrica, el modelo encontrado permite analizar las relaciones entre las variables y como se combinan para que una situación se presente, en este caso, cambios en la distribución del ingreso. Esta herramienta de clasificación permite entender el fenómeno de estudio, ya que aporta información a través de la extracción y análisis de reglas de conocimiento (Faraway, 2016). Sin embargo, los criterios de decisión pueden cambiar con base en los parámetros y conjunto de datos de entrada. Por lo que se realiza un proceso de Bootstrapping o muestreo aleatorio del 75 por ciento de los datos para construir poco más de cien árboles, de entre los que se selecciona el más confiable considerando su eficiencia y estabilidad.

En el análisis de las reglas proporcionadas por el modelo, se identifica a la estructura del mercado de trabajo como característica determinante. Discriminando países agrícolas, pero con potencial de urbanización como los beneficiarios del comercio, mientras que los países con empleo en el sector servicios aumentan su desigualdad en periodos de estancamiento o cuando no exportan alta tecnología.

En la siguiente sección se realiza una revisión de la literatura sobre los determinantes de la desigualdad y mecanismos asociados a aumentos de interacción comercial, en la cual se describe el debate sobre efectos vía salarios, el papel del estado de bienestar y del progreso tecnológico. A partir de ahí se describen los factores incluidos en el análisis, que diferencian a los países en ciertos periodos de tiempo, y se propone un índice de globalización comercial que permite filtrar situaciones con creciente grado de apertura comercial. Después, se describe la técnica de Árboles Clasificadores, incluyendo tanto el algoritmo de entrenamiento como su evaluación y el proceso de modelado para seleccionar el árbol más confiable y estable. Finalmente, se analizan cada una de las reglas de conocimiento extraídas del mejor modelo y, por último, se presentan las conclusiones generales.

I. Desigualdad y globalización comercial

Los cambios en la desigualdad en el ingreso dentro de un país se atribuyen principalmente a fenómenos de urbanización (Kuznets, 1955), crecimiento económico (Kraay y Dollar, 2001), progreso tecnológico (Lawrence et al., 1993) y recientemente a la globalización (Aghion et al., 1999; Atkinson, 2015; Jaumotte et al., 2013 y Bourguignon, 2017).

Para medir la desigualdad entre los hogares dentro de un país, se toma el coeficiente de GINI después de impuestos y transferencias, por ser un índice agregado de la distribución del ingreso y más sensible ante cambios en los extremos (clase alta y baja) que en los medios (clase media); además de ser comúnmente utilizado para este tipo de análisis (Sylwester, 2002; Choi, 2006; Asteriou et al., 2014 y Aghion et al., 2018). Con el fin de analizar los cambios en el tiempo y entre países se utilizan los valores de la swiid 5.0 por sus siglas en inglés “The Standardized World Income Inequality Database”. Esta base de datos contiene los valores estandarizados de los coeficientes de GINI estimados por instituciones internacionales, a través de algoritmos de imputación múltiple de datos perdidos (Solt, 2016); además de ser un recurso utilizado en diversas investigaciones (Palma y Stiglitz, 2016; Heathcote et al., 2017 y Jeon y Kabukcuoglu, 2018).

I.1. Determinantes de la desigualdad

En 1950 Kuznets identifica una relación entre el progreso y la desigualdad, a través de dos fuerzas que polarizan la distribución del ingreso debido al desarrollo de los países: la concentración de ahorro de los más ricos y la urbanización, esta última considera la diferencia de ingresos entre la población rural e industrial, por su parte la concentración de ahorro es afectada principalmente por políticas fiscales, fenómenos demográficos, emprendimiento de nuevas industrias y cambios en la proporción de ingresos por servicios.

Bluestone y Harrison (1982) estudian la baja productividad y el cambio estructural del empleo en el sector servicios, industrial y agrícola. Cuando las ciudades se industrializan el ingreso de las personas que trabajaban en este sector es mayor que en el sector agrícola, por lo que la desigualdad aumenta, pero conforme se va dando la movilidad ésta disminuye. Entonces, el cambio estructural en el ingreso se caracterizó por un crecimiento económico debido al proceso de industrialización, pero seguido de un proceso de desarrollo que conjunta mecanismos de reducción de la población, políticas fiscales y sociales, consistente con la u invertida de la hipótesis de Kuznets (1955). La teoría convencional del bienestar social sostiene que incrementar el producto per cápita de un país mejorará el bienestar de toda la población incluyendo el de los más pobres (Deininger y Squire, 1996).

Empíricamente la hipótesis de Kuznets se cumple en 1970 para la mayoría de los países de la ocde, mas no para países en desarrollo o poco desarrollados; a partir de 1980 la curva de Kuznets ya no es tan clara, por ello surge la necesidad de nuevas teorías para entender esta relación (Aghion et al., 1999), contexto en el que se sostiene que la globalización (principalmente la apertura comercial) en combinación con el progreso tecnológico son las fuerzas responsables de las desigualdades contemporáneas (Bourguignon, 2017). El reporte del Fondo Monetario Internacional 2007 y Atkinson, Piketty, y Saez (2011), entre otros, mencionan que en las últimas décadas la desigualdad en el ingreso aumentó en la mayoría de los países.

I.2. Globalización comercial

La globalización es un proceso de integración económica entre las economías del mundo que reconfiguran la estructura e interacción de los mercados a nivel internacional. Económicamente podemos separar la globalización en dos etapas, la primera de 1870 a 1914 enfocada principalmente en la integración financiera y la movilidad, y la segunda considerando la globalización contemporánea a partir de 1914 (Milanovic, 2016). A pesar de que durante la segunda guerra mundial se dio un retroceso en la globalización, con el final de la guerra se restableció el rumbo de la integración económica, bajo el cobijo del Acuerdo General de Aranceles y Comercio (GATT) en el que se fomenta el libre comercio. Sin embargo, Dollar (2004) identifica un hito detonado por la apertura comercial de China en 1978, que contribuyó al desarrollo de las crisis originadas por la deuda externa en los países latinoamericanos, lo que a su vez llevó a estas economías a cambiar su estrategia de sustitución de importaciones (para fortalecer la industria interna) a una estrategia orientada al exterior, es decir, al incremento de exportaciones hacia economías desarrolladas. La entrada de China al mercado mundial tuvo tal impacto, que los términos de intercambio de muchas economías aumentaron drásticamente (Bourguignon, 2017).

Debido a lo anterior, este trabajo se enfoca en la globalización contemporánea a partir de 1980, periodo en el que este fenómeno se potencializó por los avances tecnológicos y de comunicación, aunado a la firma de tratados de libre comercio (Dollar, 2004).

I.2.1. Efecto de la globalización comercial vía salarios

El argumento clásico sobre la apertura comercial y el libre intercambio de mercancías, recae en la ventaja comparativa de David Ricardo asociada a la reasignación óptima de los factores productivos que aumenta el bienestar económico. Sin embargo, las asimetrías de información y mercados incompletos distorsionan dicha eficiencia (Stiglitz, 2010).

El debate sobre el efecto de la globalización comercial, entendida como la apertura de mercados e interacción económica a través de las relaciones comerciales para el intercambio de bienes y servicios, sobre la economía y el bienestar, no es nuevo. En 1941 Stolper y Samuelson presentan su teorema, el cual sostiene que la apertura comercial disminuye la desigualdad entre los salarios de los trabajadores de un país en desarrollo dotado de fuerza de trabajo no calificada, debido a una mayor demanda de este tipo de mano de obra, sin embargo, sucede lo contrario en países desarrollados, donde disminuye la demanda de trabajadores no calificados y aumenta la desigualdad (Stolper y Samuelson, 1941). Entonces, los precios de los factores de producción se equilibran en los países que comercian entre sí, debido a que la producción aumenta en los países con abundante mano de obra. Este proceso hace que las empresas menos productivas salgan del mercado, e incentiva a las empresas a seleccionar a los trabajadores más capaces, aumentando la desigualdad en el salario entre el trabajo calificado y no calificado, efecto conocido como prima salarial (Helpman et al., 2010), aunque a largo plazo la clase trabajadora gana debido a los aumentos de productividad (Shahbaz, 2010). Empíricamente, Han et al., (2012) utilizan el modelo Heckscher-Ohlin incluyendo la ventaja salarial de los trabajadores con mayores niveles de educación, e indican que el teorema no se cumple. Goldberg y Pavcnik (2007) encuentran que tras aumentos de globalización comercial la desigualdad salarial entre grupos por sector económico aumenta tanto en países en desarrollo como desarrollados y dentro de los grupos (Helpman et al., 2010).

I.2.2. Papel del progreso tecnológico

A partir de los avances tecnológicos en 1980, no sólo aumentó la integración económica, sino que afectó la manera en la que se distribuyen los mercados y el tipo de exportaciones de países en desarrollo hacia economías desarrolladas; “los reproductores de cd de China, los refrigeradores de México y los programas informáticos de Tailandia” (Dollar, 2004: 150). Según Asteriou et al. (2014), la desigualdad disminuyó en los países europeos debido a que exportan alta tecnología (maquinaria para procesos industriales producidas con alto grado de investigación y desarrollo).

Lawrence et al. (1993) sostienen que la desigualdad viene mayormente por el cambio tecnológico, Aghion et al. (2018) y Permana et al. (2018) encuentran una correlación positiva entre las medidas de innovaciones y la desigualdad. El auge de los mercados tecnológicos afecta la demanda de trabajo, pues las empresas dedicadas a las innovaciones requieren empleados con un mayor grado de educación. Los cambios tecnológicos nacen en los países desarrollados y suelen estar enfocados en ahorrar mano de obra y sustituir capital por trabajo no calificado. Lo que genera desigualdades en los salarios tanto en países en desarrollado como desarrollados (Agénor, 2002), además de generar una dependencia tecnológica. Jaumotte et al. (2013) encuentran que tanto el progreso tecnológico como la integración financiera benefician al 20 por ciento de la población más rica de un país. Santos et al. (2017) analizan tecnologías como la telefonía y el internet y encuentran que son habilidades complementarias para aumentar la desigualdad. Por otro lado, las tics pueden reducir tanto la pobreza como la desigualdad a través de la inclusión y desarrollo financiero (Jauch y Watzka, 2016 y Mushtaq y Bruneau, 2019).

I.2.3. Enfoque institucional

El efecto de la globalización sobre la desigualdad también depende de las instituciones y políticas públicas y fiscales. De hecho, el estado de bienestar de cada país puede evitar los aumentos de desigualdad, lo que permite un crecimiento sostenido y una integración económica exitosa (Atkinson, 2015). Akerman et al. (2013) muestran que países sin instituciones que protejan el mercado laboral presentan desigualdad salarial. Según Kaufmann et al. (2009) las políticas muchas veces tienen efectos adversos debido a la ineficacia del Estado para implementarlas. Atkinson (2015) enfatiza el papel de los índices de gobernanza, medidas proteccionistas, como factor clave en la determinación de la desigualdad. Los países con altos niveles de corrupción difícilmente pueden redistribuir los recursos, además enfrentan mayores costos de exportaciones dificultando obtener beneficios de la globalización (Dollar, 2004), sin embargo, North (1990) sostiene que la globalización también puede inducir cambios en el ambiente institucional, aunque éstos pueden ser lentos. Desde otro punto de vista Haseeb et al. (2019) indican que la globalización dificulta el desarrollo humano e incrementa la brecha entre los ingresos y las habilidades de los trabajadores; siendo además la desigualdad una fuente de deterioro social, recomiendan la intervención del Estado a través de políticas sociales haciendo énfasis en el desarrollo rural.

I.3. Porque las teorías y resultados divergen

A pesar de ser un tema ampliamente estudiado, no hay un consenso sobre el efecto de la globalización sobre la desigualdad. Las aportaciones de las investigaciones empíricas dependen, por una parte, de los países incluidos en el estudio, el periodo, la medición de la desigualdad tanto de forma como de rigor (Ravallion, 2003), y por otra dependen de la perspectiva teórica en la que influye el tipo de desigualdad analizada (Nissanke y Thorbecke, 2007) y el enfoque, por ejemplo, desde el punto de vista de los países desarrollados o industrializados, en los que la desigualdad aumentó tras firmar tratados de libre comercio (Alderson y Nielsen, 2002) aunado al progreso tecnológico, y desde el punto de vista de los países en desarrollo o economías emergentes, que durante los años 90 redujeron su desigualdad beneficiándose del comercio Dollar (2004) vía salarios.

En general, los países en desarrollo y desarrollados percibieron distintos efectos debido a la estructura del empleo, la educación (Sylwester, 2002), tecnología (Dorn et al., 2018) o capacitación de mano de obra y tipo de exportaciones (Akerman et al., 2013), pero también influyen sus instituciones y políticas sociales, ya que, éstas permiten que un país se beneficie o no de los procesos de integración económica (Atkinson, 2015).

II. Descripción de los datos

Debido a la complejidad de la interacción entre la globalización comercial y la desigualdad en el ingreso, no existe una teoría o regla general que inequívocamente describa la relación entre estos fenómenos, tal efecto depende de las circunstancias de cada país. Razón por la cual se realiza un análisis multidimensional que incluye factores de población, empleo, gasto e inversión, además de los índices de gobernanza, variables comerciales, financieras y tecnológicas, que se aprecian en el Cuadro 1, estructurados en panel de datos por país y año. Cabe mencionar que no se incluyó el factor país en desarrollo o desarrollado, porque existen diferentes clasificaciones que incluyen distintas características, además consideramos un enfoque dinámico donde una economía cambia en el tiempo.

 

Cuadro 1 Descripción de las variables.

Código Descripción Código Descripción
Población y Empleo* Comerciales*
GDP_R Tasa de crecimiento
POB_URB Población urbana (Tasa de crecimiento.) MT Intercambio de mercancías (% PIB)
TFERA Tasa de fertilidad en adolescentes TERM_TRADE Índice de términos de Intercambio
ESP_VIDA Esperanza de vida al nacer (años) IM_GS_P Importación de bienes y servicios (% PIB)
EM_IND Empleo en el sector industrial (% Emp.) EXP_GS_P Exportaciones de bienes y servicios (% PIB)
EM_SERV Empleo en el sector servicios (% Emp) HTE_T Exportaciones de alta tecnología (% PIB)
EM_AGR Empleo en el sector agrícola (% Emp) HTE_PM Exportaciones de alta tecnología (% Manufac.)
Gasto e Inversión *** Financieras
IPRIV Inversión privada (% PIB) DEB_GDP Deuda pública histórica (% PIB)*
KGOV Stock de capital público (% PIB) RERV Reservas y otros (% PIB)***
KPRIV Stock de capital privado (% PIB) LDI Total de pasivos de inversión directa (% PIB)***
GMILTAR Gasto militar (% PIB) *
Índices de gobernabilidad** Tecnológicas
COR Control de corrupción
GEF Eficiencia de los gobernantes CRED_TICS Crédito a tecnologías de inf. (% PIB)***
ESP Estabilidad política US_INT Usuarios de internet (por cada 100 personas) *
CREG Calidad de las regulaciones
RL Imperio de la ley

* wb-World Bank Data, World Development Indicators.

** wgi-Worldwide Governance Indicators.

*** imf-International Monetary Found.

 

La periodicidad de los datos corresponde a los años entre 1996 y 2016, debido a que los índices de gobernabilidad empiezan a publicarse a partir de 1996, y la última versión de los coeficientes de GINI publicados por Solt contiene información hasta el año 2016. Cabe mencionar que se trabaja con una estructura de datos tipo panel no balanceado, lo que implica que el marco temporal cambia según la variable y el país.

II.1. Índice de globalización

Para medir qué tan globalizado está un país se calcula un índice utilizando la distancia de Mahalonobis entre las principales variables comerciales. Esta medida es ampliamente usada en diversos campos para la clasificación y el reconocimiento de patrones estadísticos en relaciones multivariantes; considera las desviaciones y covariancia , donde (xμ) T es una matriz transpuesta que contiene las diferencias de los valores con respecto a su media, μ, y Σ‒1 es la matriz de varianzas-covarianzas inversa de las variables (McLachlan, 1999), y x es la matriz de atributos. Este índice incluye el volumen de importaciones y exportaciones con respecto al PIB (EXP_GS_P y IMP_GS_P), el intercambio de mercancías finales (MI) y los términos de intercambio (TERM_TRADE). El Índice de Globalización Comercial (IGC ) se estima con 4,234 observaciones IGC = DM (EXPGSP , IMPGSP , MT, TERMTRADE ).

Como se puede apreciar en la Figura 1, tanto el índice como las variables que lo conforman tienen valores extremos.1 Debido a que la muestra de interés únicamente considera cambios de desigualdad con respecto a cambios positivos en la globalización comercial. Como primer paso se procede a realizar un filtro que garantice que las observaciones cumplan con estas características. Para tal fin, se calculan los cambios en el IGC como las diferencias entre las observaciones por año, con el objetivo de analizar los cambios de la desigualdad cuando aumenta la globalización comercial. Posteriormente se filtran las observaciones de modo que cumplan los siguientes requisitos: cambios positivos en IGC de un año a otro (‘c+ ‘) y de la misma forma se descartaron aquellos registros donde no se presentaron cambios de desigualdad c_1ndGC = ‘c+ ‘ y c_GINI < > ‘sc’.

 

Figura 1 Distribución del Índice de Globalización Comercial.

Fuente: elaboración propia en R.

 

El modelo se construye con base en un conjunto de datos que considera los 27 factores descritos en el Cuadro 1; después de filtrar los datos se tienen 1,241, sin embargo, muchos de éstos incluyen valores nulos en alguna variable, por lo que, en estos casos se opta por eliminar el registro completo. Es importante mencionar que, a pesar de la pérdida de información por el proceso de filtrado anterior, la base cuenta con información referente a 72 países y distintas regiones, lo que cumple por el criterio de numerosidad y el teorema del límite central de una muestra representativa global.

En el Cuadro 2 se muestra de manera específica el número y porcentaje de países por región con información sin valores nulos en la base de datos del Banco Mundial.

 

Cuadro 2 Número de países por región y valores nulos.

Regiones Países por región Porcentaje de países cubiertos por región
1 Sur de Asia 4 50%
2 Europa y Asia Central 29 49%
3 Medio Oriente y África del Norte 4 19%
4 Asia Oriental y del Pacífico 11 29%
5 África 7 15%
6 América Latina y del Caribe 15 37%
7 Norte América 2 67%
Total 72 33%

Fuente: elaboración propia.

 

III. Árboles de decisión clasificadores

Dado que, el objetivo de este trabajo es encontrar relaciones que aporten conocimiento sobre el comportamiento de la desigualdad cuando aumenta la globalización comercial, se utilizan Árboles de Decisión Clasificadores y de Regresión (CART2), que permiten entender este fenómeno a través de la extracción y análisis de reglas de conocimiento. Los modelos econométricos y estadísticos presuponen el comportamiento de los datos o estiman ciertos parámetros basados en el análisis exploratorio de la información, sin embargo, esto se vuelve menos claro cuando los modelos son complejos o incluyen una gran cantidad de variables con comportamientos no normales. Los Árboles de Decisión, por su parte, son modelos flexibles, entre lineales y no paramétricos, que captan la interacción entre las variables para extraer reglas de conocimiento (Faraway, 2016).

Formalmente un CART es una combinación de atributos B ( A Y ) , donde A es el conjunto de n factores A = {a1 , a1 , …, ai , …, an}, Y es la variable objetivo con un dominio dom(Y) = {c1 , c2 , ..}que contiene las c clases posibles de Y. En este caso, la variable objetivo es el sentido del cambio en el coeficiente de GINI (C_GINI), dado cierta combinación de factores, como se describe a continuación.

 
 
3
 

El algoritmo de entrenamiento es un método iterativo para encontrar los criterios de decisión que clasifican los ejemplos con el menor margen de error posible, busca ( a * a i A ) el atributo que mejor clasifica según la condición de división, a partir de lo cual se define un criterio que divide los datos en dos subconjuntos, entonces se vuelve a buscar el mejor atributo para cada subconjunto (Rokach y Maimon, 2008), en este caso hasta que se clasifiquen todas las observaciones. Para manejar el ruido se poda el árbol, eliminando los nodos finales que clasifican datos en condiciones muy específicas y que podrían causar problemas de sobreajuste.

La intuitiva interpretación de los CARTs, permite visualizar las reglas como una combinación de criterios (rama) que termina en una clasificación o resultado (hoja) asociada a una probabilidad. Como condición para dividir una rama del árbol, se toma el nivel de impureza D calculado con base en el número de observaciones clasificadas correctamente e incorrectamente acumuladas en cada k nodo final.

 
 

Para evaluar un modelo CART se utilizan las siguientes medidas de ajuste: la tasa de observaciones clasificadas incorrectamente (MC4), que es la proporción porcentual del número de ejemplos no clasificados correctamente (ndNC ) con respecto al total de datos en un conjunto de observaciones en específico MC (DATAALL) = (ndNC / nd) * 100 donde nd es el número de registros en el conjunto de datos a evaluar; la tasa de precisión al clasificar (TP), importante para problemas con una distribución de clases no balanceada pues penaliza los ejemplos clasificados como positivos que son negativos; y el número de nodos finales (NF) que representa el grado de complejidad del árbol.

III.1. Proceso de modelado

El algoritmo para construir un árbol puede generar modelos con distintos criterios, lo que podría desestimar los resultados al momento de analizar las reglas de conocimiento. Para abordar este problema se realiza un proceso de minado de modelos, que consiste en seleccionar el árbol promedio más estable, de entre una serie de modelos que son construidos tomando distintas muestras de entrenamiento aleatorias.

Se construyen nS = n/3 modelos5 donde n es el número de observaciones en data, en este caso se construyen alrededor de 118 modelos tomando para cada uno una muestra de entrenamiento (DE) aleatoria con 267 registros correspondientes al 75 por ciento de los datos, para identificar cada modelo se fija una semilla inicial igual a uno (SEMINI = 1), la cual se incrementa de cinco en cinco para cada iteración.

Para cada modelo, se calcula la tasa de precisión (TP) que es el porcentaje de ejemplos que el modelo identifica como situaciones donde aumenta la desigualdad y que coincide con lo expuesto en los datos data, así como las tasas de clasificación incorrecta (MC) en función de las observaciones a considerar: fuera de la muestra MC (DT), en la muestra de entrenamiento MC (DE), en la muestra completa MC (DATA) y considerando los 1,241 datos MC (DATAALL). Dado que la construcción de los árboles se realiza con base en los datos de entrenamiento, para cada modelo se cumple MC (DT) > MC (DATA) > MC (DE). El árbol con menor tasa de MC (DE) es también el modelo con menor probabilidad de generarse, es decir, contiene la combinación de factores más difícil y poco común de encontrar, por lo que nos enfocamos en los árboles promedio (estables). En la Figura 2 se muestra el comportamiento de las medidas de ajuste de los 118 modelos, donde un modelo tiene MC(DE) menor al 5 por ciento, lo que indica que estaría clasificando correctamente el 95 por ciento de los datos pero dentro de cierta muestra de entrenamiento por lo que, a pesar de su eficiencia, tiene problemas de sobre ajuste; también se aprecia que la eficiencia fuera de la muestra de algunos modelos es mayor al 40 por ciento, lo que parece mostrar que, independientemente del modelo a elegir, se tiene una seguridad de clasificación correcta de poco menos del 60 por ciento de las observaciones.

 

Figura 2 Distribución de las medidas de ajuste de los modelos.

Fuente: elaboración propia en R.

 

Para elegir el mejor árbol de entre los nS encontrados se considera la estabilidad de los criterios sin dejar de lado la eficiencia del modelo, filtrando los modelos que cumplen la siguiente condición ( T P - μ T P < ε ) ( M C D T - μ M C D T < ε ) con un ɛ = .5 que se incrementa en 0.1 de haber más de un modelo dentro esta vecindad y donde μTP es la media de las TP y μMC(DT) la media de las tasas MC con respecto a los datos de prueba. En cuanto a la estabilidad, el empleo en el sector agrícola es el criterio más importante en 77 de los 118 modelos construidos; su interacción con los términos de intercambio se presenta en 35 por ciento de los casos; los primeros nodos de decisión del árbol aparecen en más del 10 por ciento de los modelos; además de que los factores incluidos en el modelo también son considerados en los demás modelos, es decir, cada variable aparece entre un 30 y 70 por ciento de los árboles. De los modelos que cumplen la condición anterior, se selecciona el que tenga mayor número de variables comerciales, para captar principalmente los efectos derivados del intercambio comercial, de tal forma que el modelo elegido se muestra en la siguiente figura.

El árbol seleccionado por la metodología, es decir, al final del proceso de modelado, se aprecia en la en la Figura 3, el cual cuenta con 14 reglas o nodos finales, construidos a partir de 27 nodos o criterios y 11 factores, de los cuales 4 son comerciales, 3 de población y empleo, 1 de inclusión tecnología, 1 de crecimiento económico, 1 de inversión y 1 de gobernanza. El modelo se construye con una muestra de entrenamiento fijando la semilla en 3,751 dentro de la cual clasifica correctamente el 89 por ciento de los datos, 84 por ciento en la muestra completa con una precisión del 79.61 por ciento, fuera de la muestra el 70 por ciento y una MC considerando los 1,241 datos de 36.74.

 

Figura 3 Representación Gráfica del Árbol Clasificador.

Fuente: elaboración propia en R.

 

IV. Análisis de los resultados del modelo

A continuación, se describen e interpretan los resultados del árbol construido, de tal forma que analizamos el conocimiento extraído del modelo. De manera general, en el Cuadro 3 se presentan las condiciones bajo las cuales aumentos de apertura comercial, medidos con el índice estimado anteriormente (C_1GC) están relacionados a cambios en la desigualdad del ingreso dados por cambios en el coeficiente de GINI (C_GINI).

 

Cuadro 3 Reglas de conocimiento que llevan a cambios de desigualdad cuando aumenta la globalización comercial.

Regla Condición C_GINI PROB.
R-1 EM_AGR<12.55 & TERM_TRADE<98.7197 & KPRIV< 119.876 C+ 1.00
R-2 EM_AGR <12.55 & TERM_TRADE<98.7197 & KPRIV>119.876 & KPRIV<131.077 C- 0.70
R-3 EM_AGR<12.55 & TERM_TRADE<98.7197 Y KPRIV>=131.077 & US_INT<73.435 C+ 0.90
R-4 EM_AGR<12.55 & TERM_TRADE<98.7197 & KPRIV>=131.077 & US_INT>=73.435 C- 0.60
R-5 EM_AGR<12.55 & TERM_TRADE>=98.7197 & EM_SERV < 68.25 & GDP<5.128 C+ 0.90
R-6 EM_AGR<12.55 & TERM_TRADE>=98.7197 & EM_SERV < 68.25 & GDP>=5.128 C- 0.80
R-7 EM_AGR<12.55 & TERM_TRADE>=98.7197 & EM_SERV>=68.25 & POB_URB<1.08183 & HTE_T<3.72539 C+ 1.00
R-8 EM_AGR<12.55 & TERM_TRADE>=98.7197 & EM_SERV>=68.25 & POB_URB<1.08183 & TE_T>=3.72539 C- 1.00
R-9 EM_AGR<12.55 & TERM_TRADE>=98.7197 V EM_SERV>=68.25 & POB_URB>=1.08183 C- 0.90
R-10 EM_AGR>=12.55 & POB_URB< -0.76 C+ 1.00
R-11 EM_AGR>=12.55 & POB_URB> -0.76 & RL < 0.1631 & EXP_GS_P<17.7135 C+ 0.60
R-12 EM_AGR>=12.55 & POB_URB> -0.76 & RL < 0.1631 & EXP_GS_P>=17.7135 C- 0.90
R-13 EM_AGR>=12.55 & POB_URB> -0.76 & RL>=0.1631 & IMP_GS_P< 30.0741 C+ 0.90
R-14 EM_AGR>=12.55 & POB_URB> -0.76 & RL>=0.1631 & IMP_GS_P>= 30.0741 C- 0.80

Fuente: Elaboración propia con base en el modelo CART.

 

El factor discriminante más importante es la proporción de trabajadores en el sector agrícola con respecto al empleo total (EM_AGR). Este criterio separa los países con un valor mayor al 12.55 del lado derecho del árbol, entre los que se encuentran la mayoría de los países en el Sur de Asia y más de la mitad de los africanos y latinoamericanos (incluyendo a México), en total de 397 observaciones de 74 países. Del otro lado del árbol (parte izquierda), se encuentran las economías con poco empleo en el sector agrícola que conforman un grupo de 63 países y 377 datos e incluyen a más del 65 por ciento de los países europeos.6 A pesar de que los países parecen dividirse según la región a la que pertenecen, la variable idRegión no resulta un factor determinante, porque en ambos grupos se encuentran países de todas las regiones (a excepción de los norteamericanos que son sólo Canadá y EU), además de que la estructura del empleo cambia en el tiempo. Cabe mencionar que las reglas no clasifican economías en cierto grupo de países con ciertas características porque suponemos que dichas características son dinámicas, de tal forma que en un país podría asociarse a una regla en cierto año y a la vez asociarse a otra regla en otro año.

En el Cuadro 3, se presentan las 14 reglas generadas por el modelo. Una regla es una combinación de condiciones que subdividen las observaciones; cada regla corresponde a una ruta que termina en un nodo final en el árbol de la Figura 3 y cada una tiene una probabilidad asociada al factor resultado, es decir, {c+, c‒}.

Partiendo de la regla 10, en los países con una proporción de empleo en sector agrícola mayor al 12 por ciento (EM_AGR > 12.55%) y donde la población en zonas urbanas está decreciendo a una tasa menor que el 0.76 por ciento, la desigualdad aumenta con una alta probabilidad (R-10). Como sucedió en Georgia en el 2001 y 2007, donde con más del 50 por ciento de su empleo en el sector agrícola su desigualdad en el ingreso aumentó, al igual que en Lituania (2001-2006) donde a pesar de que la mayor parte del empleo se concentra en el sector servicios tiene reducciones importantes en el crecimiento en la población urbana.

Por el contrario, si la tasa de crecimiento de la población es positiva, el estado de derecho, medido con el índice de globalización RL (imperio de la ley), resulta ser un factor determinante. Este índice se muestra en valores estandarizados entre -2.5 y 2.5, por lo que valores positivos revelan una buena calificación en cuanto a la concentración del poder jurídico. Entonces, si este indicador es prácticamente negativo (RL < 0.16) y el porcentaje de sus exportaciones con respecto al ingreso nacional pequeño (EXP_GS_P < 17.7), la desigualdad aumenta (R-11). Esta es la regla menos confiable del modelo, ya que, indica aumentos de desigualdad con una probabilidad del 60 por ciento, clasificando a Colombia, Egipto e India correctamente algunos años e incorrectamente en otros, de tal manera que existe otro fenómeno no contemplado (o que desapareció en el proceso de podado del árbol) que evita que la desigualdad en estos países cambie cuando la globalización aumenta. Sin embargo, este criterio de clasificación es importante para la regla 12 que tiene una probabilidad de clasificar acertadamente del 0.9, además de que 156 observaciones correspondientes a 38 países tienen dichas características en algunos años. Empíricamente esta regla indica que la desigualdad tiende a disminuir con la globalización comercial, en países que tienen una proporción de empleo en el sector agrícola mayor al 12.5, un crecimiento constante en zonas urbanas y, aunque un deficiente imperio de la ley, exportan más del 17.7 por ciento de su Producto Interno Bruto (R-12). Es importante mencionar, que no es que el deterioro del estado de derecho propicie el bienestar económico, por el contrario, esta condición podría indicar que es la globalización y no el gobierno lo que ha permitido dichas mejoras a través de los salarios en estas economías con potencial de crecimiento.

El 24 por ciento de los países se han beneficiado del comercio vía exportaciones en algún momento, especialmente los latinoamericanos (casi el 40 por ciento), como fue el caso de Chile, Ecuador, El Salvador, Guatemala, Nicaragua, Panamá, Colombia -que con problemas logra exportar más del 17 por ciento para el 2008-, y México a partir de 1998 (a excepción del periodo entre el 2004-2007) con una estructura promedio del empleo por sectores del 18 por ciento en el agrícola, 25 por ciento en el industrial y 57 por ciento en el sector servicios. Contrario a los resultados de Haseeb et al. (2019) quien sostiene que la globalización aumenta la brecha entre las habilidades de los trabajadores y por ende la de desigualdad. Al igual que Vietnam (2001-2006), China es una excepción a la regla, este país ha tenido incrementos de desigualdad desde 1983 hasta el 2010 a pesar de que sus exportaciones superaron 17.7 por ciento del PIB en 1993; con más del 40 por ciento del empleo concentrado en el sector agrícola y con un alto -aunque decreciente- crecimiento de la población en zonas urbanas, sus exportaciones no fueron suficientes para reducir la desigualdad.

Por otro lado, los países con buena calificación en lo que respecta al cumplimiento de la ley suelen ser países con instituciones confiables y buenas políticas públicas, que a su vez tienen altos niveles de educación y, en consecuencia, primas salariales mayores que impulsan la formación de círculos virtuosos (Acemoglu y Robinson, 2013) que tienden a reducir la desigualdad. En este modelo, los cambios en la desigualdad en países con un estado de derecho eficiente, que tienen más del 12 por ciento del empleo en el sector agrícola además de crecimiento urbano, también depende de la globalización comercial, específicamente de la proporción de importaciones con respecto a los ingresos nacionales. El modelo indica que la desigualdad disminuye en países con un estado de derecho fuerte aunado a aumentos de globalización por vía de las importaciones con niveles mayores al 30 por ciento (R-14), tal es el caso de Bolivia antes del 2009, Costa Rica, Honduras, Filipinas, entre otros, la mayoría de países asiáticos; pero aumenta en países con poca iteración comercial IMP_GS_P<30% (R-13), como es el caso de Bangladesh 2000-2003, Pakistán (que también tienen bajos porcentajes de exportaciones) e Indonesia (que además ha venido reduciendo sus exportaciones de manera importante). Como excepción a esta regla (R-13), Brasil ha reducido su desigualdad desde 1988 a pesar de que sus importaciones no alcanzan ni el 15 por ciento de su producto, lo cual podría estar más relacionado con la eficiencia del gobierno y políticas públicas enfocadas a la educación que incrementan la oferta de trabajo en sector servicios.

Con respecto a las reglas en las que el empleo en el sector agrícola es menor al 12.55 por ciento, correspondiente al lado izquierdo del modelo CART (Figura 3), el deterioro de los términos de intercambios es una característica determinante para el aumento de la desigualdad. Este criterio divide las observaciones, según si se han deteriorado (TERM_TRADE < 98.8) o no los términos de intercambio (TERM_TRADE >= 98.8).

En la primera parte del árbol (a la derecha), encontramos que en países con poco empleo en el sector agrícola (EMP_AGR<12.5%) y en los cuales el capital privado es menor que el producto interno bruto (KPRIV<120%), el deterioro de los términos de intercambio viene acompañado de aumentos en la desigualdad en el ingreso (R-1), este fue el caso de Bolivia en 1992 y 2001, Lituania 2008-2013 y Suiza 2005-2013; pero si la inversión en el sector privado supera el PIB por más del 30 por ciento (KPRIV ϵ (120,130)), el coeficiente de GINI podría disminuir (R-2). Entonces, una forma de evitar que aumente la desigualdad cuando los términos de intercambio se deterioran es aumentando el capital pero sólo hasta cierto punto (119.9 < KPRIV < 131.0), esto para economías que han dejado atrás la producción agrícola.

Si el capital privado es lo suficientemente grande (KPRIV > 131), entonces el efecto de la globalización comercial sobre el coeficiente de GINI -aunado al deterioro de los términos de intercambio- depende de la inclusión tecnológica, medido en este caso con el número de usuarios de internet por cada cien. De tal manera que, si más del 27 por ciento de la población carece de acceso a internet, la desigualdad se incrementa (R-3), y por el contrario, se reduce en países con más de 73 por ciento (R-4). Esta regla da luz a los resultados encontrados por Santos et al. (2017) quienes encuentran que en algunos países la adopción de tecnologías aumenta la desigualdad y otros no.

Austria es un excelente ejemplo del efecto de la inclusión digital sobre la desigualdad determinada en las reglas 3 y 4, con una tasa del 39 en el 2001, experimentó aumentos de desigualdad. La estrategia fue incrementar el acceso a internet hasta que en el 2007 pasó el límite de la condición (US_INT>73) y la medida de desigualdad comenzó a decrecer. Otro aspecto interesante, es que la mayoría de los años en los que se cumple la R-3 coinciden con periodos de crisis -a la crisis tecnológica (2002-2005) o a la crisis financiera (2007-2010)-;7 mientras que, del otro lado del nodo, en la R-4, se muestra que Suiza, Austria, Finlandia y EU presentaron reducciones de desigualdad después de que aumentaran el acceso a internet. Lo anterior sugiere que la inclusión digital ayuda a evitar que la desigualdad aumente en tiempo de crisis, además de que podría existir una relación entre las crisis y la desigualdad, y que estaría siendo afectada por la inclusión tecnológica.

En aquellas economías en las que el valor de sus exportaciones valen más que sus importaciones, el empleo en el sector agrícola es menor al 12 por ciento, el empleo en el sector servicios menor al 68 por ciento y, por lo tanto, el empleo en el sector industrial mayor al 20 por ciento, el efecto de una mayor integración económica sobre la desigualdad en el ingreso se determina por la tasa de crecimiento de su producción. Como se describe en las reglas 5 y 6, a menos que dicha tasa supere el cinco por ciento (R-6), la desigualdad aumenta con una alta probabilidad (R-5), razón por la cual países como Australia (2004-2006), Bulgaria (2010-2013), Croacia (2008), Alemania (2001-2004), Portugal y Rusia, entre otros, presentaron incrementos de desigualdad. Por consiguiente, en este modelo la tasa de crecimiento económico actúa como discriminante; el modelo indica que es posible reducir la desigualdad sin alcanzar el 68 por ciento del empleo en el sector servicios, si el sector industrial es lo suficientemente eficiente para generar un crecimiento mayor al 5 por ciento, con términos de intercambio aceptables.

Para las economías que tienen buenos términos de intercambio (TERM_ TRADE>98.7) y una estructura del mercando laboral en la que los trabajadores en el sector agrícola constituyen menos del 12 por ciento, los del sector industrial menos del 32 por ciento, pero sobre todo en la que los trabajadores en el sector servicios representan más del 68 por ciento de la fuerza laboral, la desigualdad en el ingreso aumenta debido al desacelerado crecimiento de la población urbana (POB_URB < 1.08%) aunado al desaprovechamiento de la educación de su fuerza de trabajo para exportar más del 3 por ciento en alta tecnología (R-7). Las economías que sufrieron aumentos de desigualdad por este tipo de estancamiento fueron: Australia en el 2007, Dinamarca desde 2006, Hong Kong en el cambio de siglo, Nueva Zelanda (2011, 2013), Uruguay 1995-2002 e incluso Estados Unidos y el Reino Unido en el 2003.

Si la población en zonas urbanas sigue creciendo a una tasa de al menos el 1 por ciento, es común que la desigualdad decrezca (R-9), de lo contrario esta decrecerá sólo si exporta alta tecnología en un porcentaje mayor al 3.72 por ciento del total de las exportaciones (R-8). Los países que se han beneficiado de la globalización comercial, por su crecimiento urbano aunado a las características de su mercado laboral son: Argentina, Perú, Canadá, Los Países Bajos, Nueva Zelanda, Noruega, Sudáfrica, Suiza y El Reino Unido (R-9); y por exportar más del 3.7 por ciento de bienes y servicios considerados de alta tecnología son: Suecia en 2001-2002, UK en el 2002 y Bélgica en 2004-2007 (R-8). Estados Unidos es una excepción a la regla 9, ya que, a pesar del rápido crecimiento de su población urbana, su desigualdad dejó de aumentar hasta 1993 cuando sus exportaciones en alta tecnología superaron el 1.89 por ciento, igual que Argentina hasta el 2001 cuando empieza a exportar más del 0.05 por ciento.

Conclusiones

A pesar de que el incremento de la desigualdad a partir de 1980 es claro, no es posible generalizar este fenómeno debido a la heterogeneidad de los países y a los cambios temporales (Ravallion, 2003). Sin embargo, la intuitiva interpretación del modelo CART presentado permite identificar circunstancias y factores clave para analizar el efecto de la globalización comercial sobre la desigualdad en el ingreso de los hogares dentro de un país.

La estructura del mercado de trabajo refleja los efectos de la industrialización y el progreso tecnológico en la distribución del ingreso de la población, consistente con Kuznets (1955) y Milanovic (2016), sin embargo, es necesario especificar bajo qué condiciones el resultado es positivo o no para la desigualdad.

En países no agrícolas, en los cuales el capital privado es menor a su nivel de producción, el deterioro de los términos de intercambio viene acompañado de aumentos de desigualdad, en este caso la inversión privada y la inclusión digital juegan un papel importante; siempre que más del 27 por ciento de la población carezca de acceso a internet, el efecto sobre la desigualdad es positivo.

El Árbol Clasificador también indica que en los países con altos niveles de empleo en el sector servicios y sin deterioro en los términos de intercambio, en su mayoría economías desarrolladas, la desigualdad en ingreso puede aumentar en periodos de estancamiento. Por el contrario, este tipo de países reducen su desigualdad con tasas de crecimientos superiores al 5 por ciento. Para que el bienestar económico de la población de estos países mejore, es importante que no se estanquen y aprovechen el potencial de su alta concentración de su mano de obra calificada exportando alta tecnología. Lo anterior es consistente con un periodo de ajuste en la estructura del mercado de trabajo, en el que la sociedad paga un costo de aprendizaje, pero una vez fortalecida la mano de obra en el sector servicios se generan rendimientos suficientes para, posteriormente, reducir su desigualdad.

El cambio de la estructura del mercado de trabajo en el que se permite una mayor concentración de trabajadores en el sector servicios, es determinante para la distribución del ingreso, debido a la prima salarial y las diferencias salariales entre sectores. Como se enfatiza en el análisis, las economías agrícolas (con más del 12 por ciento del empleo en este sector) pero en procesos de industrialización (reflejado en el crecimiento de la población urbana positivo), características de países en desarrollo, presentan reducciones en la desigualdad ante aumentos de globalización comercial, consistente con la diferenciación que resalta Dollar (2004). Aunque el modelo CART identifica, además, a la eficiencia del estado de derecho como factor para promover una reducción vía importaciones, y para países con deficiente estado de derecho, la evidencia empírica de este modelo revela que la reducción se da vía exportaciones.

Referencias bibliográficas

 

1 Correspondientes a países con alto volumen de comercialización: Aruba, Guinea y Luxemburgo. Los países con exportaciones e importaciones mayores al 150 por ciento de su PIB son Singapur, Hong Kong y Luxemburgo.

2 Por sus siglas en ingles Classification and Regression Trees.

3 Correspondiente a los 27 factores descritos en el Cuadro 1.

4 Por sus siglas en ingles Miss Clasification.

5 Utilizando la librería “tree” de R.

6 El análisis de los resultados en cada criterio se realiza filtrando el panel con datos nulos usando SQL Server, que si bien son 1,241 observaciones en realidad depende de que los registros donde las variables involucrados no tienen valores nulos. Por ejemplo la variable EM_AGR tiene 467 observaciones con algún valor nulo, entonces, el primer criterio se analiza con base en los 774 registros restantes.

7 Alemania (2005-2006), Luxemburgo (2005), Portugal (2003-2005, 2012), Hong Kong (2005), Japón (2005, 2011-2013), Corea (2001-2004), Singapur (2002-2006), Suiza (2005), EU (2005), Francia (2008-2009), Italia (2008-2011), Irlanda (2008-2010), España (2008-2012), Israel (2001-2008).