Tres profesores de la Universidad de Chicago usaron GPT4 para analizar estados financieros y predecir ganancias con la calidad de un analista profesional. Sus predicciones fueron mucho más precisas que las de los analistas humanos cuando pueden esperarse sesgos y desacuerdos.
El uso de la inteligencia artificial (IA) está aún en su infancia. Muchos artículos de difusión hablan de ella como quien se asoma a un mundo distópico. Por ello, en aras de contrarrestar en alguna medida el contenido amarillista abundante, es bienvenido un aporte reciente acerca del uso de «grandes modelos lingüísticos» (LLM, por su sigla en inglés) en la banca de inversión.
Alex Kim, Maximilian Muhn y Valeri Nikolaev, profesores de la Universidad de Chicago, escribieron en mayo de 2024 para la colección de la SSRN un papel de trabajo titulado «Análisis de estados financieros con grandes modelos lingüísticos». Usaron el modelo GPT4, para analizar estados financieros con la calidad de un analista profesional.
Su propósito era evaluar la capacidad de un LLM para analizar estados financieros. ¿Por qué esta tarea en particular? Porque el análisis de estados financieros es una tarea cuantitativa tradicional que requiere pensamiento, razonamiento y juicio críticos.
Los profesores construyeron una base de datos con los estados financieros estandarizados y anónimos de 15.000 empresas entre 1968 y 2021. También proporcionaron al modelo una avanzada cadena de pensamiento, que imita la manera en que los analistas humanos procesan la información financiera.
Diseñaron el modelo para que analizara estos estados financieros y construyera reportes para un potencial inversionista, en los que explicara los resultados de los análisis efectuados y, posteriormente, predijese la dirección de las ganancias futuras. Pidieron al modelo que predijera si las ganancias de cada empresa en el próximo año aumentarían o disminuirían; si el cambio sería pequeño, mediano o grande; y la probabilidad de éxito de tal predicción.
Las predicciones realizadas por el GPT4 fueron mucho más precisas que las de los analistas humanos que usaron como grupo de comparación. Con tales predicciones se armaron carteras de inversión; asumieron posiciones largas y cortas en las acciones de las empresas que el modelo predecía tendrían mayores movimientos de precios tanto al alza como a la baja.
En las pruebas retrospectivas, al usar datos históricos, estas carteras superaron al mercado de valores como un todo. Para medir el desempeño relativo, se hicieron los cálculos con dos índices bursátiles representativos: uno que ponderaba las acciones por la capitalización bursátil de cada empresa (como en el caso del S&P 500) y otro que aplicaba una ponderación igual para todas las empresas (como en el S&P 500 Equal Weight Index).
El desempeño superior del modelo fue de 37 puntos básicos mensuales en promedio contra el índice ponderado por capitalización bursátil, y 84 puntos básicos en promedio contra el índice de ponderación igual para todas las empresas. Esto sugiere que el modelo predice más ganancias con las acciones de baja capitalización con mayor representación en la segunda versión del índice bursátil.
Los resultados indican que el análisis de GPT4 arroja información útil sobre la empresa que le permite superar a los analistas humanos profesionales al predecir la dirección de las ganancias. Ahora bien, el GPT4 y los analistas humanos son complementarios, más que sustitutos.
Estos modelos tienen una ventaja sobre los analistas humanos cuando se espera que las personas muestren sesgos y desacuerdos. Esto significa que la IA puede ayudar mejor a los humanos en condiciones en las que su rendimiento pueda verse afectado.
Siempre existe el peligro de que los inversionistas con poca formación sean propensos a ignorar la información, incluso si la producen herramientas avanzadas de inteligencia artificial.
Los humanos, por su parte, agregan valor en condiciones en las que se necesite incorporar un contexto adicional desconocido para el modelo. Además, el rendimiento de GPT4 está a la par (o incluso mejor en algunos casos) del de los modelos especializados de aprendizaje automático; es decir, redes neuronales entrenadas en tareas de predicción de ganancias.
Los autores advierten que sus resultados se deben tomar con cautela. Pero afirman también que su trabajo presenta pruebas de que los LLM tienen capacidades similares a las humanas en el ámbito financiero. Por lo tanto, el uso de estos modelos potenciaría la democratización del procesamiento de información financiera y debería ser de interés para inversionistas y reguladores.
La IA puede desempeñar un papel activo en los procesos de decisiones informadas. Pero siempre existe el peligro de que los inversionistas con poca formación sean propensos a ignorar la información, incluso si la producen herramientas avanzadas de IA.
Kim y sus colaboradores concluyen su reporte preguntándose si la IA, en cualquiera de sus variantes, puede en la práctica mejorar sustancialmente las decisiones humanas en los mercados financieros. Esta pregunta queda abierta para futuras investigaciones.
Carlos Jaramillo, vicepresidente ejecutivo del IESA.
Este artículo se publica en alianza con Arca Análisis Económico.
Suscríbase aquí al boletín de novedades (gratuito) de Debates IESA.