Este artículo es un resumen sobre una investigación y caso de uso de la IA Generativa en análisis de estados financieros y predicciones. Muestra el potencial que tienen estas herramientas para las empresas en especial los inversionistas y ejecutivos interesados en analizar el potencial rendimiento de las empresas.
Los autores de este estudio son Alex G. Kim, Maximilian Muhn y Valeri V. Nikolaev. Todos ellos están afiliados a la Booth School of Business de la Universidad de Chicago.
El estudio fue realizado en mayo de 2024. Las herramientas utilizadas en el estudio incluyen el modelo de lenguaje extenso GPT-4, así como modelos de aprendizaje automático (ANN) y regresiones logísticas para fines de comparación.
Los autores exploran el valor práctico de usar GPT-4 en el análisis financiero mediante la evaluación de estrategias de trading basadas en las predicciones del modelo. La idea subyacente es que si las predicciones de GPT-4 sobre el aumento o disminución de las ganancias son precisas, deberían ser útiles para predecir los movimientos de los precios de las acciones.
Metodología:
- Formación de portafolios: Se crean portafolios de acciones en función de las predicciones de GPT-4 sobre si las ganancias aumentarán o disminuirán. Se utilizan tres tipos de estrategias: una basada en las predicciones de GPT-4, otra basada en un modelo de aprendizaje automático (ANN) y una tercera basada en regresión logística.
- Criterios de selección: Para GPT-4, se seleccionan acciones que se prevé experimentarán un aumento o disminución “moderada” o “grande” en las ganancias, y se clasifican según la probabilidad asignada por el modelo a cada predicción. Se incluyen acciones con las probabilidades más altas, hasta alcanzar el 10% de la muestra total.
- Estrategias de trading: Se implementan estrategias de compra (long) para las acciones que se espera que aumenten sus ganancias y de venta (short) para aquellas que se espera que las disminuyan. Se evalúan tanto portafolios con igual ponderación como con ponderación por valor.
Resultados:
- Ratios de Sharpe: Los portafolios basados en las predicciones de GPT-4 muestran ratios de Sharpe más altos que los basados en los otros modelos, especialmente en el caso de portafolios con igual ponderación. Esto indica que las predicciones de GPT-4 pueden generar estrategias de trading más rentables, con un mejor equilibrio entre rentabilidad y riesgo.
- Alfas: Los portafolios basados en GPT-4 también generan alfas positivos y estadísticamente significativos en varios modelos de factores, incluyendo el modelo de Fama-French de cinco factores más el momentum. Esto sugiere que las predicciones de GPT-4 capturan información relevante para el mercado que no está completamente explicada por los factores de riesgo tradicionales.
- Rendimiento acumulado: Los portafolios basados en GPT-4 superan consistentemente al mercado a lo largo del tiempo, incluso en períodos de rendimientos negativos del mercado.
En general, los resultados de las estrategias de trading respaldan la utilidad práctica de GPT-4 en el análisis financiero, demostrando su capacidad para generar señales de trading rentables y superar al mercado. Los autores destacan que GPT-4 parece ser especialmente hábil en descubrir valor en acciones de empresas más pequeñas, lo que podría ser de interés para los inversores.
La cadena de pensamiento (CoT) es una técnica que se utiliza para mejorar el rendimiento de los modelos de lenguaje extenso (LLMs) en tareas que requieren razonamiento paso a paso. En el contexto del análisis de estados financieros, el CoT implica guiar al modelo a través de una serie de instrucciones específicas que simulan el proceso de pensamiento de un analista financiero humano.
En este estudio, los autores diseñaron un CoT que instruye a GPT-4 a realizar los siguientes pasos:
- Identificar cambios notables en partidas específicas del estado financiero: Esto implica que el modelo detecte variaciones significativas en elementos clave como ingresos, gastos, activos o pasivos.
- Calcular ratios financieros clave: El modelo calcula ratios financieras relevantes, como márgenes de operación, rotación de activos, ratios de liquidez y apalancamiento, entre otros.
- Proporcionar interpretaciones económicas de las ratios: GPT-4 no solo calcula los ratios, sino que también ofrece explicaciones sobre su significado económico y cómo reflejan la salud financiera de la empresa.
- Predecir el cambio futuro en las ganancias: Basándose en el análisis anterior, el modelo predice si las ganancias de la empresa aumentarán o disminuirán en el próximo período.
- Elaborar una justificación: GPT-4 proporciona una explicación detallada de los factores y el razonamiento que respaldan su predicción sobre el cambio en las ganancias.
Mediante el uso de este CoT, los autores buscan imitar el proceso de análisis que seguiría un analista financiero humano. Esto permite evaluar si GPT-4, incluso sin acceso a información contextual o narrativa, puede realizar un análisis financiero sólido y generar predicciones precisas sobre el rendimiento futuro de una empresa. Los resultados del estudio indican que el uso del CoT mejora significativamente la capacidad de GPT-4 para predecir cambios en las ganancias, superando incluso a los analistas financieros humanos en términos de precisión.
Los autores exploran dos posibles explicaciones para la capacidad predictiva de GPT-4:
- Memoria: Se plantea la hipótesis de que el rendimiento de GPT-4 podría deberse a su memoria, es decir, a que el modelo haya sido entrenado en datos financieros específicos de empresas y, por lo tanto, “conozca” de antemano si las ganancias aumentaron o disminuyeron en el futuro. Sin embargo, los autores descartan esta posibilidad. Primero, el diseño de la investigación utiliza estados financieros anónimos y estandarizados, lo que dificulta que el modelo infiera la identidad de la empresa. Segundo, realizan pruebas en las que GPT-4 intenta adivinar el nombre de la empresa y el año fiscal a partir de los estados financieros, y el modelo muestra una precisión muy baja en estas tareas. Tercero, replican los resultados utilizando datos del año más reciente, que está fuera del período de entrenamiento de GPT-4, y obtienen resultados similares, lo que confirma que la capacidad predictiva del modelo no se basa en su memoria.
- Generación de información narrativa útil: La segunda hipótesis es que la capacidad predictiva de GPT-4 proviene de su habilidad para generar información narrativa útil sobre la salud financiera y el rendimiento futuro de la empresa a partir del análisis de los datos numéricos. Para probar esto, los autores utilizan un modelo de lenguaje (BERT) para codificar los textos generados por GPT-4 en vectores numéricos y luego entrenan una red neuronal artificial (ANN) para predecir el cambio futuro en las ganancias utilizando estos vectores como entrada. Los resultados muestran que la ANN entrenada en los textos de GPT-4 logra una alta precisión en la predicción de cambios en las ganancias, lo que sugiere que estos textos contienen información valiosa sobre el rendimiento futuro de la empresa. Además, se encuentra una alta correlación entre las predicciones de GPT-4 y las predicciones de la ANN basada en los textos de GPT-4, lo que respalda la idea de que la capacidad predictiva de GPT-4 se basa en los insights narrativos que genera a partir de los datos numéricos.
En resumen, los autores concluyen que la capacidad predictiva de GPT-4 en el análisis de estados financieros no se debe a su memoria, sino a su habilidad para generar información narrativa útil a partir de los datos numéricos.
Se incluye la referencia al documento de la investigación completa para mayores detalles.