Ayuda
Ir al contenido

Natural language processing and financial markets: semi-supervised modelling of Coronavirus and economic news

    1. [1] University of Verona

      University of Verona

      Verona, Italia

    2. [2] Banco de España
  • Localización: Documentos de trabajo - Banco de España, ISSN 0213-2710, Nº 28, 2022, págs. 1-35
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      Este documento estudia las reacciones de los mercados financieros de Estados Unidos a nuevas noticias de la prensa desde enero de 2019 hasta el primero de mayo de 2020. Con este fin, construimos medidas del contenido y del sentimiento de las noticias mediante el desarrollo de índices apropiados a partir de los titulares y fragmentos de The New York Times, utilizando técnicas de aprendizaje automático no supervisado. En particular, usamos el modelo Asignación Latente de Dirichlet para inferir el contenido (temas) de los artículos, y Word Embedding (implementado con el modelo Skip-gram) y K-Medias para medir su sentimiento (incertidumbre). De esta forma, elaboramos un conjunto de índices de incertidumbre temáticos diarios. Estos índices se utilizan luego para explicar el comportamiento de los mercados financieros de Estados Unidos mediante la implementación de un conjunto de modelos EGARCH. En conclusión, encontramos que dos de los índices de incertidumbre temáticos (uno relacionado con noticias del COVID-19 y otro con noticias de la guerra comercial) explican gran parte de los movimientos en los mercados financieros desde principios de 2019 hasta los cuatro primeros meses de 2020. Además, encontramos que el índice de incertidumbre temático relacionado con la economía y la Reserva Federal está positivamente relacionado con los mercados financieros, capturando las acciones de la Reserva Federal durante períodos de incertidumbre.

    • English

      This paper investigates the reactions of US financial markets to press news from January 2019 to 1 May 2020. To this end, we deduce the content and sentiment of the news by developing apposite indices from the headlines and snippets of The New York Times, using unsupervised machine learning techniques. In particular, we use Latent Dirichlet Allocation to infer the content (topics) of the articles, and Word Embedding (implemented with the Skip-gram model) and K-Means to measure their sentiment (uncertainty). In this way, we arrive at the definition of a set of daily topic-specific uncertainty indices. These indices are then used to find explanations for the behaviour of the US financial markets by implementing a batch of EGARCH models. In substance, we find that two topic-specific uncertainty indices, one related to COVID-19 news and the other to trade war news, explain the bulk of the movements in the financial markets from the beginning of 2019 to end-April 2020. Moreover, we find that the topic-specific uncertainty index related to the economy and the Federal Reserve is positively related to the financial markets, meaning that our index is able to capture actions of the Federal Reserve during periods of uncertainty.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno