Эта статья является продолжением нашего предыдущего обсуждения чтения и анализа заявлений FOMC с использованием методов обработки естественного языка. В этой части мы углубимся в использование финансового рынка для маркировки нашего набора данных, преобразование заявлений FOMC в векторы и последующее применение модели классификации для прогнозирования роста или падения доходности после выпуска заявления FOMC.

Заявления FOMC доступны на веб-сайте Федеральной резервной системы в формате PDF и HTML; мы сделали отчеты с 1997 по начало 2023 года доступными по этой ссылке на github вместе с некоторыми экономическими показателями, которые мы будем использовать.

econs_metrics = pd.read_excel("FOMC Statements 1997-2023 (BBG).xlsx", 
                              sheet_name = 'MASTER data FOMC statements',
                             skiprows=1)
econs_metrics.drop('Unnamed: 0', axis=1, inplace=True)
econs_metrics.rename(columns={'Dates':'Meeting Date'}, inplace=True)
econs_metrics

Во-первых, мы прочитаем экономические показатели из файла Excel «MASTER data FOMC Statements». Давайте поймем, что мы здесь смотрим:

  1. Дата заседания относится к датам, когда было выпущено соответствующее заявление FOMC, вы можете видеть, что они соответствуют календарю заседаний FOMC;
  2. «US10Y_1D_before» и «US10Y_1D_after» — это доходность 10-летних государственных облигаций США, полученная от Bloomberg за день до публикации отчета и день после него. Столбец «Метка» был создан на основе показателей урожайности, мы пометим его «1», если доходность выросла, и «0», если доходность упала;
  3. Остальные столбцы включают ставку Федерального резервного фонда, уровень безработицы, базовый индекс потребительских цен, спред доходности 10-летних и 2-летних облигаций.

Выбор этих данных призван отразить двойной мандат Федеральной резервной системы по поддержанию стабильных цен и оптимальной безработицы. Они дают нашей модели представление об экономической среде, в которой происходили изменения доходности (метки). Мы использовали как абсолютный уровень этих показателей за каждый период, так и их изменение по сравнению с 90 днями ранее, чтобы отразить направление общей тенденции этих показателей, входящих в каждый отчет FOMC.