LGD ФИНАНСЫ ЭТО

Какую учетную политику можно выбрать при использовании «упрощенного подхода»?

Для торговой дебиторской задолженности и активов по договору, которые не содержат значительного компонента финансирования, необходимо признать резерв под ECL за весь срок ( т.е. компания всегда должна применять «упрощенный подход»
).

Для прочей торговой дебиторской задолженности, прочих активов по договору и дебиторской задолженности по аренде можно выбрать учетную политику, которая будет применяться отдельно для каждого типа активов (но она при это должна применяться ко всем активам определенного типа).

Возможности выбора учетной политики.

Рейтинговое моделирование

Задача рейтингового моделирования (РМ) — это построение модели рейтингования клиентов для последующего ранжирования. Рейтингование производится по отношению к разным негативным событиям — ухудшение кредитоспособности, банкротство и т.д.

В зависимости от контекста, можно по-разному классифицировать эту задачу:

По этапу жизненного цикла клиента:

  1. Заявочный (аппликативный) скоринг применяется для новых клиентов или клиентов с небольшой (или давней и неактуальной) историей внутри финансовой компании. В построении такой модели рейтингования важны профиль и анкета клиента, данные о его платежном поведении в других финансовых организациях (есть в Бюро Кредитных Историй) и данные о вхождении в разные списки — например, негативные списки ЦБ для юр.лиц. Заявочный скоринг используется для решения о выдаче кредита заявителю.
  2. Поведенческий скоринг применяется для определения рейтинга клиентов с актуальной историей. Здесь существенную роль играют поведенческие атрибуты внутри компании — обороты и платежная дисциплина по внутренним продуктам банка-кредитора. Поведенческий скоринг используется для вычисления и корректировки размера зарезервированных банком средств, но об этом чуть позже.

По требованиям к результатам работы модели:

  1. «Относительный» рейтинг: важно качество ранжирования (относительный порядок) клиентов в рейтинге, абсолютное значение не играет роли при принятии итогового решения.
  2. «Абсолютный» рейтинг: имеет значение абсолютное значение скора и алгоритм его пересчета в вероятность дефолта клиента. Часто бывает, что у банка зафиксировано пороговое значение вероятности дефолта, при котором клиенту может быть выдан кредит, и необходимо максимально корректно определить именно абсолютное значение вероятности дефолта по каждому из клиентов.

По степени включения экспертных представлений в итоговое решение:

  1. «Статистическая» модель. Ее веса подбираются на основании статистического анализа ретроспективных данных. Экспертные корректировки производятся на уровне отбора атрибутов и подготовки выборки для моделирования.
  2. «Экспертная» модель. Финальные значения весов факторов устанавливаются вручную (или полуавтоматически) с учетом кейсов по дефолтам за историю. Классический пример — модель Альтмана Z-score [2]
    .

По степени автоматизации решения:

  1. Результат рейтингования автоматически без ручных корректировок транслируется в конвейере для бОльшей части клиентов. Часть клиентов подвергается ручной проверке для оперативного мониторинга работы модели.
  2. Результат рейтингования является дополнительным инструментом для владельца модели и андеррайтера.

По степени использования информации о внешней среде:

  1. Stand-alone — приближение, при котором в факторах модели не учитывается взаимодействие клиента с другими клиентами. Основа — поведенческие атрибуты по финансовым продуктам. Влияние внешней среды учитывается или через процедуру калибровки, или через набор флагов о негативной информации с другими клиентами без детализации.
  2. «Supply chain finance» — использование информации о связях с другими заемщиками. В первую очередь, данные о транзакциях и данные об экономической, юридической, родственной (для ФЛ) аффилированности с другими клиентами. Чем больше такой информации, тем точнее будет прогноз — не только на уровне клиента, но и на уровне сделки [3]
    .

По степени вовлеченности в общий процесс:

  1. Результат моделирования используется локально: задача, как правило, не интегрируется с другими процессами. При таком применении возможны дополнительные требования к обслуживанию рейтинга — например, введение корректировок (в частности, корректировка рейтинга компании в зависимости от уровня поддержки государством).
  2. Результат является входом для другого процесса, т.е. частью большего приложения. В таких случаях необходимо учитывать специфику этого внешнего процесса, т.к. она может влиять на требования к разработке и валидации рейтинговой модели.

Еще кратко следует упомянуть актуальные тенденции по увеличению качества разрабатываемых моделей рейтингового моделирования:

  1. Поиск новой информации / источников данных (например, гео-аналитика [8]
    , соц. сети [9]
    , ОФД)
  2. Использование продвинутых алгоритмов для моделирования (все чаще XGBoost заменяет стандартные скоринговые карты на основе логистической регрессии);
  3. Использование продвинутых алгоритмов для поиска взаимосвязей (графовая аналитика) и генерации специфических атрибутов (text-mining);
  4. Операционализация моделей (встраивание моделей в автоматический pipeline разработка-внедрение-мониторинг-переобучение) для снижения модельного риска и автоматизации процесса, т.н. ModelOps решения [10]
    .

Рейтинговое моделирование все реже встречается как самостоятельная задача и все больше в связке с другими, являясь частью прикладного приложения по решению более общих задач. Одной из таких является кредитный офферинг. К нему и переходим.

Что изменилось?

МСФО (IFRS) 9 ввел новую модель обесценения, основанную на ожидаемых кредитных убытках (ECL, от англ. ‘expected credit losses’)
, в результате чего признается резерв на покрытие убытков до возникновения кредитных убытков.

При таком подходе предприятия должны учитывать текущие условия и разумную и обоснованную прогнозную информацию, которую она может получить без чрезмерных затрат или усилий при оценке ECL.

IFRS 9 устанавливает «общий подход» к обесценению (англ. ‘general approach’)
. Однако в некоторых случаях этот «общий подход» чрезмерно сложен, и поэтому были введены некоторые упрощения.

«Великолепный план, Уолтер … надёжный как … швейцарские часы» или pipeline разработки

LGD ФИНАНСЫ ЭТО

Этапы моделирования компонент риска схематично изображены на следующей диаграмме (стрелки – дополнительные итерации, возникающие в процессе разработки):

LGD ФИНАНСЫ ЭТО

Сводная таблица по компонентам

В заключение – таблица с указанием особенностей моделирования в разрезе компонент ожидаемых потерь. 

«Упрощенный подход» с использованием матрицы оценочных резервов.

Для краткосрочной торговой дебиторской задолженности, например для должников с 30-дневными сроками погашения, определение перспективных экономических сценариев не представляется целесообразным, учитывая, что в течение периода подверженности кредитному риску существенное изменение экономических условий обычно маловероятно, а уровни кредитных убытков прошлых лет могут быть подходящей основой для оценки ECL.

Матрица оценочных резервов или просто матрица резервов (англ. ‘provision matrix’)
представляет собой не что иное, как применение соответствующих уровней (коэффициентов) убытков к непогашенным остаткам торговой дебиторской задолженности (то есть анализ дебиторской задолженности по срокам возникновения).

Например, компания может применять разные коэффициенты убытков, в зависимости от периода просрочки погашения дебиторской задолженности.

С учетом разнообразия своей клиентской базы, компания может использовать соответствующие группировки для должников, если ее опыт кредитных убытков прошлых лет показывает существенно разные модели убытков для разных категорий клиентов.

Хотя это упрощенный подход, следует проявлять осторожность в следующих областях:

Группировка должников.

В тех случаях, когда в качестве исходных данных используются исторические коэффициенты убытков, необходимо провести должную проверку этих убытков, чтобы подтвердить полноту и точность ключевых параметров, включая используемые характеристики кредитного риска (например, даты погашения).

Если результаты существенны, для соответствующих групп дебиторской задолженности должна применяться отдельная матрица резервов на основе общих характеристик кредитного риска. Компании должны изучить исторические коэффициенты кредитных убытков, чтобы определить, есть ли существенные различия в моделях убытков для разных клиентских сегментов.

Корректировка исторических коэффициентов убытков для использования при прогнозировании ECL.

Следует определить, имели ли место в прошлом кредитные убытки в экономических условиях, аналогичных тем, которые, как ожидается, будут существовать в течение периода подверженности портфеля задолженности риску.

Важно рассмотреть вопрос о том, обоснованно ли применение этого подхода к портфелю, и были ли рассчитанные в прошлом коэффициенты убытков надлежащим образом скорректированы с учетом ожидаемых будущих изменений состояния и убыточности портфеля на основе информации, имеющейся на отчетную дату.

Иллюстративный пример матрицы резервов приведен ниже.

Довольно просто заявить, что достаточно применить эти коэффициенты убытков к матрице резервов. Однако как определить эти коэффициенты?

Далее описан поэтапный подход к применению матрицы оценочных резервов.

Учитывайте, что возможны и иные способы построения матрицы резервов, поскольку МСФО (IFRS) 9 не содержит каких-либо конкретных указаний насчет практического подхода.

Что еще почитать?

  • Письмо банка России от 29.12.2012 N 192-Т «О Методических рекомендациях по реализации подхода к расчету кредитного риска на основе внутренних рейтингов банков»
  • Положение банка России от 6 августа 2015 г. № 483-П «О порядке расчета величины кредитного риска на основе внутренних рейтингов»
  • Указание банка России от 15 апреля 2015 г. N 3624-У «О требованиях к системе управления рисками и капиталом кредитной организации и банковской группы»
  • Указание банка России от 6 августа 2015 г. № 3752-У «О порядке получения разрешений на применение банковских методик управления кредитными рисками и моделей количественной оценки кредитных рисков в целях расчета нормативов достаточности капитала банка, а также порядке оценки их качества»
  • В книге [13].

Положения и указания заботали, книги прочитали, а где тут DS? Как и обещали — DS в

деталях

компонентах. Но это уже совсем другая история. Подробнее особенности моделирования компонент PD, LGD и EAD разберем в следующей статье цикла, а в завершение вводной статьи приведем таблицу с вариантами приложений статистических методов и алгоритмов машинного обучения к сфере риск-моделирования в разрезе каждой задачи.

Дефолтные, но не банкротные

Передовая практика оценки дефолтов с таким статусом включает, в первую очередь, оценку EVA (экономической стоимости активов) и LVA (ликвидационной стоимости активов) компании.

EVA определяют в порядке, предусмотренном для недефолтных заемщиков, которые являются «непрерывно действующими» (то есть, в общем и целом, как скорректированную стоимость балансовых активов плюс стоимость будущей коммерческой деятельности, которая будет осуществлена в качестве «непрерывно действующего» предприятия). L VA определяют, исходя из допущения о ликвидации (то есть неизбежного прекращения деятельности, как скорректированную стоимость балансовых активов).

С аналитической точки зрения, первый подход (EVA) целесообразен для дефолтных фирм, процедура банкротства в отношении которых еще не начата (или начата, но впоследствии безуспешно завершена), но которые либо реструктурируют свои обязательства, либо получают спасительную поддержку или приобретаются третьими сторонами (с экономическим убытком для кредиторов или без него). С аналитической точки зрения, второй подход (LVA) целесообразен для фирм, в отношении которых начата процедура банкротства или ликвидации (которые впоследствии ликвидированы или распущены).

Затем в обычном порядке запускают модель LGD для расчета будущих коэффициентов LGD для обоих описанных выше подходов (то есть разделяя первоначальные значения при помощи EVA и LVA).

Наконец, коэффициенты дефолта (без банкротства), переходящего в статус (a) выхода из дефолта и (b) банкротства, применяют как весовые коэффициенты к двум будущим показателям LGD для завершения расчета и получения результата.

Читать также:  Функции корпоративных финансов. Курсовая работа на тему Функции корпоративных финансов

LGD ФИНАНСЫ ЭТО

Поскольку миграция обычно занимает короткий временной промежуток и коэффициенты миграции варьируются в зависимости от экономических условий, передовая практика заключается в использовании срезовых (PIT) коэффициентов миграции (отражающих текущие и будущие экономические условия), а не долгосрочных средних коэффициентов миграции.

В случаях, когда актуальная информация о проблемном финансовом профиле заемщика недоступна, традиционно применяют инструменты оценки значений EVA и LVA как функции от: последней доступной финансовой информации; соответствующих коэффициентов PD в отношении к такой финансовой информации; а также макроэкономических показателей, относящихся к периоду из финансовой отчетности.

Определение длины горизонта

Информация о дефолте используется для оценки ожидаемых потерь, под которые банк осуществляет резервирование. В этом случае возникает вопрос, а на каком периоде смотреть выходы в дефолт? Важно ли это? С точки зрения бизнеса, важно понимать период планирования, с точки зрения моделей мы хотим выбрать такой период, в котором будет охвачено не менее 80%-90% всех возможных выходов в дефолт для всех открытых и не находящихся в дефолте договоров на текущий момент времени.

  1. Рассматриваются несколько временных срезов (поколений/когорт) на исторической выборке;
  2. Для каждого из поколений учитываются все наблюдения из выборки для моделирования, не находящиеся в дефолте;
  3. Для таких наблюдений строится кумулятивный график выхода в дефолт. Обычно временной шаг – месяц. График может быть построен как в штуках, так и в деньгах;
  4. Горизонт может быть определен, например, как временной интервал, на котором выходят в дефолт 80% всех тех клиентов, которые вообще окажутся дефолте за весь доступный исторический период.

LGD ФИНАНСЫ ЭТО

При построении графика выше для каждой когорты было рассчитано значение, составляющее 80% от максимального числа наблюдений, вышедших в дефолт, а диапазон полученных значений обозначен серой полосой. По графику можно сделать вывод о том, что оптимальная длина горизонта лежит в интервале 6-8 месяцев.

Подготовка данных

Подготовка данных включает в себя формирование трёх сущностей: наблюдения (сегмент), витрина дефолтов, витрина атрибутов,- с единым внешним ключом — ID заемщика или договора и временная метка.

Такая декомпозиция обеспечивает гибкий подход к формированию выборки – легко изменять горизонт, гранулярность наблюдений, определение дефолта и не беспокоиться о корректности сбора атрибутов для итоговой витрины.

Каждое наблюдение – ID заемщика или договора и временная метка; другими словами, нас интересует состояние заемщика или договора на конкретную дату. Обычно используются наблюдения, соответствующие временным срезам, отстоящим друг от друга на равные промежутки времени (например, квартальным).

В случае задачи резервирования объем данных должен включать в себя полный экономический цикл, что составляет примерно 5-7 лет. 

Для формирования выборки необходимо учитывать горизонт.

Пояснение схематично изображено на картинке под катом

LGD ФИНАНСЫ ЭТО

В выборки для разработки и тестирования включаются наблюдения, для которых есть данные о выходе в дефолт на всем горизонте, поскольку включение наблюдений, для которых не прошел полный этап сбора (на картинке изображен красным цветом) приведёт к смещению величины уровня дефолта. 

Из-за необходимости учитывать период сбора, оптимальная глубина данных составляет 2-3 горизонта наблюдения. 

Также, если в модели планируется учесть какого-то рода сезонность — необходимо соответствующим образом выбирать глубину данных и периодичность срезов.

В таблице под катом перечислены основные группы и примеры атрибутов широкого списка переменных.

Атрибуты широкого списка переменных

Один из способов увеличения интерпретируемости и стабильности модели – это использование в качестве атрибутов не абсолютных значений признаков, а относительных: нормированных, например, на доход (выручку) или отражающих тренд/динамику показателя на временном интервале.

Однофакторный анализ

Целью проведения однофакторного анализа является уточнение широкого списка факторов таким образом, чтобы исключить неподходящие переменные. 

Для проведения однофакторного анализа необходимо разбить выборку на выборки для разработки (train) и тестирования (test). Выборка для тестирования может быть сформирована одним из следующих способов:

  • Out-of-time – разделение происходит по временной метке наблюдений; при данном разбиении нас интересует стабильность модели во времени. Самый распространенный способ разбиения;
  • Out-of-time X Out-of-id – разделение происходит как по временной метке, так и по id клиента; множество id клиентов и множество временных меток в выборке для разработки и тестирования не пересекаются, при данном разбиении нас интересует стабильность модели как во времени, так и по клиентам. Данный способ используется при достаточном количестве наблюдений в выборке.

Стоит отметить, что в идеальном мире (где достаточное число клиентов и дефолтов) корректнее разбивать исходную выборку на три части (разработка, валидация и тестирование). В рамках такого разбиения проведение однофакторного анализа ведется на выборках для разработки  и валидации, а итоговое качество отбора оценивается на выборке для тестирования. Для упрощения мы здесь и далее рассматриваем разбиение на train/test.

Шаг 2. Определите прошлый период с наиболее подходящими коэффициентами убытков.

Как только группы и подгруппы определены, необходимо собрать исторические данные о кредитных убытках для каждой конечной подгруппы. В IFRS 9 нет конкретных указаний о том, какой давности должны быть эти данные или насколько длительным должен быть период выборки.

Для определения прошлого периода необходимо вынести суждение.

В целом выбор периода должен быть обоснованным. При этом он не должен быть нереально коротким или слишком длительным. На практике этот период может варьироваться от 2 до 5 лет.

Кредитный офферинг или как сделать предложение от которого нельзя отказаться

LGD ФИНАНСЫ ЭТО

Результат рейтинговой модели (абсолютное значение оценки вероятности дефолта — PD) может быть использован для решения задачи кредитного офферинга. Под кредитным офферингом подразумеваем, в первую очередь, задачу установки первоначального лимита клиенту.

Безусловно, одного значения PD — прогноза вероятности дефолта — для определения оптимального лимита недостаточно. Нужно понимать допустимую область значений лимита, которые разумно предлагать клиентам. Это необходимо, чтобы сумма хотя бы косвенно отражала потребности клиента и его возможности по обслуживанию долга.

Ориентиром в этом случае может быть, например, оборот собственных средств клиента по некредитным продуктам. 

LGD ФИНАНСЫ ЭТО

«Ресурс» — стоимость денег, за счет которых осуществляется кредитование (например, ставка по депозитам, которая привлекает деньги вкладчиков и обеспечивает требуемую денежную массу). « Маржа» — ожидаемая прибыль от выдачи кредита. « Риск» — отчисление на случай невозврата кредита. « Расходы» — расходы на привлечение и обслуживание.

В этой структуре рейтинговое моделирование может быть использовано для определения размера и структуры блока «Риск». « Ресурс», в значительной степени, определяется ключевой ставкой ЦБ. « Расходы» и «маржа» — продуктовые составляющие, часто указываются в паспорте продукта.

Другими словами, «Риск» является всего лишь одной из компонент, которая влияет на итоговую доходность по сделке.

А как быть с другими? Похоже, возникает оптимизационная задача. Попробуем ее формализовать. Стоит подчеркнуть, что вариантов может быть множество, и опираться, в первую очередь, стоит на бизнес-задачу и контекст процесса разработки.

Начнем с простого варианта и далее покажем потенциальные точки развития решения. Проще всего оптимизировать доходность сделки.

Пусть происходит выдача кредитного договора на сумму L (лимит). У этого договора есть прогнозная вероятность дефолта PD. В первом приближении считаем, что клиент на момент дефолта имеет задолженность равную L.

Тогда оптимизационная задача будет выглядеть следующим образом:

LGD ФИНАНСЫ ЭТО

Видим, что PD фиксирован и зависимость от L линейная. Казалось бы, оптимизировать нечего.

Однако в реальной жизни PD зависит от L по следующим соображениям: чем больше лимит, тем сложнее обслуживать долг и, соответственно, тем выше вероятность дефолта. В этом случае наша задача, действительно, превращается в оптимизационную. Однако и тут есть нюанс. В выборке бывают клиенты с разными доходами, поэтому абсолютных значений будет недостаточно. Лучше всего строить зависимости не от лимита, а от уровня закредитованности, т.е. параметра $\frac{L}{Доход\:клиента (Д_к)}$
:

LGD ФИНАНСЫ ЭТО

Зависимость $PD(\frac{L}{Д_к})$
может быть восстановлена на исторических данных или данных пилота. 

Также на оптимизационную задачу могут влиять продуктовые стопы. Например, в паспорте продукта могут быть указаны допустимые границы уровня риска (вероятности дефолта). Тогда оптимизация производится только до указанной границы.

Далее усложняем, кому интересно, то под кат:

В целом, и особенно для других индустрий (телеком, например) оценка дохода и дебиторской задолженности (по-другому, EAD — Exposure at default — величина кредита на дату дефолта) в виде лимита являются слишком консервативными. Кроме того, стоит учесть, что часть средств может быть возвращена (та доля EAD, которая не будет возвращена, обозначается LGD – Loss Given Default). Тогда

LGD ФИНАНСЫ ЭТО

Обычно для выручки и EAD разрабатываются отдельные модели. L GD чаще всего заменяется консервативным значением, которое зависит от отрасли (банки, телеком и т.д.) и типа продукта (может оценивается как средний LGD по продукту). Для ориентира можно посоветовать использовать любимое число в диапазоне 0.9-1.

До сих пор мы считали, что только PD зависит от $\frac{L}{Д_к}$
. Но такой зависимостью могут обладать и другие компоненты:

LGD ФИНАНСЫ ЭТО

Далее, если мы хотим учитывать другие продукты в офферинге (например, для выбора оптимального предложения клиенту), то дополнительно следует учитывать вероятность отклика клиента на продукт и вероятность оттока, если клиент уже обслуживается:

LGD ФИНАНСЫ ЭТО

«Отклик» — вероятность взятия продукта, «Отток» — вероятность оттока клиента. В этом случае можно сравнивать доходности между разными продуктами и решать задачи Marketing Optimization.

Все что здесь перечислено — лишь канва для решения задачи. Пока мы не учитывали расходы на каждый продукт, стоимость привлечения ресурсов, стоимость кампании, вероятность мошенничества и т.д.

В общем случае их надо также включать в оптимизатор. Все зависит от контекста и приемлемого уровня приближения для решения бизнес-задачи.

Что еще погуглить? Ключевые слова risk-based limit, credit-limit management profit-based approach.

Итак, деньги предложены и выданы клиентам. Но часть из них начинает уходить в просрочку. Как управлять ситуацией?

Берем паяльник.

Собираем подушку безопасности в виде резерва денег. Как это сделать, расскажем прямо сейчас.

EAD (Деньги в дефолте)

После того, как оценена вероятность дефолта заемщика, ставится вопрос – с какой суммой задолженности заемщик уйдет в дефолт? Эта сумма линейно влияет на размер ожидаемых потерь и, соответственно, объем резервов, и называется exposure at default – требования в дефолте. Итак, EAD – exposure at default – кредитные обязательства по договору на момент дефолта. 

Напрямую, как правило, EAD не моделируют. Так как эта величина – денежная, её распределение не носит нормальный характер: в выборке могут присутствовать наблюдения очень большие и очень маленькие, не являющиеся при этом аномалиями. В зависимости от специфики портфеля можно выбрать разные целевые переменные – об этом подробнее будет сказано в последующих статьях цикла, но наиболее широко используемая – CCF – credit conversion factor – коэффициент кредитной конверсии – вычисляется следующим образом:

Читать также:  СИСТЕМА ГОСУДАРСТВЕННЫХ ФИНАНСОВ БЮДЖЕТ ВНЕБЮДЖЕТНЫЕ ФОНДЫ ГОСУДАРСТВЕННЫЕ КРЕДИТЫ

LGD ФИНАНСЫ ЭТО

где:

Balance
– сумма средств, которые клиент должен банку в момент наблюдения,

Limit
– доступный клиенту лимит,

EAD
– сумма средств, который клиент должен банку в момент дефолта.

Получается, что CCF – это та часть доступных на момент наблюдения средств, которая будет использована клиентом к моменту дефолта.

Как и вероятность дефолта, эту величину необходимо прогнозировать заранее. Обычно горизонт прогноза такой же, что и у PD.  

Все описанное выше касалось денег до дефолта и во время него. А что происходит сразу после? Об этом компонента LGD.

Постановка задачи

Алгоритм сбора LGD

Ниже приведена иллюстрация алгоритма сбора LGD.

LGD ФИНАНСЫ ЭТО

Рисунок 1. Алгоритм сбора LGD. Клиент совершил  две  выплаты после наступления дефолта: в феврале и мае 2019 г. Дата дефолта — январь 2019 г., горизонт восстановления — 6 месяцев.

LGD рассчитывается формуле:

LGD ФИНАНСЫ ЭТО

В нашем случае мы были вынуждены ограничиться горизонтом год после дефолта, поскольку  предоставленная заказчиком выборка была глубиной около 2 лет. Также нам были недоступны данные по платежам $R_i$
, поэтому в формуле расчета числитель был заменен на суммарный баланс на конец периода (основной долг + просроченный основной долг). Такая замена возможна, поскольку $EAD - \sum_{T}^{} {R_i}$
равен балансу на конец периода сбора данных по платежам:

LGD ФИНАНСЫ ЭТО

Целевая переменная модели 

Поскольку мы прогнозируем возврат денежных средств для клиентов, которые уже находятся в дефолте, в качестве целевой переменной целесообразнее использовать баланс не на момент дефолта, как описано выше, а текущий (момент наблюдения и/или скоринга), который учитывает возможное внесение денег на счет после дефолта. Поэтому величина LGD модифицируется и «баланс на момент дефолта» заменяется на «баланс клиента на дату наблюдения», полученный показатель используется как целевая переменная:

LGD ФИНАНСЫ ЭТО

Ниже приведена иллюстрация такого подхода к расчету целевой переменной.

LGD ФИНАНСЫ ЭТО

Рисунок 2. Алгоритм сбора целевого события

Благодаря такому подходу мы получаем модель, которая гибко реагирует на изменение баланса находящегося в дефолте клиента, что дает более точную оценку уровня потерь. Хотя LGD теперь определяется в момент времени $t$
, горизонт для сбора данных о восстановлении остается фиксированным и отсчитывается от даты дефолта.

Учет бизнес-процессов

При расчете LGD должны быть учтены события, которые могут происходить с кредитным договором после дефолта.

  • Продажа:

LGD ФИНАНСЫ ЭТО

где $Balance_{sale}$
– баланс на дату продажи договора, $Sale$
– сумма, за которую была продан договор. 

  • Списание:

LGD ФИНАНСЫ ЭТО

где $Balance_{wf}$
– баланс на дату списания.

  • Реструктуризация:

LGD ФИНАНСЫ ЭТО

  • Выздоровление, погашение долга и выход из дефолта:

LGD ФИНАНСЫ ЭТО

Стоит отметить, что здесь приведены примеры возможных стратегий, финальный подход всегда может быть пересмотрен с учетом пожеланий владельцев модели. 

Сегмент для моделирования 

Читатели, имеющие практический опыт в машинном обучении, наверняка понимают, что для модели, которая обучается на одном сегменте наблюдений, а применяется на другом, нужны особая схема и метод валидации. Рекомендации по валидации модели LGD будут даны далее.

Теперь, когда целевая переменная модели определена, можно переходить к формированию выборки и сбору атрибутов.

Многофакторный анализ и финальная модель

Цель многофакторного анализа – построение оптимальной комбинации факторов из списка, образованного на предыдущем шаге, для максимизации предсказательной силы модели при сохранении стабильности.

Процесс многофакторного анализа заключается в построении множества моделей и выборе наилучшей из них. Модели строятся на различных наборах атрибутов из списка, сформированного на этапе однофакторного анализа, 

Две самые распространенные модели для прогноза вероятности дефолта – это:

  • Логистическая регрессия с последующим построением скоринговой карты – интерпретируемый результат;
  • Различные реализации градиентного бустинга – неинтерпретируемый результат.

Рассмотрим построение интерпретируемой модели
модель логистической регрессии
. Для увеличения стабильности и интерпретируемости перед построением модели над атрибутами проводятся следующие действия:

  1. Категоризация атрибута – разбиение атрибута по значениям на группы/бины;
  2. Вычисление значения WOE – значение, вычисляемое для каждого бина атрибута, образованного при  категоризации по следующей формуле: [5]

    LGD ФИНАНСЫ ЭТО

    где:

    DistrGood
    – отношение числа недефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу недефолтных наблюдений;

    DistrBad
    – отношение числа дефолтных наблюдений, имевших значение атрибута из данного бина, к общему числу дефолтных наблюдений.

Общие правила для выполнения категоризации атрибутов складываются из экспертных правил (принципы заполнения пропусков, условие монотонности WOE, соответствие логике атрибута) и статистических критериев (достаточность наблюдений в категории).

Одним из недостатков подхода с использованием значений WOE вместо реальных значений атрибута являются потенциально возможные скачки значений вероятности дефолта (PD). Для решения указанной проблемы может использоваться сглаживание порогов функции WOE с целью создания непрерывных «плавных» переходов между соседними значениями WOE. Чаще всего сглаживание может производиться с помощью сигмоиды или гиперболического тангенса.

  • Forward – подход с последовательным добавлением факторов;
  • Backward – подход с последовательным удалением факторов;
  • Stepwise – комбинация подходов Forward и Backward.

В случае, когда нет требования интерпретируемости, может быть использована модель градиентного бустинга, наиболее часто используется реализация библиотеки Xgboost. В данном случае отсутствует требование к слабой корреляции атрибутов модели. В случае необходимости ограничить набор признаков модели, используется значимость атрибута – его вклад в итоговое качество, оцениваемое коэффициентом Джини, дает не менее 1% или уменьшает функцию потерь на величину, превышающую пороговое значение.

Итоговое качество модели определяется на тестовой выборке. Выборка для тестирования может формироваться тем же способом, что и при проведении однофакторного анализа. 

Шаг 1. Группировка дебиторской задолженности.

В МСФО (IFRS) 9 отсутствует четкое руководство или конкретное требование о том, как группировать торговую дебиторскую задолженность, однако группировка может основываться на географическом регионе, типе продукта, рейтинге клиентов, залоговом обеспечении или страховании торговых кредитных рисков, а также типе клиента (например, оптовый или розничный)
.

Общую совокупность элементов дебиторской задолженности необходимо объединить в группы дебиторской задолженности по схожим характеристикам кредитного риска.

При группировке дебиторской задолженности важно понимать и определять, что наиболее существенно влияет на кредитный риск каждой отдельной группы.


Рассмотрим телекоммуникационную компанию, которая продает мобильные телефоны и оказывает услуги мобильной связи.

Она может группировать дебиторскую задолженность от оптовых покупателей и розничных покупателей отдельно, поскольку они обладают разными характеристиками кредитного риска.

Кроме того, она может группировать дебиторскую задолженность, связанную с мобильными телефонами (т.е. дебиторская задолженность со сроком погашения более 24 месяцев), отдельно от дебиторской задолженности, связанной с ежемесячными абонентскими платежами, поскольку характеристики кредитного риска, связанные со сроком погашения, будут различными.

Затем она может сгруппировать каждую из вышеперечисленных выборок дебиторской задолженности по географическому признаку, если это будет обоснованно и целесообразно.

Исходя из этого, компания может прийти к выводу, что матрица резервов подходит только для торговой дебиторской задолженности, связанной с ежемесячной абонентской платой, и что для торговой дебиторской задолженности, связанной с продажами мобильных телефонов, необходим другой подход (который отражает дебиторскую задолженность более 24 месяцев).

Кроме того, предположим, что два географических региона были идентифицированы со своими собственными кредитными характеристиками.

В результате такой группировки получается 8 конечных подгрупп.

Моделирование

Выбор модели 

Выбор метода машинного обучения производится с учетом:

  • распределения LGD по dpd и default age;
  • распределения LGD;
  • формата, в котором необходимо предоставить результат моделирования;
  • баланса портфеля по договорам.

Следует отметить, что может быть необходимо несколько моделей для разных сегментов клиентов. Именно так мы и поступили для решения нашего кейса.

Логистическая регрессия

Логистическая регрессия — один из самых распространенных и известных методов машинного обучения. Из его преимуществ можно выделить скорость работы, простоту настройки и интерпретации, большое количество готовых реализаций.

Логистическую регрессию стоит использовать, если:

  • распределение LGD по dpd и default age монотонно-возрастающее;
  • результаты модели нужно представить в виде скоркарты;
  • баланс распределен по договорам практически равномерно (отсутствуют аномально большие по балансу договоры или их число незначительно).

Для логистической регрессии необходим бинарный таргет (0 или 1), но LGD величина непрерывная. Поэтому моделируемую величину бинаризуют  одним из способов:

  • взвешенным методом;
  • отсечением по фиксированному пороговому значению;
  • отсечением по случайному пороговому значению.

Бинаризованный LGD можно моделировать с помощью логистической регрессии. Смоделированная вероятность класса 1 трактуется как прогнозное значение LGD.

Взвешенная регрессия

Взвешенная регрессия относится к стандартным методам машинного обучения. Отличие от обычной регрессии: веса наблюдения используются в функционале ошибки. 

Данный метод применяется, когда

  • распределение LGD по dpd и default age монотонно-возрастающее;
  • скоркарта не требуется;
  • значительная доля баланса портфеля сосредоточена в небольшом количестве договоров. 

В последнем случае использование баланса на дату перед дефолтом в качестве веса наблюдения может значительно повысить качество модели LGD.

Дерево решений

Дерево решений — отличная альтернатива регрессии, которая обычно точнее, но также проста в интерпретации и настройке.

Дерево решений стоит использовать, если:

  • скоркарта не требуется;
  • распределение LGD по dpd и/или  default age не монотонно.

Распределение не монотонно, если с некоторого момента начинается списание большого числа имеющих высокий LGD ссуд. Поскольку LGD рассчитывается как усредненный показатель, эти ссуды увеличивают показатель LGD до момента списания и приводят к его снижению после.

Для корректного предсказания немонотонного поведения LGD в модель нужно одновременно включить два сильно коррелирующих фактора — dpd и default age, тогда методы на основе деревьев решений дают более высокое качество.

Что является значительным компонентом финансирования?

Договор с клиентом не будет иметь значительного компонента финансирования при наличии какого-либо из следующих факторов:

  • покупатель заплатил за товары или услуги заранее, и сроки передачи этих товаров или услуг определяются покупателем.
  • значительная часть возмещения, обещанного клиентом, является переменной
    , и сумма или сроки такого возмещения изменяются в зависимости от наступления или ненаступления будущего события, которое по существу не находится под контролем покупателя или компании (например, если возмещение предоставлено роялти, основанным на продажах
    ).
  • разница между обещанным возмещением и «денежной» ценой продажи товара или услуги возникает по причинам, отличным от предоставления финансирования покупателю или организации, и разница между этими суммами пропорциональна причинам возникновения разницы. Например, условия оплаты могут защищать компанию или покупателя от неспособности другой стороны надлежащим образом выполнить некоторые или все свои обязательства по договору.
Читать также:  НОВОСТИ ФИНАНСОВ АВСТРАЛИИ

Кроме того, параграф IFRS 15:63
предусматривает упрощения практического характера, в соответствии с которыми компании не нужно корректировать обещанную сумму возмещения с учетом влияния значительного компонента финансирования, если компания ожидает в момент заключения договора, что период между передачей обещанного товара или услуги покупателю, и получением оплаты от покупателя за этот товар или услугу, составит не более 1 года.

Представляется вероятным, что это упрощение будет применяться к большинству торговой дебиторской задолженности.

Далее мы рассмотрим, как компания может применять «упрощенный подход» на практике.

Мы специально сконцентрируемся на «упрощенном подходе» к торговой дебиторской задолженности без значительного компонента финансирования. В качестве примера методики, которая может применяться для «упрощенного подхода», мы будем использовать матрицу резервов для оценки ECL.

Такой же или аналогичный подход можно применить к активам по договору, не имеющим значительного компонента финансирования, а также к определенной дебиторской задолженности по аренде (как правило, дебиторской задолженности по операционной аренде) ввиду их краткосрочного характера.

Однако необходимо проявлять осторожность в дебиторской задолженности со значительными компонентами финансирования и дебиторской задолженности по финансовой аренде.

Матрица резервов может быть не самым подходящим методом в этих случаях. Это связано с тем, что матрицу резервов проще применять для краткосрочной дебиторской задолженности
.

Сегментирование выборки

Некоторые атрибуты настолько сильно коррелируют с  целевой переменной, что вклад остальных практически нивелируется. Это приводит к моделям с плохим ранжированием внутри группы с одинаковым значением «главного» атрибута. Во избежание такой ситуации используют подход сегментации, в рамках которого выборку делят на два или несколько сегментов — по одному на каждое значение «главного» атрибута (драйвера), и для каждого из них строят отдельную модель. В кредитном риске один из таких драйверов – наличие или длительность просрочки по платежу. 

Если выборка была разделена на два сегмента по длительности просрочки: сегмент с малой просрочкой и сегмент с большой просрочкой, и второй сегмент достаточно мал, то для него можно сделать простую модель на двух атрибутах: на скоринговом балле модели с малой просрочкой и длительности текущей просрочки. Если результат удовлетворяет всем требованиям валидации, то на нем можно остановиться.

Альтернативно можно разделить выборки на сегменты с просрочками за историю (I) и без просрочек за историю (II). 

  • Сегмент I – это наблюдения (клиент – дата наблюдения), для которых за всю историю или на каком-то горизонте ранее не наблюдалось просрочки. 
  • Сегмент II содержит наблюдения у которых в истории или на каком-то горизонте ранее наблюдались просрочки по платежу.  

В этом случае разделение на классы, как правило, более сбалансировано.

Рассмотрим, например, сегментацию наблюдений по величине просрочки. На картинке ниже в качестве примера выделены следующие 5 сегментов, соответствующих интервалам (бакетам) значений просрочки: 0-4 дня, 5-14 дней, 15-29 дней, 30-59 дней, 60-89 дней. Эти сегменты рассматриваются в нескольких моментах времени: HY1_2015,  HY2_2015 — соответственно, первое и второе полугодия 2015 года, HY1_2016, HY2_2016 — соответственно, первое и второе полугодия 2016 года. В процессе анализа нас интересует динамика выхода наблюдений в просрочку более 89 дней, поэтому для каждого из этих сегментов подсчитан процент клиентов, просрочка которых на горизонте наблюдения составила более 89 дней. 

LGD ФИНАНСЫ ЭТО

По графику можно сделать следующие выводы:

  1. В 0-1 сегментах низкая вероятность выхода наблюдений в просрочку 90+ дней, наблюдения из данных сегментов можно отнести к «good»/недефолтному сегменту. Можем воспользоваться данной информацией для определения границы  при сегментировании клиентов по уровню текущей просрочки.
  2. В 3-4 сегментах высокая вероятность выхода наблюдений в просрочку более 90+, наблюдения из данных сегментов можно отнести к «bad»/дефолтному сегменту. Это может быть  полезно, если мы хотим сместить границу и увеличить число дефолтов в good сегменте.
  3. Сегмент номер 2 является промежуточным, наблюдения из данного сегмента нельзя отнести ни к дефолтному сегменту, ни к не-дефолтному. Такие наблюдения могут исключаться из разработки для увеличения ранжирующей способности модели.

После дефолта вероятность дефолта становится равной 100%. А что еще происходит в момент дефолта? Смотрим дальше.

Валидация модели

По аналогии с применением модели валидация на дефолтном сегменте отличается от валидации на недефолтном сегменте. Цель валидации модели на дефолтном сегменте — оценка качества и стабильности модели. Валидация на недефолтном сегменте проверяет адекватность модели именно на этом сегменте.

Валидация на дефолтном сегменте

LGD ФИНАНСЫ ЭТО

Качество модели определяется по ее общей предсказательной способности, а также предсказательной способности и стабильности на уровне входящих в нее факторов. 

Для определения предсказательной способности модели используется модифицированный коэффициент Джини. А стабильность модели оценивается путем вычисления относительного изменения модифицированного коэффициента Джини между обучающей и тестовой выборками.

Предсказательная сила атрибутов обычно определяется коэффициентом Джини, а стабильность  — относительным изменением коэффициента Джини и population stability index (PSI).

Для определения корректности предсказанных значений LGD используется значение коэффициента loss-shortfall. Данный коэффициент показывает, происходит переоценка или недооценка уровня потерь.

Все вышеуказанные метрики качества подробно описаны под катом.

Подробнее о метриках

PSI (population stability index, индекс стабильности популяции)

PSI используется для проверки данных на репрезентативность и рассчитывается по формуле:

LGD ФИНАНСЫ ЭТО

где $x_{i}$
— доля наблюдений с $i$
-м значением фактора, $n_{i}$
— количество наблюдений, соответствующих $i$
-му значению фактора, $N$
— общее количество наблюдений в выборке ( $val$
— валидационная выборка, $dev$
— выборка для разработки).

LGD ФИНАНСЫ ЭТО

Обычно используются следующие пороги: 

  • до 10% — изменения в распределении минимальны;
  • 10–25% —  изменения в атрибуте существенны, но не блокируют включение в модель (часто делают так, чтобы эффективный вес таких атрибутов не превышал в итоговой модели 20–30%). Дополнительно эти атрибуты более тщательно мониторятся и валидируются при применении;
  • > 25% — данные атрибуты нецелесообразно включать в финальную модель. 

G (коэффициент Джини)

Коэффициент Джини — один из наиболее часто используемых тестов для оценки предсказательной силы факторов и дискриминационной способности модели в целом.

Коэффициент Джини для фактора рассчитывается по следующей формуле:

LGD ФИНАНСЫ ЭТО

где $X_{i}$
— кумулятивная доля всех наблюдений в группе $i$
, $Y_{i}$
— кумулятивная доля целевых событий (target = 1) в группе $i$
. Расчет кумулятивных долей проводится в порядке убывания значения целевой переменной.

Формула расчета  коэффициента Джини для модели LGD:

LGD ФИНАНСЫ ЭТО

где $S_{testing \ model}$
— площадь, ограниченная CAP-кривой тестируемой модели и случайной модели, $S_{ideal \ model}$
— площадь, ограниченная CAP-кривой идеальной модели и случайной модели.

Вычисление площадей CAP-кривых в контексте модели LGD производится по следующему алгоритму. Выборка для расчета коэффициента Джини, содержащая фактические и модельные значение LGD, а также соответствующие им значения баланса (основной долг и просроченный основной долг), сортируется по убыванию модельных значений LGD. Затем для каждого смоделированного значения рассчитывается функция:

LGD ФИНАНСЫ ЭТО

где $LGD_{i}^{real}$
$i$
-ое значение фактического LGD, $OD_{i}$
— соответствующие ему значение баланса, $n$
— размер выборки.

Формула для вычисления площади, ограниченной CAP-кривой идеальной модели и случайной модели, имеет следующий вид:

LGD ФИНАНСЫ ЭТО

где $x_{i}$
— накопленный процент всех наблюдений. Площадь, ограниченная CAP-кривой тестируемой модели и случайной модели, вычисляется аналогично с заменой значений фактического $LGD_{i}^{real}$
на модельное в формуле для $F_i$
.

Для интуиции — чем выше индекс, тем лучше статистическое качество модели. В качестве ориентира по порогам можно использовать следующие значения: 0,3–0,4 — модель может использоваться для расчетов и оценок, 0,5–0,7 — модели с хорошим качеством, можно делать расчеты и автоматизировать процесс, выше 0,7–0,8 — очень хорошо. В последнем случае рекомендуем перепроверить на предмет лика в данных и ошибках в сборе атрибутов (смотрят в будущее).

Loss-shortfall

Loss-shortfall показывает, насколько общие фактические потери превышают общие смоделированные потери. Потери определяются как произведение LGD (фактических или смоделированных) на соответствующий им баланс (основной долг и просроченный основной долг). Формула для вычисления Loss-shortfall имеет вид:

LGD ФИНАНСЫ ЭТО

где $LGD_{i}^{model}$
и $LGD_{i}^{real}$
— смоделированное и фактическое значение средневзвешенного по балансу LGD в бакете просрочки $i$
соответственно, $Balance_{i}$
— суммарный баланс в бакете $i$
, $n$
— общее количество бакетов просрочки.

Доверительные интервалы для теста не рассчитываются. Модель принимается, если фактические потери не превышают смоделированные — $LS \leq 0$
.

Валидация на non-default сегменте

Интегральная оценка качества

Идея данного подхода к валидации состоит в следующем: средний уровень LGD по договорам на первом месяце в дефолте (LGD default) должен соответствовать взвешенному по PD среднему LGD по этим же договорам до наступления дефолта (LGD non-default). Чтобы рассчитать интегральную оценку, необходимы:

  • PD и LGD non-default по договорам, которые на данный момент не находятся в состоянии дефолта;
  • LGD default по тем же договорам, но по их состоянию на первом месяце после выхода в дефолт;
  • фактического среднего LGD по тем же договорам;
  • сравнение среднего LGD default со средневзвешенным LGD non-default по PD и со средним фактическим LGD.

Этот алгоритм можно записать формулой:

LGD ФИНАНСЫ ЭТО

Данный метод не предполагает вычисление доверительных интервалов, поэтому решение о прохождении теста выносится экспертно.

Матрица сопряженности

Матрица сопряженности  уточняет интегральную оценку (табл.). Алгоритм формирования матрицы:

  • LGD договоров non-default сегмента делится на бины (например,  с шагом 5%);
  • далее для этих договоров рассчитывается их LGD на первом месяце в дефолте;
  • рассчитанные числа заносятся в таблицу, которая именуется  матрицей сопряженности. 

Таблица. Пример матрицы сопряженности по LGD non-default и LGD default

LGD ФИНАНСЫ ЭТО

По рассчитанной матрице сопряженности можно судить о разбросе LGD non-default по отношению к LGD, рассчитанному после выхода договора в дефолт. Например, в приведенной таблице видно, что большая часть наблюдений имеет одинаковый LGD по non-default модели и по default модели. Для наглядности, эти ячейки выделены ярким цветом.

Выборка для моделирования

PD или как ковер задает стиль всей комнате

LGD ФИНАНСЫ ЭТО

Проблемы с обесценением межфирменных кредитов.

Все это может быть теоретически просто и понятно, но есть несколько трудностей с внутригрупповыми кредитами, например:

Трудно получить исходные данные для расчетов.
Показатели LGD и PD трудно получить, поскольку межфирменные кредиты обычно не имеют кредитного рейтинга.

То есть, компания группы обычно имеет кредитный рейтинг у банков (как у внешних кредиторов), и вы можете определить вероятность дефолта на основе этого рейтинга, но не на основе кредитования внутри группы.

Вы не можете применять внешний кредитный рейтинг к внутригрупповому кредиту без какой-либо корректировки, потому что риски внутренних и внешних кредитов не эквивалентны — вы обычно в первую очередь погашаете задолженность перед внешними кредиторами, и только после этого — перед материнской компанией.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *