воскресенье, 19 сентября 2010 г.

Банковский скоринг

В пятницу был на семинаре по бизнес-аналитике, который устраивает кафедра ММП. Там рассказывают, какие математические задачи решают в разных компаниях и банках.

На этом семинаре н.с. из ВЦ докладывался о построении скоринговых карт. Эта карта по сути является алгоритмом, который по данным о потенциальном заемщике определяет - давать ему кредит или нет.

Создание такой карты - нетривиальная математическая задача. Там и оптимизация, и кластеризация данных, и подбор параметров (настройка) модели.

Запомнилась классификация параметров модели: линейные, ординальные и номинальные. Ординальные - это те, которые можно как-то сравнить (напр., образование - высшее > среднего), линейные - обладающие свойством аддитивности (числовые параметры, доход клиента, скажем), а номинальные - просто имеющие некие значения (место рождения, пол и т.д.).

Время подачи заявки на кредит - важный параметр (линейный, кстати). Считается, что добропорядочный клерк не пойдет брать кредит в 12 часов дня в понедельник. В это время только мошенники ходят.

А, вот, про мошенников. На каждого клиента (кому дали кредит) составляют кредитную историю. Это цепочка ячеек-месяцев, в каждой написано - заплатил нужный процент или нет. Если сразу не стал платить и не платил первые три месяца от даты займа - это мошенник(fraud). Если вначале платил, а потом вдруг образовалось три месяца непроплаты - это банкрот(default). Предсказывать мошенничество (когда человек и не собирался возвращать) якобы научились (?!), а вот с дефолтами сложнее, для этого и нужны карты. Кстати, срок действия скоринговой карты в России всего год!

Подробнее - на wiki сайте www.machinelearning.ru