Marek Gruszczynski
Scoring logitowy w praktyce bankowej a zagadnienie koincydencji

Punktacja, czyli scoring klienta instytucji finansowej, jest syntetycznym wskaźnikiem, określającym poziom ryzyka związanego z wnioskiem o kredyt bądź inny produkt finansowy. Artykuł przedstawia jeden z modeli statystycznych wykorzystywany przy budowaniu karty punktowej w banku. Jest to dwumianowy model logitowy, w którym zmienna zależna Y jest zmienną binarną (zerojedynkową), natomiast prawdopodobieństwo, że Y = 1 określa się za pomocą rozkładu logistycznego. Dla danego wnioskuY = 1 oznacza, że kredyt zostaje przyznany, a Y = 0 oznacza, że wniosek o kredyt jest odrzucony. Zmiennymi egzogenicznymi modelu są predyktory zmiennej Y.

Jedna z własności modelu logitowego polega na tym, że znak parametru przy nieujemnej zmiennej egzogenicznej X pokazuje kierunek wpływu tej zmiennej na Y. Jeśli ten parametr jest dodatni, wówczas wzrost X wiąże się ze wzrostem szans na to, że Y = 1. Dla ujemnego parametru: wyższym wartościom X odpowiada niższe prawdopodobieństwo tego, że Y = 1. Oznacza to, że specyfikacja modelu może uwzględniać postulat koincydencji, to jest równości znaków parametrów dla zmiennych egzogenicznych ze znakami odpowiednich współczynników korelacji.

W artykule przedstawiono ilustrację liczbową (opartą na danych symulowanych) podejścia do specyfikacji modelu logitowego dla 1.200 wniosków, z których 600 dotyczy kredytów zaakceptowanych, natomiast pozostałych 600 wniosków jest odrzuconych. Potencjalne predyktory (zmienne egzogeniczne) obejmują grupę zmiennych mierzalnych na skali przedziałowej, takich jak dochód roczny klienta lub liczba lat pracy. Ponadto, do predyktorów należą zmienne zerojedynkowe: poziom wykształcenia, stan cywilny itp.

Pierwszy etap specyfikacji dotyczy doboru predyktorów zgodnie z następującymi kryteriami:
  1. predyktory są słabo skorelowane między sobą,
  2. są mocno skorelowane ze zmienną Y.
Dobór odbywa się na podstawie analizy macierzy, obrazującej poziom i kierunek współzależności między wszystkimi możliwymi parami zmiennych X i Y. Jeśli co najmniej jedna ze zmiennych w parze jest zmienną zerojedynkową, wówczas współczynnik korelacji należy zastąpić odpowiednią miarą asocjacji. Proponuje się dwie takie miary:
      
  1. współczynnik skojarzenia Yule'a, jeśli obie zmienne w parze są zmiennymi zerojedynkowymi,
  2. wynik testu t dla różnicy średnich, w przypadku gdy jedna ze zmiennych jest zmienną zerojedynkową, a drugą jest zmienną mierzalną na skali przedziałowej.
Na drugim etapie następuje estymacja modeli logitowych dla predyktorów wybranych w pierwszym etapie, przy czym dodatkowo modele bada się pod kątem koincydencji. Postulat koincydencji nie jest powszechnie akceptowany w ekonometrii. Jednakże w przypadku, gdy obie zmienne Y i X są zerojedynkowe, spełnienie tego postulatu w modelu jest uzasadnione. Załóżmy, że proponujemy dwa wnioski kredytowe, dla których wartości wszystkich zmiennych X są identyczne poza jedną: równą 0 dla pierwszego wniosku oraz równą 1 dla drugiego wniosku. Jeśli miara współzależności tej zmiennej ze zmienną Y jest dodatnia, to należy oczekiwać, że prognoza prawdopodobieństwa zdarzenia Y = 1 dla drugiego wniosku będzie wyższa niż dla pierwszego. Oznacza to, że parametr przy tej zmiennej w modelu logitowym powinien mieć znak dodatni, czyli powinien być spełniony postulat koincydencji. Wykorzystywanie zasady koincydencji przy doborze predyktorów wzbogaca zatem efektywność poszukiwania optymalnej dla banku karty scoringowej.

Ta strona używa plików cookies, dzięki którym może działać lepiej.
Aby się dowiedzieć więcej o technologii cookies, proszę kliknąć tutaj: Polityka prywatności NBP »
Aby móc przeglądać zawartość, należy zaakceptować cookies z tej strony Akceptuję