Во денешно време практично е невозможно да се раководи финансискиот сектор без употреба на Data Science. Ова е од причина што менаџирањето на ризици и анализи се составен дел од работата во овој сегмент, а притоа од огромно значење е предиктивната моќ на Data Science за носење на големите одлуки. Како сегменти во кои се применува Data Science може да се истакнат детекција на измами, менаџирање со клиенти, како и анализа на ризик што во суштина е огромен дел од работата во банкарскиот сектор.
Како се аплицира DS во финансиите, односно во банкарскиот сектор? Како нештата се променија благодарение на оваа наука и кои предизвици допрва ќе се решат со нејзина примена? На овие теми разговаравме со Илија Филиповски, чија специјалност е токму Data Science во делот на финансии и банкарскиот сектор.
Ако направиме едно површно „како беше некогаш, а како е сега“, за колку голема разлика во начинот на функционирање на финансискиот сектор зборуваме кога се работи за делот на методи на работа во поглед на работа со податоци?
Живееме во ерата на big data. Брзиот развој на научната и податочната технологија во изминатата деценија донесе не само нови и софистицирани аналитички алатки во финансиските и другите индустрии, туку и ја воведе моќта на примената на науката за податоци во секојдневниот стратешки и оперативен менаџмент. Аналитиката на податоците и научниот развој се особено вредни за финансиските институции кои во голема мера зависат од финансиските информации во нивните процеси на донесување одлуки.
Несомнено Big Data комплетно го смени финансискиот сектор. Големиот број на податоци што сега се достапни раскажуваат цела приказна за навиките на потрошувачите и им помага на институциите како што се банките да реагираат брзо и поагилно да работат. Каде ти го гледаш најголемиот успех од употребата на Big Data во светот на финансиите и како Data Science ги промени нештата?
Револуцијата на big data што се случува во и околу 21 век, наиде на значење кај банкарските фирми, имајќи ги предвид вредните податоци што ги чуваат многу децении. Овие податоци сега ги открија тајните на движењето на парите, помогнаа да се спречат големи катастрофи и кражби и да се разбере однесувањето на потрошувачите. Банките имаат најголема корист од big data, бидејќи сега можат брзо и лесно да извлечат добри информации од нивните податоци и да ги претворат во значајни придобивки за себе и за своите клиенти. Банките на меѓународно ниво почнуваат да ја користат моќта на податоците во различни сфери на нивното функционирање, почнувајќи од анализа на чувствата на своите корисници (sentiment analysis), продажба на производи, управување со регулаторни усогласувања, управување со ризик, управување со финансиски криминал и многу повеќе.
Аналитиката на податоците успешно се користи во банкарскиот сектор, во однос на следниве аспекти:
- Churn анализа и предвидување
- Propensity to buy анализа (склоност\можност да се купи одреден продукт)
- Употреба на канали
- Сегментација на клиенти и профилирање
- Продажба на производи врз основа на профилирање
- Анализа на чувства и повратни информации
- Управување со безбедност и измама
Пандемијата го зголеми оптекот на онлајн парични средства како никогаш досега, но тоа со себе ја повлече и потребата банките и корисниците да се заштитат од измами. Како се користи Data Science, односно машинското учење во делот на детекција на измами со картички?
Откривањето на измамнички (fraud) трансакции користејќи традиционални методи за рачно откривање одзема многу време и е неефикасно, така што појавата на техниките за работа со податоци ги прави рачните методи понепрактични.
Голем дел од работата на ML во финансискиот сектор се базира на детална анализа на однесувањето на клиентите.
Истото е при детекција на трансакции кои претставуваат измама. Се користат историски податоци за секој корисник и секоја трансакција, за потоа врз база на историското однесување на корисникот да се предвиди дали одредена трансакција е измама или не е. Тука се согледуваат податоци кои го опишуваат однесувањето при трошење на картичка поради тоа што трансакциите со кредитни и дебитни картички се наједноставниот и најчестиот начин на плаќање и online и offline.
Mетодите за откривање измама се поделени во две широки категории: надгледувани (supervised) и без надзор (unsupervised). Во надгледуваните методи за откривање на измама, моделите се проценуваат врз основа на примероците на измамнички и легитимни трансакции за да се класифицираат новите трансакции како измамнички или легитимни, додека во откривање на измама без надзор, трансакциите се откриваат како потенцијални случаи на измамнички трансакции без притоа да имаат јасен таргет.
Предизвикот овде, како и во речиси сите проекти е бирање на метрики кои добро го прикажуваат однесувањето на корисникот, со цел алгоритмот успешно да „фати“ сè што е надвор од границите на нормалното однесување. Пример: Дали дадениот корисник секоја среда прави големи трансакции или конкретно оваа трансакција може да е измама?
Покрај во делот на спречување на измами, банките во денешно време имаат можност и прилика да ги персонализираат активностите врз база на историјата на податоци што ги имаат за клиентите, односно можат да интервенираат да ги задржат. Како изгледа тоа во пракса?
Customer churn, што се дефинира како склоност на клиентите да престанат да работат со компанија во даден временски период е значаен проблем и е еден од главните предизвици со кои треба да се соочат многу компании ширум светот. Со цел да преживеат на зголемено конкурентен пазар, многу компании се свртуваат кон техники за анализа на churn и спречување на истиот.
Повторно, деталната анализа на однесувањето на корисниците е круцијална. Она што е различно овде е типот на податоци. Би се гледале податоци кои ја опишуваат демографската и финансиската состојба на секоj од корисниците. Со помош на овие податоци се предвидува веројатноста определен корисник да си замине од банката. Доколку веројатноста е над определената граница (која се утврдува во зависност од бизнис правилата на клиентот) може да се направи класификација за дадениот корисник дека ќе си замине како клиент на банката.
Конструирање на модел за предвидување на churn значи дека се обидуваме да го моделираме однесувањето на клиентот. За ова да биде успешно, трансакциските активности на клиентите треба да се анализираат во одреден временски период. Оттука, земањето податоци никогаш не би било доволно. Тоа значи дека подготовката на податоците е од витално значење во предвидувањето и трае речиси 60-70 проценти од вкупното време, како и кај голем дел од останатите типови на проблеми.
Како надополнување на ова, може да се каже дека Data Science придонесува и за креирање на пофикасен систем за грижа на корисници…
Токму така и можеби најдобро е ова да се прикаже преку пример. Дневно една банка има огромен број на корисници кои имаат некаков проблем или прашање. Тие прашања се повторуваат и ако се автоматизира системот за грижа за корисници преку четбот така што честите прашања би биле одговарани преку четбот, а посложените би добиле внимание од вработените, ќе се заштеди и време и пари.
Што е она што влегува во историските податоци на еден клиент? Што ја гради нашата приказна во рамки на банкарскиот систем како единка и колкав предизвик за банката е нивното чување и менаџирање?
Предизвикот е огромен, поради тоа што е огромен и бројот на податоци кои една банка ги генерира на дневно ниво. Сите трансакции кои што ги прави еден корисник мора да се зачуваат. Сите демографски податоци за секој корисник мора да се зачуваат и исто така сите услуги кои клиентот ги користи во банката (кредит, картички, депозити). Во склоп на ова, за банката предизвик е и безбедноста на сите овие податоци, зашто сепак зборуваме за многу чувствителен сегмент кој често е предмет на сајбер напади. Овде мора да се спомене GDPR регулативата од ЕУ чија намена е заштита на податоците и приватноста, односно истата регулира како компаниите и организациите ги третираат податоците. Тука секако спаѓаат и банките кои како што споменав имаат голем број на лични податоци за своите клиенти.
Како пак сето ова погоре помага за персонализирани услуги и таргетирање на клиентите?
Собирањето информации за клиентите се смета за неопходно за развој на маркетинг стратегиите. Тие се користат многу ефикасно во банкарските маркетинг кампањи како и во многу области од животот. Податоците за клиентите се чуваат електронски и големината на овие податоци е толку огромна што е невозможно рачно да се анализираат со тим на луѓе аналитичари.
Целта во овој дел е таргетирање на стари и нови корисници кои би земале кредит, отвориле нова сметка, итн.
Исто така, задоволството на клиентите е клучен фактор за да се биде лидер во овој високо конкурентен сектор. За да се зголеми задоволството на клиентите, банките треба да се подобрат со креативни производи и канали за дистрибуција за да бидат подобри од својата конкуренција.
Менаџирањето со ризик е голем дел од работата на банките, но е сепак широк термин кој покрива различни ризици. За што всушност зборуваме кога велиме дека Data Science помага во делот на менаџирање на ризикот?
Наједноставно ова би го објаснил со пример. Кога одредена индивидуа или бизнис аплицира за заем, заемодавецот мора да процени дали барателот може со сигурност да ги отплати главнината и каматата на заемот. Кредиторите најчесто користат мерки за профитабилност и потпора за да го проценат кредитниот ризик. Профитабилната фирма генерира доволно готовина за да ги покрие расходите од камата и главницата што треба да се плати. Меѓутоа, фирмата со поголема моќ има помал капитал на располагање за временски економски шокови. Ако се земат во предвид двајца кандидати за заем – едниот со висока профитабилност и висока потпора, а другиот со ниска профитабилност и ниска потпора – која фирма има помал кредитен ризик?
Комплексноста на одговарање на ова прашање се множи кога банките инкорпорираат многу други димензии што ги испитуваат за време на проценката на кредитниот ризик.
Овие дополнителни димензии обично вклучуваат други финансиски информации, како што е соодносот на ликвидност или информации за однесувањето, како што е однесувањето на плаќањето заем/трговски кредит. Сумирањето на сите овие различни димензии во еден резултат е предизвик, но техниките за машинско учење помагаат да се постигне оваа цел. Заедничката цел зад машинското учење и традиционалните алатки за статистичко учење е да учиме од податоци. Двата пристапа имаат за цел да ги истражат основните односи (relationship) со користење на тренинг податоци. Вообичаено, методите за статистичко учење претпоставуваат формални односи помеѓу променливите во форма на математички равенки, додека методите за машинско учење можат да учат од податоците без да бараат програмирање базирано на правила.
Како стоиме на ова поле во Македонија? Дали сме во чекор со светските трендови во поглед на примена на Data Science во македонскиот банкарски сектор?
Речиси во сите полиња од Data Science во Македонија сме на почеток. Иако сме на почеток, сепак добро напредуваме. Голем дел од македонските банки и осигурителни компании почнуваат да веруваат и да го користат овој начин на работа. Односно, сè повеќе и повеќе ја разбираат значајноста на Data Science и придобивките од овој начин на работа. Прашање на време е кога Data Science ќе биде главна помошна алатка при носење на одлуки како во банкарскиот сектор така и во сектори како маркетинг, HR, продажба, итн.
Потребата на финансискиот сектор во државата за имплементација на AI модели за предвидување е видна во секое поле. Желбата во Македонија е на високо ниво, но за имплементација на вакви решенија во институции како што се банките, истите треба да имаат инфраструктура, бизнис логика и строго дефинирани бизнис барања за да може едно DS решение да послужи како помошна алатка во секојдневниот процес на носење одлуки.
За крај, едно предвидување. Кој проблем според тебе допрва ќе биде решен во финансискиот сектор со помош на Data Science?
Можеби не е ништо ново, меѓутоа дефинитивно постои простор за дополнително развивање на решенија кои ќе помогнат во безбедноста. Односно, унапредување на методите кои би ги заштитиле и корисниците и банката од измами. Дополнително, детално проучување на однесувањето на своите корисници со цел банките да бидат ориентирани да ги понудат најдобрите пакети на оние на кои највеќе им се потребни.