„Data Science во комбинација со искуството се патот до ефикасно работење“

marko apostoloski

Бизнисите, односно компаниите во денешно време на располагање имаат голем број на податоци, а тоа само по себе претставува прилика и предизвик. Со правилно собирање на вистинските податоци, нивна анализа и ползување не само што може да се подобри процесот на работење, туку и да се биде чекор пред конкуренцијата. Од друга страна предизвикот е кои податоци и како треба да се искористат за да се постигне тоа?

Токму на оваа тема разговаравме со Марко Апостолоски, Data Scientist во Data Masters, чија работа опфаќа проекти од оваа област.

 

Кои се најчестите предизвици со кои се соочуваат бизнисите во денешно време кога се работи за податоците?

Генерално гледано, сите бизниси односно компании имаат проблем со податоци т.е количество на податоци. Откако е влезена дигитализацијата и фискализацијата на макро и микро ниво се генерираат огромно количество податоци кои се зачувуваат во податочните бази на компаниите. Разликата меѓу модерна и застарена политика на една компанија ја чини паметното искористување на тие податоци. Во суштина, самото тоа што една компанија ги користи податоците за некаква анализа (следен чекор би бил машинско учење) зборува за нејзиниот пристап и модернизација во функционирањето во кој компанијата учи и извлекува заклучоци од податоците.

Предизвикот или повеќе би рекол задолжителна работа во која компанијата треба да инвестира е градење на data warehouse или складиште на важни податоци од кои потоа се прави анализа. Потребно е да се постави архитектура за да се извлечат најдобрите информации и тоа не е едноставна задача, затоа што треба да се осмисли како лесно и секојдневно сите во компаниите би можеле да ги користат податоците за нивните потреби, посебно менаџерите. Тој процес се автоматизира, а големиот број на сработени проекти од страна на колегите од одделот за Business Intelligence само зборува за тоа дека свесноста за ова кај нас полека, но сигурно се буди.

 

Гледано од поширок аспект, како Data Science може да им помогне на бизнисите, односно компаниите да работат подобро?

Јас би тргнал од следново – Data Science може да им помогне на компаниите да научат што е можно повеќе за шаблоните (patterns) присутни во нивното повеќегодишно работење. Ако зборуваме за продажба, Data Science може да најде шаблон на реализирана продажба, на нешта кои се случиле, односно работи кои не се гледаат и утврдуваат на прв поглед. Целта е да извлече заклучок од сето она што се случувало во минатото, за да може да се креираат подобри решенија за во иднина.

Подобри решенија подразбираат не само заштеда на време и средства, туку и држење на чекор пред конкуренцијата, поголема заработка и поефикасно работење.

 

Историските податоци кажуваат цела приказна за минатото, но и го држат одговорот за иднината. Кои се најчестите грешки што компаниите ги прават во поглед на селекција, прибирање и чување на податоци?

Најголемата грешка што компаниите од ова поднебје ја прават е тоа што нивните одлуки се носат само врз база на инстинкти и минато искуство. Domain knowledge е од исклучителна важност, но тој сам по себе не може да даде одговор на важни прашања кои машинското учење т.е Data Science може да ги покрие.

Ова можеби најдобро би го пренесол преку пример. Во малопродажбата постојано се прават акции/промоции на производи кои влијаат на продажбата. Бизнисот може да претпостави дека еден производ би се продал во поголема количина, ако му направи акција и го промовира. Таа зголемена продажба, најчесто се додава на просекот на продажба реализирана во претходните периоди (денови, месеци…), но тој просек не е добра естимација за тоа каква ќе биде продажбата утре. Само со просекот не може да се утврди точниот тренд односно сезоналноста на продажбата.

Тука веќе на сцена стапуваат Data Science и машинско учење, затоа што со нив можеме да ги поставиме сите сценарија кои влијаат на продажбата. Трендот, сезоналноста и промоцијата се трите фактори кои влијаат на продажбата кои моделот ги согледува и донесува едно крајно предвидување кое е најблиску до реалната продажба што би се остварила. Еден човек не може да ги согледа сите сценарија, дури и да може да го прави тоа во Ексел, тоа ќе му одземе толку многу време што кога ќе го добие резултатот ќе биде ирелевантен. Но, затоа пак машинското учење тоа го може.

 

Можеби еден од најголемите проблеми особено во малопродажбата е како да се предвиди побарувачката, а со тоа и да се нарачаат и складираат доволно производи за да се одговори на истата. Како може да се постигне ова и кои се ризиците од погрешна проценка?

Одржувањето на оптимална залиха е цел на секој бизнис во малопродажба. Ова е залиха која ја планираме за одреден производ, при што на крајот сите клиенти ќе бидат услужени и ќе останат што помал број на непродадени производи.

Ризикот од погрешна проценка е на крај да се остане без потребниот број на производи потребни да се задоволи побарувачката или да останат преголем број на производи што со себе повлекува ризик од истек на рок на производи, како и непотребно зафаќање на складишен простор кој има соодветни трошоци (наем, режиски трошоци и сл.). Кога би се постигнала оптимална залиха, овие средства би ги насочиле и искористиле за нешто сосема друго.

 

Што подразбира имплементацијата на решението за Demand Forecasting (предвидување на побарувачката)? Всушност од каде треба да почне една компанија за да го спроведе овој процес и на што треба да се внимава притоа?

Основен предуслов за во една компанија да се имплементира ваков вид на предвидување е да се поседуваат структурирани податоци. Под структурирани податоци се подразбира поседување на систем на дигитализирана продажба, како и тоа продажбите да се точно и соодветно заведени. Колку се поточни и подобро средени податоците, толку е полесно да се изгради модел кој ќе се имплементира во соодветна компанија. Ако податоците не постојат или недостигаат одредени податоци поради икс причини, тие фактори секако влијаат врз моделот што го генерира предвидувањето. Во денешно време би рекол дека повеќето компании кај нас ова го имаат спроведено.

Во секој случај најбитен е квалитетот на податоците.

За да се изработи модел за еден клиент потребни се што повеќе историски податоци од продажбата. Она што сакам да го посочам е дека притоа голем труд влегува во тоа да се изнајдат токму оние податоци што ни се потребни, бидејќи не секогаш сите се во една иста табела, а истите се извлекуваат со помош на data mining. Потоа се прави нивна анализа, гледаме што можеме да научиме од нив и да искористиме, а како следен чекор правиме пре-процесирање, бидејќи е потребно моделот да ги разбере податоците. На крај се тестираат повеќе модели, односно се прави нивна евалуација за да се одбере соодветниот.

 

Искуствено гледано, колку македонските компании го применуваат ова во својата работа?

Од досегашно искуство би рекол дека примената на Data Science во Македонија е на почеток. Многу мал дел од бизнисите ја користат како алатка за подобар развој и поефикасно работење. Сè уште нема доволно свесност и знаење за тоа што нуди оваа област, но секако правиме чекор напред. Можеби оди бавно, но е во нагорна линија. За поширока примена мислам дека ќе придонесат позитивни искуства кои компаниите локално би си ги пренесле едни на други. Успешните приказни ќе им покажат на компаниите за можностите што Data Science им ги нуди и на нив.

 

Постои ли пример за компанија од светската бизнис сцена која може да се посочи за одлично искористување на податоците? 

Постојат голем број компании кои го прават тоа. Всушност, сите големи компании имаат инкорпорирано Data Science во нивната работа. Како пример би ја издвоил Spotify. Алгоритмот на Spotify одлично знае да ти го научи вкусот земајќи предвид која песна ја слушаш до крај, која песна ја прескокнуваш, која ти се допаѓа, за потоа врз база на тоа да ти препорача неделна листа со песни. На моделот му беа потребни неколку месеци да ми го научи вкусот, но сега можам да кажам дека од 30 песни што ми ги препорачува на неделна база, во отприлика 70% ми го погодува вкусот.

Друг пример во сосема поинаков домен е Amazon. Нивниот процес опфаќа доста чекори и се реализира на повеќе географски локации, но истите се добро оптимизирани за да се одржува оптимална залиха.

 

За да се постигне резултат треба да се внимава од каде и каков вид на податоци се собираат. Што е она во што бизнисите треба да инвестираат за максимално да ги искористат податоците во своја полза?

Потребно е да се инвестира во архитектурата на нивните бази. Колку подобро структуирана база имаат, толку полесно може да дојдат до потребните информации. Еден од начините да се постигне тоа е градењето на DWH (data warehousing), каде што компaнијата би ги имала потребните податоци за да може да го разбере својот бизнис, да ги види моментите што не може да се видат во Ексел, ниту пак со помош на искуство. Искуството (domain knowledge) во никој случај не смее да се потцени, но само по себе нема научна вредност. Но, во комбинација со структурирани податоци и статистика е патот до ефикасно работење.

 

Што е со поседувањето know-how за реализација на процесот? Веројатно голем број компании кај нас не поседуваат кадри со потребното знаење за да се имплементира еден ваков пристап. Правиме ли чекор напред кон стручно оспособување на постоечките кадри?

Во таа насока би рекол дека Дата Мастерс со својот пристап има активна улога во стручното оспособување на кадрите кај нас и тоа гледано од два аспекти. Првично, во комуникација и работата со клиенти ние не застануваме во моментот кога ќе создадеме решение за една компанија, туку и ги обучуваме вработените на компанијата за тие да можат сами да го продолжат процесот. Ние сме им поддршка до моментот додека сме им потребни, но целта на крајот е да ги оспособиме да можат без нас да го користат решението.

Од друга страна, преку Академијата стручно оспособуваме луѓе кои сакаат да ги надградат своите вештини и знаење. Ова влијае на оспособување и проширување на хоризонтите на пазарот, за компаниите да разберат што им е потребно. Колку се зголемува бројот на луѓе со вештини, толку и можностите за имплементација на Data Science се зголемува. Самиот кадар ќе му каже на топ менаџментот во кои делови е потребно подобрување во делот на менаџирање и користење на податоци.

Како пример, има сектори, како што е банкарскиот, каде отворањето на Data Science оддел е неопходно поради природата на работата и проблемите со кои се соочува. Тука најмногу може да се согледа потребата од стручно оспособување на кадри. Оваа потреба за создавање на оддел за Data Science не е потребна секаде. Некаде е потребно само да се креира решение и потоа да се обучат постоечките кадри. Во секој случај зависи од видот на бизнис.

 

За ова да успее, покрај стручно оспособување, влијае и тоа како одделите во една компанија се поделени и соработуваат меѓу себе. Има ли насока за правилна поделба на задачите помеѓу оддели за да се добие максимум од податоците?

Како резултат од имплементирање на решение за податоци, треба да произлезе систем кој на сите нивоа ќе понуди да имаат преглед на состојбата, бидејќи на крајот на денот, секое ниво сака да види различни работи и да извлече заклучоци. Топ менаџментот пример можеби ќе сака да го користи за креирање на стратегија на пазарот, а никако не смее да се потцени важноста на оние кои всушност ги генерираат податоците. Нивната одговорност е голема, бидејќи точноста на податоците е најважна за да се изгради системот. Тие го имаат крајниот контакт со клиентот.

 

Кое е твоето мислење во поглед на тоа како во иднина македонските компании ќе се постават кон податоците и нивното искористување за да го подобрат својот бизнис? 

Секоја македонска компанија која сака да држи чекор со времето, едноставно ќе мора да имплементира Data Science решение во својот бизнис. За тоа ќе треба време, бидејќи е неопходно да се надминат одредени стереотипи што сега постојат, т.е предрасудата дека машината не може да знае повеќе од човекот (кој несомнено има искуство во одредена област). Светските искуства ќе покажат што и ние треба локално да почнеме да правиме. Во иднина ќе се усовршат алатките и секој бизнис ќе може да добие индивидуално автоматизирано решение за самиот да си гради модели и предвидувања. И ќе бидат финансиски поволни за секој бизнис да може да ги искористи.

Не е прашање на „дали“, туку „кога“. А врз тоа ќе влијаат успешните приказни и позитивните искуства кои ќе ја зголемат свесноста кај компаниите. Кај нас локално, многу често се оди на лична препорака на одредено решение, така ќе функционира и понатаму додека не се подигне свеста и Data Science стане дел од секојдневието во работата.

Тука би рекол дека Дата Мастерс како Data Science компанија е пионер на нашиот пазар и придонесува за создавањето на успешни приказни во Македонија.