Интервју со предавачите на единствената верифицирана Data Science Академија

akademija-all-stars-predavaci-4
Катерина (нам си ни веќе позната) ти си дипломиран математичар, Data Scientist во Data Masters и ќе предаваш на првите модули на Data Science Академијата – Вовед во програмирање со Python, и анализа и визуелизација на податоци преку Python. Исто така асистираш и на сите останати модули на оваа Академија. Што може нашите студенти да очекуваат од тебе?

Самите почетоци во академијата и првите чекори во светот на Data Science студентите ќе ги направат токму преку двата споменати модули. Најпрво ќе се зaпознаеме со основите на Python и различните типови на податоци кои ги нуди овој програмски јазик. Со помош на библиотеките ќе видиме како се средуваат и подготвуваат податоците за анализа. Користејќи основи од дескриптивна статистика и библиотеки наменети за визуелизација ќе ги откриеме корелациите помеѓу податоците и студентите ќе можат самостојно да донесуваат значајни заклучоци.

Симон

 

Симон ти си докторанд по применета економија и одличен статистичар. Оваа година повторно покрај обуката за статистичка анализа на податоци во Python, ќе го пренесеш твоето знаење во областа на статистиката и на нашите студенти на Data Science Академијата. Какво беше твоето искуство минатата година, и што очекуваш од овогодинешните студенти?

Јас присуствував на две од обуките пред да започне академијата, додека академијата почна со работа многу подоцна. Меѓутоа, кога ми се јави Филип за соработка и предавања по статистика, ми изгледаше како интересен предлог, а и предавањата по статистика не ми се непозната територија. Многу сум задоволен од тоа како помина минатата академија за Data Science и очекувам дека и оваа втора по ред ќе биде исто така одлична и дека ќе оствариме одлична соработка со студентите и секако ќе навлеземе заедно во светот на Data Science.

Здраво Филип, пред сé дали може да ни се претставиш на кратко?

Моето име е Филип Дончевски и студирам на докторски студии при Факултет за електротехника и информациски технологии(ФЕИТ) во Скопје. Работам како асистент на факултетот  во рамки на институтот за Автоматика и системско инженерство каде, покрај многу други предмети,  предавам вежби на предметот Машинско учење и Операциони истражувања. Поголемиот дел од моите додипломски студии гo поминав натпреварувајќи се на различни натпревари од областа на машинското учење кои беа дел од Kaggle заедницата, но и други како DIDI Research Machine Learning Algorithm Competition. Од овие натпревари успеав да стекнам многу искуство и знаење што потоа резултира и со научен труд.

При крајот на моите студии заминав на шест месечна практична работа во С.Р Германија  во компанијата Robert Bosch GmbH каде работев на развој на иновативни сензори наменети за електрични возила. По практичната работа, моето работно искуство го продолжив во рамките на ФЕИТ каде исто така и бев магистрирал.

Денес моето внимание е насочено во развојот на иновативни решенија во различни области од  индустријата на нашата држава кои резултираа во повеќе проекти, кои дел се поддржани од Фонд за иновации и технолошки развој. Работата во индустријата и науката ми овозможи да научам многу нови работи кои потоа со задоволство ги споделувам со моите студенти на факултетот, а истото задоволство ќе го имам и тоа да го направам во рамките на Data Masters академијата.

Како предавач на нашата академија кој оваа ќе година ќе предава вовед во алгоритми за машинско учење и регресија може ли да ни кажеш малку повеќе околу овој дел и како на најлесен начин би му објаснил на некој што не знае што всушност е Data Science?

Регресија е тип на учење со надзор кое што и ние самите потсвесно го применуваме многу често во секојдневието. Секогаш кога сакаме да направиме определено предвидување на некоја величина, ние тоа го правиме користејќи информации поврзани со неа или со нејзините минати вредности. Типичен пример за ова би било кога предвидуваме колкава редица би имало пред банка во зависност од денот во неделата и периодот од денот. За да го направиме тоа ние го користиме личното искуство за тоа колкава била редицата во минатото за различни периоди и потоа врз основа на минатото ние правиме приближна проценка. Еден модел на регресија би можел да го направи истото, но покрај периодот од денот и неделата замислете да ги земеме предвид: временските услови, температурата, периодот од годината, локацијата на банката, името на компанијата, расположението во дневните вести, итн. На крајот замислете овој модел да може да предвидува за било која банка во било кој град во било кое време. Ваквото количество на податоци би било големо за да биде анализирано од еден човек, но тоа би било инстантно кога е во прашање еден модел на регресија.

Поради тоа моделите на регресија  често се применуваат во областа на предвидување на цената на акциите на берза. Тие можат да процесираат огромно количество на податоци за многу кратко време, а резултатите кои што би ги дале скоро секогаш би биле попрецизни од човековото резонирање.

Наука за податоци или Data Science е  концепт која опфаќа повеќе  области како статистика, машинско учење, анализа на податоци, визуелизација на податоци, рударење на податоци, бази на податоци, а исто така многу значајно е експертското знаење од областа каде што се применува. Целта на науката за податоци е да се извлече информација од огромно неразбирливо податочно множество која што ќе се искористи за носење на продуктивна одлука или предвидување на исходот на некоја величина. Со оглед на тоа што овој концепт е применлив во скоро секоја област, индивидуалното познавање на машинско учење и статистика не е доволно туку тоа секогаш треба да биде поткрепено со експертско знаење од областа каде се применуваат. Поради тоа науката за податоци всушност не е резервирана само за инженерите туку таа е алатка наменета за сите експерти кои сакаат да ја зголемат продуктивноста на работата во нивната област.  

Илија, исто како и Кате ти си нашиот Data Scientist и предавач на нашите обуки за Data Science. Сега кога позади себе имаш неколку обуки и секако многу проекти кажи ни што може да очекуваат од тебе студентите на Академијата?

Откако ќе се запознаат со основите и ќе навлезат во светот на Data Science и Machine Learning и дел од алгоритмите за ML, заедно ќе ја изучиме теоријата на дел од алгоримите за класификација и истата ќе ја примениме на реални примери и реални податоци. По завршување на овој дел/модул од академијата, секој од студентите ќе може да направи свој модел и со негова помош да направи предвидување на одредена категоричка променлива.

На овогодинешната академија ќе предаваш класисфикација. Дали може да ни кажеш како овој дел од машинско учење помага во целосното работење на еден data scientist?

Да, оваа година ќе бидам дел од тимот што ќе предава на академијата и ќе го предавам делот на алгормитми за машинско учење кои служат за решавање на класификациски проблеми. Алгортмите за класификација помагаат за предвидување на одредена категорија. На пример со помош на овие алгоритми вработен во банкарскиот сектор може да предвиди дали клиент од банката ќе биде активен наредниот месец или не врз база на одредени атрибути на самиот клиент и врз база однесувањето на истиот тој клиент.

Овие алгоритми може да се искористат во многу домени од кои јас лично би ја издвоил медицината како една од најбитните. Со помош на класификацијата е возможна рана детекција на одредени болести и нивно навремено превенирање.

Мартина, мислам дека веќе на сите си им добро позната како основачот на оваа Академија во Македонија па затоа само ќе те прашаме за модулите кои ќе ги водиш ти, односно NLP и WEB Scrapping. NLP е една од твоите специјалности, кажи ни нешто повеќе за тоа и зошто овој модул е неопходен за еден Data Scientist?

Секоја компанија во Македонија и регионот поседува огромно количество на текстуални податоци без разлика дали се тоа одговори на анкети, податоци од фактури, пофалби или поплаки од клиенти, пораки на социјални медиуми па дури и вашето резиме. Информациите извлечени од истите се круцијални за разбирањата на одредени бизнис процеси како и разбирање на сентиментот на истите. Во NLP модулот ќе се изучува обработката на секаков вид на текстуални податци, со цел истите да се употребат за одговор на одредено прашање. Ќе ви дадам пример од нашето секојдневие: со користење на NLP алгоритми Google, Facebook или LinkedIn прават sentiment analysis со цел да го разберат човековото однесување и пораката кое истото ја испраќа. По изучувањето на овој модул нашите студенти ќе можат да одговараат на своите прашања и предизвици преку текстуални податоци.

Стојанчо, како најнова едиција на нашиот тим од предавачи, ќе ве замолам да ни се претставите на кратко 🙂

Пасиониран љубител на математиката, дипломиран машински и софтвер инженер на факултетите во Скопје, и татко на две деца. Веќе 27 години работам на развој на софтвер, а професионалната надградба во последните 9 години, во 90% ја посветив на машинското учење и вештачката интелигенција.

Вие се декларирате како ентузијаст за машинско учење и вештачка интелигенција. Од каде потекнува овој ваш интерес?

Од секогаш сум сакал математика и програмирање, до ниво на хоби и пасија. Машинското учење,уште кога подлабоко се запознав со него, пред 9 години, претставуваше идеален спој од двете дисциплини. Оттогаш, најголемиот дел од мојот професионален напредок е поврзан со него, и секојдневно минувам барем по еден саат читајќи за најновите достигнувања, а кога времето ми дозволува, работам и на свои мали проекти како хоби.

Вие ќе предавате нешто доста интересно на нашата Академија а тоа е вовед во deep learning и невронски мрежи. Може ли да ни кажете нешто повеќе околку тоа?

Deep learning е најновиот тренд во вештачката инлигенција, кој и не е веќе така нов. Започна пред неколку години, со конволуциски и рекурентни мрежи кои најдоа реална и лесно достапна примена во области кои порано беа резервирани за супер-компјутери, како што се препознавање на слики и говор. Сето тоа беше овозможено со развојот на процесорите и графичките картички кои станаа релативно лесно достапен медиум за изведување на потребните процесирања. Се на се, благодарејќи на гејмерите ( gamers, respect :D), последните неколку години беа возбудливи за следење. А вистински интересните работи допрва следат.

Програмата за Академијата и дополнителни информации може да прочитате ТУКА.