Data Analytics е разликата меѓу победа и пораз во Формула 1

Data Analytics во Формула 1

Сите кои проследиле еден Гран при викенд можат да потврдат дека Формула 1 (Ф1) не е само обичен спорт. Станува збор за глобален феномен кој поддржува мулти-милионска индустрија, заснована на најнапредни технологии кои денес се достапни во светот. Технологии за иновација на материјали, аеродинамички дизајни и креација на најсофистицирани хибридни мотори.

Моментот на иновација не изостанува и во полето на data analytics, data science и machine learning. Токму анализата на огромните количества на податоци кои се генерираат за време на едно Гран при го прави ова натпреварување едно од најатрактивните во светот, а трките секој натпреварувачки викенд ги следат милиони луѓе.

Од друга страна, без анализата на податоци во реално време, Ф1 која ја знаеме денес би била многу поразлична. Стотици data points во сите клучни делови од болидот се генерираат секоја секунда. Во меѓувреме, тимските инженери и аналитичари се обидуваат да извлечат што е можно повеќе информации и да ги претворат во вистински следни чекори кои ќе го доведат тимот до победа.

Big data

За развивањето на конкурентен болид, неопходно е тимовите во чекор да ги следат сите технолошки иновации. Споредено со едноставното мерење на време на стоперка и анализа на 12 data points во 1990-тите години од минатиот век, денес болидите за време на еден Гран при викенд генерираат огромни бази на податоци и користат најнапредни методи за data analytics.

Формула 1 отсекогаш била индустрија која се базира на податоци. Само во последната декада, симулациите и визуелизацијата на податоци достигнаа нивоа на софистицираност и брзина кои драстично влијаеа на резултатите и перформансите на тимовите.

Денес, болидите имаат од 150 до 300 сензори кои генерираат милиони data points. Обработката на овие количества на податоци е тешка задача и неопходни се најнапредните технологии за собирање на податоци, безбедно складирање и надворешна комуникација (главно со фабриките и инженерските сектори). Дополнително, компјутерската моќ која е неопходна за анализирање на податоците во реално време констатно се зголемува. Токму затоа, различни тимови склучуваат партнерства со компании специјализирани за cloud computing, data analytics и data science.

Згора на ова, официјалните бродкастери на Ф1, во соработка со Amazon Web Services (AWS), обезбедуваат стриминг на податоци од болидите за време на трките, а истите автоматски се обработуваат и визуелизираат, со цел гледачите да добијат подетални информации за тоа што се случува на патеката. Тимовите ги користат тие податоци за да го следат и анализираат перформансот на возачите, а во последно време речиси сите тимови соработуваат и се потпираат на партнерства со технолошки провајдери кои во пракса ги покажуваат најнапредните технологии за преработка и визуелизација на податоци.

Успех базиран на податоци

Доказ дека и навидум најситните подобрувања може да придонесат до подобрување на перформансите е партнерството на тимот „Мекларен“ со сотфтверската компанија Alteryx. Американскиот технолошки гигант му овозможува на британскиот тим пристап до најнапредни алатки за data science и data analysis. Станува збор за многу повеќе од обично партнерство: алатките на Alteryx се клучни за речиси сите активности кои ги има „Мекларен“, па дури и оние во административниот дел на тимот.   

– Формула 1 како спорт е неверојатно богат со податоци. Иако се натпреваруваме како тркачки тим, суштината на нашиот бизнис е технологијата – вели Ден Киворт, директор за бизнис и технологија во „Мекларен“. 

Болидите во Ф1 содржат околу 80.000 различни компоненти и според Киворт, неопходно е 90% од тие компоненти барем еднаш да се променат во текот на сезоната. Анализата на податоците поврзана со толку различни компоненти му овозможува на тимот да направи корелација на предностите во перформансот, на база и на изминати трки и на симулации. Добиените резултати можат да бидат корисни и на патеката, за време на трките, но се креираат и ефикасни решенија за компликуваното производство и одржување на синџирите за снабдување. 

За време на сезоната во 2021 година, тимовите се натпреваруваа за победа на 23 трки ширум Европа, Блискиот исток, Југозападна Азија и Северна Америка. Кулминацијата на викендите е трката која секогаш се одржува во недела, но секој викенд вклучува повеќе тренинг и квалификациски рунди. Тоа придонесува голема потрошувачка на сите елементи и делови на софистицираниот болид.

Исто така, значи и генерирање на многу податоци. 

Возилата имаат 300 телеметарски центри кои генерираат 100.000 параметри на информации. Тоа подразбира сè – од нивоата на истрошеност на моторот до количеството на гориво, температурата на пневматиците и нивоата на притисок. Овие телеметарски центри може да произведат информации дури и за тоа „колку гравитациска сила (g-force) чувстуваат возачите кога влегуваат во одреден свиок“.  

Во реално време, овие податоци се користат за анализа во гаражата, како и во делот на тимот кој управува со трката на возачите, каде седат членови од раководството и стратезите на тимот. Севкупно земено, за еден Ф1 викенд тимовите генерираат 1.5 терабајти на податоци. 

– Станува збор за податоци генерирани во реално време. Но, исто така ние спроведуваме повеќе од 300 милиони симулации за да му овозможиме на нашиот тим кој ја гради стратегијата речиси перфектно да го предвиди секое можно сценарио кое би се случило за време на трката – вели Киворт. 

Тимовите можат да направат одредени промени за да се адаптираат на условите на патеката, на временските услови или да ги базираат своите чекори на предупредувања кои се добиваат со анализа на податоците. Сите други анализи се случуваат по завршувањето на трката.

Предвидувања кои овозможуваат клучна предност

Можноста секој тим успешно да ги предвиди температурните промени на патеката или воздухот пред и за време на трката може да значи победа или пораз тој ден. За овие предвидувања да бидат „хируршки“ точни, тимот на „Мекларен“ користи automated time series модели, податоци кои подоцна можат да им овозможат адаптација на стратегијата во трката и превенирање на деградација на пневматиците.

Во изјава за Datarobot.com, директорот на стратегија и спортски директор на „Мекларен“, Ренди Синг открива како се користат податоците на денот на трката. 

– Кога се очекува трката да биде сува, тогаш главните податоци кои ги користиме се поврзани со температурите кои влијаат врз ладењето на гумите, притисокот и сл, но и податоци за ветрот кој на друг начин влијае врз болидот. Кога станува збор за долгорочни стратегии, податоците за временските услови се користат за да процениме како гумите би се однесувале на одредени температури, а се носат одлуки и во однос на аеродинамиката и какви типови на спојлери и крила ќе се користат. Сите овие податоци ги анализираат различни луѓе, инженерите за трка, инженери за аеродинамика и статистичари – вели Синг. 

Голем број на луѓе кои работат со податоци се вљубени во Ф1, токму поради тоа што ова натпреварување е врвот на инженерските и технолошките достигнувања. Синг посочува дека анализите на огромниот број на податоци, како и нано-промените кои се прават за да се добијат по неколку илјадитинки на патеката е главната прична за тоа. 

Шампионски симулации

Пред почетокот на сезоната во 2021 година, „Ред Бул Рејсинг“ објави соработка со Oracle, технолошки гигант за кој велат дека значително им помогнал при „донесување на одлуки за денот на трката“ и директно асистирале во освојувањете на титулата на актуелниот шампион Макс Ферстапен. 

Заедничката соработка суштински го променила начинот на кој во„Ред Бул“ размислуваат за стратегијата, особено при подготовката за патеката во Мајами, која за првпат оваа година беше дел од натпреварувачкиот календар во Ф1. Еден од системите кои го користат е наречен „симулација Монте Карло“ (Monte Carlo simulation), а челниците на тимот го опишуваат како „алгоритам кој ги зема во предвид сите познати варијабли – работи како колку брзо може да се заврши еден круг на одреден тип на пневматик или колку долго одреден тип на пневматик ќе издржи во одредени услови“.

– Ги внесуваме сите познати варијабли, кои се извлечени од податоци кои ги добиваме од тренинзите во петок и сабота за време на тренинг-сесиите. Сите овие точки на податоци се важни кога првпат возиме некоја патека, поради тоа што немаме историски податоци за референца. Гледаме што е ново и карактеристично за оваа патека и што податоците нѝ кажуваат. Потоа, ја користиме оваа симулација (Монте Карло) за да добиеме информации за милиони различни можни исходи. Тоа ни овозможува да добиеме детали за сите потенцијални ситуации за време на трката и по можност да дознаеме како да бидеме најбрзи. Подетално, во кои кругови да влеземе во пит-стоп, на каков тип на гуми да ја започнеме трката, кога да ги правиме промените на пневматиците и слично – вели Зои Чилтон, одговорна за партнерства во „Ред Бул Рејсинг“. 

Таа додава дека можноста за спроведување на симулации е многу корисна за тимот и му овозможува пристап до моќна инфраструктура која е многу практична за време на натпреварувачкиот викенд.

Data for the Win

Дизајнирањето, градењето и натпреварувањето во Ф1 е мултидисциплинарен процес со огромен број на софистицирани процеси и податоците се исклучително важни. Неуспешното анализирање или пропустот да се анализира и најмал дел од податоците може да се гледа како испуштена можност за напредок. 

Логично е, луѓето кога гледаат Ф1 да се фокусираат на возачот. Некои веруваат дека резултатите не зависат само од возачот, туку многу важен е и болидот. Но, на крајот од приказната многумина треба да разберат дека анализата на податоците ја прави главната, можеби и клучната разлика меѓу местата на победничкиот пиедестал.