ltnews.lt

Lietuvos naujienos iš pirmų lūpų

2021:04:13 10:40

Kada į Lietuvą ateis didžiųjų duomenų ir dirbtinio intelekto revoliucija?

Dirbtinis intelektas (DI) – technologijų ateitis, o jo variklis – duomenys. Kaip Lietuvai sekasi išnaudoti duomenų potencialą dirbtinio intelekto pažangai? Kokias duomenų valdymo spragas išryškino pandemija? Kodėl įmones Lietuvoje ištinka duomenų vagysčių skandalai ir kaip jų išvengti? Apie tai – MITA iniciatyvos AI BOOST tinklalaidėje pasakoja „Exacaster“ įmonės vadovas Šarūnas Chomentauskas. 

Inovacijas skatina akistata su problema 

Duomenų analitikos paslaugas teikiančios įmonės „Exacaster“ vadovas Š. Chomentauskas teigia, kad 2010 metais, kai pradėjo veiklą DI srityje,  šios technologijos nebuvo paplitusios ar žinomos plačiajai visuomenei ir tebuvo akademinių straipsnių raktažodis, o pavadinimas „didieji duomenys“ (angl. big data) dar neegzistavo. 2015 metais nemažai įmonių pradėjo domėtis DI technologijomis ir prasidėjo didžiųjų duomenų revoliucija ir jų diegimas. Tačiau Lietuvoje tai vyksta itin lėtai.

„Tarp to ką šiandien leidžia technologijos ir tarp to, ką naudoja įmonės vis dar egzistuoja didžiulė praraja. Jeigu Lietuvoje peržengsime penkiasdešimt didžiausių įmonių topą ir leisimės toliau sąraše, pamatysime, kad situacija praktiškai nepasikeitė, naujų sprendimų nėra įdiegta“, – pasakoja įmonės „Exacaster“ vadovas.

Jis pabrėžia, kad naujų, su duomenimis susijusių sprendimų poreikis didėja, o problemos aštrėja– duomenų kiekiai vis didėja, sistemos dar labiau paseno, atsirado privatumo iššūkių ir yra jaučiamas vis didesnis specialistų stygius. Pasak, Š. Chomentausko, įmones nuo naujų technologijų diegimo atbaido įvairios priežastys – didelių investicijų poreikis, radikalių pokyčių baimė arba tiesiog poreikio nesuvokimas.

Pašnekovas pabrėžia, kad neretai inovatyvūs sprendimai ar apsisprendimas taikyti kažkokią naują technologiją gimsta akis į akį susidūrus su sunkiai išsprendžiama problema. Taip atsitiko ir jo atveju, kai dirbant  telekomunikacijų bendrovėje atsirado poreikis analizuoti didžiulius duomenų kiekius rinkodaros ar klientų aptarnavimo tikslais.

„Tam, kad gautume atsakymus neretai tekdavo užsidaryti kabinete savaitei, atšaukti skambučius, susitikimus ir atsivertus „Excel“ lentelę eiti per kiekvieną eilutę ir ją peržiūrint ieškoti įvairių hipotezių. Akivaizdu, tai nebuvo labai efektyvu ir natūraliai kildavo mintis, kad turi būti geresnis būdas visa tai išspręsti. Tuomet atsirado įvairios mokslinės publikacijos apie algoritmus, leidžiančius spręsti tokio pobūdžio problemas, mes pabandėme savo sprendimus diegti, šis tas gavosi ir nusprendėme, kad verta pabandyti rimčiau“, – pirmuosius žingsnius DI srityje prisimena Š. Chomentauskas.

Nuo teisės aktų iki duomenų valdymo pokyčių 

Anot Š. Chomentausko, duomenų valdymo pokyčius Europoje paskatino atsiradęs Bendrasis duomenų apsaugos reglamentas (trump. BDAR), kuris įmones padalijo į dvi stovyklas: tuos, kurie iš tikrųjų pradėjo gilintis į esmę ir diegti pokyčius ir tuos, kurie tiesiog atliko formalumus.

„Vienur teisininkai atliko savo darbą, atsirado privatumo politikos, sausainėlių  (angl. – cookies) rinkimo sutikimai, bet fiziniame pasaulyje niekas nepasikeitė. Kitos įmonės iš tiesų bandė spręsti problemą ir dabar yra toje būsenoje, kai jau supranta reikalingų pokyčių mąstą. Netrumpas laiko tarpas praėjo nuo pokyčių įsigalėjimo ir tik dabar pradedama suprasti ką reiškia terminas „privacy by design“ – veikla turi būti vykdoma, kad kurtų privatumą, “ – sako Š. Chomentauskas.

Pašnekovo teigimu, neseniai įvykęs „City Bee“ atvejis – puiki  iliustracija to, kodėl iš tikrųjų reikia spręsti duomenų apsaugos problemą. Anot Š. Chomentausko, šią problemą galima spręsti įmonėse diegiant „privatus nuo pat pradžių“ filosofiją. Privaloma įsivertinti kuriuos duomenis kaupiant atsiranda didžiausios rizikos. Taip pat reikia pagalvoti ir apie tai, ką daryti, kad tiems duomenims atsiradus internete, jie taptų beverčiais tiems, kas juos pavogė.

„Čia turime aibę techninių sprendimų – pradedant nuo tokenizavimo – kai  nėra asmens kodų, o tik raidžių kratiniai, tai pat šifravimo algoritmai, duomenų paskirstymas per skirtingas bazes ir t.t.“ – galimus sprendimus vardijo Š. Chomentauskas.

Tokie sprendimai, anot pašnekovo, reikalauja ne tik finansinių investicijų, bet ir laiko bei personalo resursų. BDAR taikymo įvairiuose veiklos lygmenyse įsisavinimui prireikia laiko – tai sunkus procesas reikalaujantis praktikos bei supratimo kokio galutinio rezultato siekiama.

Duomenų atvėrimas ir pandemijos išryškintos spragos

Nors ir viešajame sektoriuje netrūksta įvairių iniciatyvų bei diskusijų apie duomenų valdymą bei panaudojimą, anot Š. Chomentausko, globaliame kontekste Lietuva duomenų valdymo srityje vis dar atsilieka ir savo potencialo neišnaudoja: „Mes domimės šita tema, bet realios patirties yra labai mažai. Daugelis  kalbančiųjų šia tema neturi praktinio taikymo patirties. Dėl to pas mus yra labai lėtas progresas. Sakyčiau pastarąjį penkmetį, kaip valstybė, mes pramiegojome“.

Pašnekovas pasakoja, jog būtent vykstanti pandemija atskleidė duomenų valdymo spragas, ji akivaizdžiai parodė, kad tik ten, kur skiriame dėmesį esame susitvarkę, o sritys kurios lyg šiolei nebuvo svarbios – visiškai apleistos. Ne ką mažiau iššūkių sukėlė ir pasiruošimo, teisinės bazės nebuvimas bei neaiškios finansavimo galimybės.

Anot Š. Chomentausko tik prasidėjus pirmajam karantinui buvo labai aiškios galimybės matuoti žmonių mobilumo lygi, tačiau praktikoje buvo susidurta su jau minėtais iššūkiais, o atėjus antrajai bangai bei vakcinacijai, ši tema buvo pamiršta.

„Gali būti kad šios pamokos taip ir neišmoksime. O kas bus jei bus kita pandemija? Juk galima būtų išmokti šio to ir iš šios situacijos – suprasti, kad duomenys yra instrumentas su kuriuo dirbti reikia pradėti iš anksto. Duomenis reikia kaupti, tvarkyti ir juos pasiimti tuomet, kai jų prisireikia. Nesiruošimas yra trumparegiškas ir nevisuomeniškas požiūris tiek žiūrint iš valstybinės, tiek iš verslo pusės“, –   teigia  Š. Chomentauskas.

Duomenų analitikos paslaugas teikiančios įmonės vadovas, judėjimui į priekį ragina atverti valstybinius duomenis: „Duomenų atvėrimas sukuria daug galimybių. Duomenys ir yra dirbtinis intelektas, nes dirbtinis intelektas tėra ne kas kita, kaip tų duomenų kompiliatas – jis juos sukaupia, apibendrina ir sudeda į algoritmą. Be duomenų algoritmo nėra, tad neperduodami duomenų, mes negalime judėti į priekį“.

Pašnekovo teigimu atverti duomenis galima ir nesukeliant chaoso ar papildomų rizikų – atverti duomenis siūloma ne apie žmones, o apie daiktus, prietaisus, žaliavinius srautus. Kaip pavyzdį Š. Chomentauskas pateikia institucijų internetinių puslapių lankomumo statistiką, kurią atvėrus būtų galima sužinoti kiek kainuoja vieno lankytojo apsilankymas ir ar tai efektyvu. Pašnekovas pabrėžia, kad valstybiniai duomenys yra jau skurti ir už juos sumokėję esame visi, tad ši informacija turi būti vieša.

Technologijos siūlo sprendimus 

„Exacaster“ vadovas pažymi, kad darbą su duomenimis dirbtinis intelektas pakeitė iš esmės, o kai kuriose srityse matomas ypatingai didelis proveržis. Šiandien jau turime tokias technologijas ir algoritmus, kurie patys savarankiškai veikdami bei analizuodami, gali mums pateikti savo sukurtus sprendimus.

„Atsirado naujos rūšies algoritmai, vienas jų – „reinforcement learning“. Šis algoritmas neprašo, kad  jam pasiūlytum visus įmanomus variantus, jis pats tyrinėja aplinką, eksperimentuoja ir randa geriausią rezultatą.  Tik, deja, labai mažai įmonių tiek automatizavusios savo veiklą, kad tokius algoritmus būtų galima pilnai panaudoti“ – apie pastarųjų metų virsmus pasakoja Š. Chomentauskas. Pasak pašnekovo, tokios sritys kaip vaizdo, garso atpažinimas, teksto generavimas – sparčiai veržiasi į priekį.

„Yra tokia algoritmų įmonė „OPEN AI kur 2019 metais jie padarė neuroninį tinklą su 1,5 mlrd. parametrų, 2020 metais tinklas jau turėjo 175 mlrd. parametrų. Jie stipriai nekeitė algoritmo esmės, bet dėmesį skyrė techninėms problemoms. Rezultatai stulbinantys – algoritmas jau moka programuoti „Python“ kalba, rašyti rišlų Šekspyro tekstą ir laisvai pagal bet kokią temą sugeneruoti 50 tūkst. žodžių esę“ – geriausiais pavyzdžiais DI proveržyje dalijasi „Exacaster“ vadovas.

Tačiau tenka paminėti, kad toks malonumas nėra pigus – remiantis skirtingais šaltiniais, šio algoritmo mokymo kaina siekia 5-12 mln. dolerių. Kitą, labai panašų pokytį, vykstantį su algoritmais, pašnekovas pamini algoritmo tobulinimą. Švaistūniškus, daug elektros sunaudojančius bei neefektyviai informacijos nepernaudojančius algoritmus šiuo metu bandoma tobulinti taip, kad jie reikalautų mažiau mokymosi arba mažiau sąlygų ir pagalbos.

Viso pokalbio klausykite čia.


Šaltinis: MITA