Selle asemel, et teha korduvaid kokkuvõtteid ja kokkuvõtete kokkuvõtteid, peaks kõrgepalgaline spetsialist täiendama olemasolevaid tööriistu, valima andmetele läbimõeldud referentsväärtuseid ja langetama kaalutlusotsuseid, kirjutab arvamuskonkursile Edukas Eesti saadetid artiklis arendusspetsialist Kaur Saarepuu.
- Kaur Saarepuu Foto: erakogu
Milles on probleem?
1. Kõrgelt haritud spetsialist koondab iga nädal 150 failist info ühte faili, arvutused piirduvad põhikoolis õpituga, ja saadab ülevaate koos kolme kirjeldava lausega ülemusele. Millist oskust ta selleks kõrgkoolis omandas? Kui kiiresti olemasolev töö spetsialisti ära tüütab ja ta uut otsima asub?
2. Hoone mudelist on vaja kopeerida info tootmistarkvarasse: materjalid viia kokku laoseisuga, defineerida vajalikud operatsioonid õigesse lahtrisse ning reastada need vaikimisi järjestusse. Millised loetletud ülesannetest nõuavad tehnoloogiaalast haridust ja mille võiks selgeks õpetada praktikandile?
3. Kui insener teeb tugevusarvutusi, siis millist osa ta tööst ei oskaks teha assistent? Kas sisestada arvutust programmi või valida sobivat arvutust, mida on vaja teha?
Kõrgelt haritud töötajal tuleb tihti teha korduvaid ning sekretäritöölaadseid ülesandeid. Intelligentne osa tööst on oskus teada, mida teha, ning tõeliselt intelligentne osa on mõista, mille saaks mõningase korraldamisega jätta tegemata või lasta arvutil teha enda eest.
Targad töökohad, mida nii ettevõtjad kui ka poliitikud ühest suust rõhutavad, pole üldsegi nii targad, kui neist rutiini pidevalt välja ei tõrjuta. Conrad Wolfram, kelle kaasaegset matemaatikakursust on ka Eesti koolides piloteeritud, on tabavalt öelnud, et ärme tee enda lastest kolmanda järgu kalkulaatoreid, vaid esimese järgu matemaatikud. Laiendaksin seda mõtet, et ärme ole ülekvalifitseeritud sekretärid, vaid tipptasemel spetsialistid. Alati võib muidugi palgata rutiinsete ülesannete jaoks ka sekretäre, kes sisestavadki andmeid ja kontrollivad vigu, aga see on nagu kodu koristades asjade keldrisse viimine: „Kunagi hiljem mõtlen, mis selle asjaga pihta hakkan ja kas seda üldse vajan“. Ja selliselt kuhjubki kultuurikiht lihtsatest ülesannetest, mis hiljem nõuavad protseduure ja standardiseerimist, et neist võitu saada.
Unistada võiks utoopiast, kus hommikul vajutame arvutil start-nuppu ja tööd teeme siis, kui on vaja inimese oskuseid: mõelda loovalt, teha väärtusotsuseid, kombineerida kiirelt uusi kontseptsioone või valida arengusuundi.
Kuidas probleemi raamistada?
Nii insener, projektijuht kui ka analüütik teevad sarnast tööd: koguvad infot, töötlevad seda ning kommunikeerivad edasi. Tööriistad ning vajalikud kompetentsid on kahtlemata erinevad, kuid töö iseloom on metatasandil sarnane. Selle mõistmine võimaldab meil käsitleda tarka tööd kui andmetöötlust, sellele omaste probleemidega. Muutmaks tarka tööd targemaks, on kõigepealt vaja paradigma muutust. Tuleb eristada nimetatud kolme osa: info kogumist, töötlemist ja kommunikeerimist. Sel juhul saab ühe andmete sisestusega genereerida vajadusel ka 100 raportit ning on võimalik kultuurikihi kuhjumisest võitu saada. Tavaliselt on aga kõik kolm üheks „tee ülevaade/raport/kokkuvõte/juhend/tabel“ ülesandeks kokku põimitud ning iga raport tuleb koostada eraldi.
Mõned üldised põhimõtted, millest andmetega töötamisel tuleks lähtuda:
Andmete kogumine ja hoiustamine: Mantra andmete kogumisel on lihtne: andmeid tuleb koguda üks kord. Kõige parem, kui neid õnnestub koguda protsessi käigus automaatselt ja selliselt, et neid oleks võimalik hiljem vähese vaevaga teiste andmetega kokku panna. Näiteks mitme Exceli dokumendi loomise asemel võiks olla koonddokument, kus ühel lehel sisestatud andmetest genereeritakse eeldefineeritud raport teisele lehele. Tõsisemate lahenduste korral oleks vaja andmebaasi. Kui andmebaasi loomine kõlab hirmutavalt, siis tihti pole uut andmebaasi vajagi, sest näiteks raamatupidamistarkvara näol on see ettevõttel juba olemas. Tasuks uurida olemasolevatest rakendustest, kas sinna on võimalik ka muud infot koguda.
Andmete kokkupanemine ning mudeldamine: Kui andmed on kogutud selliselt, et nende vahel on ühenduskohad olemas, siis on andmeid kokku saada küllaltki triviaalne ülesanne. Ühine veerg tabelitel, millest ühes väärtused ei kordu, on piisav, et kaks tabelit kokku viia. Kui vajalikud andmed on kokku pandud, on mantra lihtne: „Filtreeri, sorteeri, grupeeri“. Nende kolme tegevuse eri järjekorras kordamisest annab sisuliselt kokku panna igasuguse andmetöötluse.
Andmete visualiseerimine ja kommunikeerimine: Suur osa kasutajaliidese disainist kätkeb tänapäeval endast info visuaalset grupeerimist, et ilma selgitusteta oleks võimalik hoomata, milline info moodustab terviku. Mida implitsiitsemalt seda teha osatakse, seda uhkem.
Andmete visualiseerimisel on ka oluline see, kuidas inimene infost aru saab. Kõige olulisem sealjuures on andmete terviklikkus (data integrity), mille vastu visuaalses keeles palju eksitakse. Küllap on kõigile tuttavad võrdlused poliitreklaamides, kus andmetest on välja filtreeritud järeldusi mitte toetavad andmed. Andma peaks võimalikult mitmekülgse ülevaate teemast, mitte lugejat ühes võimalikus järelduses veenma. Valdkonna pioneer Edward Tufte on oma töödes välja toonud mõttelise tindi ja info suhte (data-to-ink ratio). See tähendab, et tasuks mõelda, kas täiendav detail graafiku või tabeli puhul lisab infot või on kõigest müra.
Teiseks lähtepunktiks andmete visualiseerimisel on psühholoogia. Eelkõige selles, kuidas inimene hindab vastuvõetavat infot. Näiteks ei ole soovitav kasutada inimese töömälust ehk neljast ühikust suuremaid jaotusi. Olukorras, kus graafikul on vaja kujutada 12 vanusegruppi, võib lugejale lihtsustamiseks need pisut suuremate vahede jätmisega visuaalselt grupeerida kolmeks: neli noorte, neli keskmise ja neli vanemate inimeste vanusegruppi. Andmete terviklikkusest ja psühholoogiast korraga lähtudes kerkib esile ka põhiline andmetöötluse keerukus: kas teha pigem mõnevõrra kallutatud, kuid üldisemalt sõnastatud järeldusi või mitte nii üheseid järeldusi, mis ei oleks kallutatud? (bias vs. variance tradeoff).
Kas tehisintellekt kaotab probleemid?
Lihtsustatult öeldes on kolme sorti tehisintellekti, millest esimesed kaks ei olegi niivõrd intellektid, kui et lihtsalt masinaga lahenduste otsimine ehk masinõpe.
Esimene liik (supervised learning) on seoste väljaarvutamine. Inimene loob mudeli, mis näitab asjadevahelist seost. Näiteks kui temperatuur tõuseb õues kolm kraadi ning õhuniiskus langeb 10%, siis värv kuivab 20 minutit kiiremini. Neid ülesandeid on inimesed osanud juba väga pikalt lahendada nii arvutiga kui ka käsitsi, masinõpe tähendab vaid arvuti abil sobivaima mudeli otsimist.
Teine liik (unsupervised learning) on samuti inimese jaoks võrdlemisi triviaalne: kategoriseerida andmeid. Nagu lasteaialaps, kes pakub, et kui loomal on rohkem ühist viie kassiga kui kümne koeraga, siis on tegemist tõenäoliselt kassiga. Parema ärisoonega põnn võib isegi eristada, et kui mõned kliendid tellivad iga nädal ja teised kord aastas, siis need kaks on erinevat „tõugu“ ja neid võiks ka erinevalt kohelda.
Kolmas liik (reinforcement learning) – kõige keerulisem, aga samuti mitte midagi ulmekirjandusest – tagasiside-õppimise-mudelid. Kui kaotada ära segadust tekitav valdkonnaspetsiifiline žargoon, võiks ka koerte treenerid leida tööd andmeteadlasena. Ülesanne on tuttav: mudelile, nagu ka koerale, ei saa öelda, mida täpselt teha. Saab vaid anda kommi, kui ta õigesti käitub, ning jätta komm andmata, kui tulemus ei olnud see, mida soovisid. Sarnaselt koeraga, kes kordab seda, mille eest sai kommi, saavad ka masinõppe mudelis need mustrid suurema kaalu, mis kordusid heade soorituste ajal.
Tähtsaim on andmete kogumise adekvaatsus
Kuigi see viimane kolmest on see, millest masinõppe puhul põhiliselt räägitakse ning mis tekitab andmeteadlastes elevust, siis oleks minu mõte keskenduda eelkõige esimesele kahele. Enamiku ettevõtete analüüsivajadus on sellises punktis, kus need saaks rahuldatud ideaalselt ka Exceliga. Minna tagasiside-õppimis-mudelite juurde olukorras, kus ei mõisteta isegi liigendtabelite võimsust, on umbes sama rentaabel kui käia helikopteriga paari kilomeetri kaugusel tööl – saab küll, aga jalgrattaga on lihtsam. Et riiklike algatustega ühte laulda, siis nimetame kahte esimest liiki kratiks. (
www.kratid.ee)
Need, kes masinõppega tegelevad, ütlevad kui ühest suust, et võidujooks käib eelkõige selle peale, kes suudab kõige paremini adekvaatseid andmeid koguda, mitte selle peale, kes suudab kõige keerukama mudeli ehitada. Masinõppe mudel, nagu ülejäänud andmetöötlus, ei ole kunagi parem andmestikust, mille baasil see on tehtud. Järelikult on kõigepealt vaja ära lahendada eelnevalt välja toodud probleemid andmete kogumise ja visualiseerimisega, leida mõte, mida nende andmetega teha saaks, ning alles siis otsida võimalusi masinõppest kasu lõigata.
Rutiin targast tööst välja, fookus andmete kogumisele – kuidas?
Üks variant on soetada uus tarkvara. Tarkvara ei ole samas kunagi tehtud ühe ettevõtte vajadusi silmas pidades ning selle juurutamine ei pruugi olla triviaalne: lisanduvad koolitus-, kohandamis- ja hoolduskulud. Ma ei vastandaks küll tarkvara soetamist tööprotsesside arendamisele, aga tihti vajadus uue tarkvara järele puudub – vaja on mõelda väiksemalt – mida sa teeksid siis, kui probleemile tuleb leida lahendus kohe, mitte paari kuuga?
Kaaluda võiks näiteks käsurea ja VBA script’e info korrastamiseks, liigendtabeleid andmete paindlikuks visualiseerimiseks, Zapieri või Flow’d olemasolevate programmide liidestamiseks, meilirakenduse reegleid kliendisuhete haldamiseks, andmete pärimist andmebaasist nende korduvalt raamatupidamisprogrammist salvestamise asemel, vabavaralisi rakendusi, kratte ja muid väikseid tööriistu, mis teevad ühte asja aga hästi. Neid lahendusi on mitu, mida enne tarkvara soetamist võiks proovida, kuid inimesel, kellel puuduvad tehnilised oskused, puudub ka loomingulisus nende lahenduste peale tulemiseks.
Kolm formaati loomingulisuse kasvatamiseks
Küberkaitse õppus, kus vastaseks on ajaraiskamine. 4-5 päeva kestvale õppusele koguneks ettevõtete arendusmeeskonnad. Esimesed päevad kuluks väljamõeldud ettevõtte olukorraga kurssi viimiseks ja algavaks mänguks ettevalmistumiseks. Seejärel algaks simulatsioon, kus piiratud aja tingimustes oleks vaja leida lahendused probleemidele, mis kerkivad üles kirjeldatud ettevõtte äritegevuse käigus ning tähendavad targale töötajale lisakoormust rumalate ülesannete näol. Sarnaselt päris küberkaitse õppusega hinnataks lisaks probleemide lahendamisele ka näiteks lahenduste kommunikeerimist (töötajatele), tekke põhjuste otsimist ning tulevikus analoogsete probleemide ennetamise oskust.
Häkaton, kus ei looda uusi telefoni- või veebirakendusi, vaid leitakse hulganisti igapäevatöö optimeerimisi. Lahendamist vajavad probleemid oleksid kitsalt defineeritud ja piisavalt väikesed, et loodav lahendus ei vajaks pärast üritust enam lisatööd. Katsetada võiks eri keerukusega probleeme: näiteks üritusi, kus ühel meeskonnal oleks reaalne lahendada ürituse käigus kümme probleemi, ja üritusi, mis eeldaks maksimaalselt paari-kolme probleemi lahendamist. Probleemid välja pakkunud ettevõte võiks hinnata kokku hoitavat summat ja panna selle põhjal välja auhinnafondi iga probleemi lahenduse eest.
Tööprotsesside talgud, kus koristatakse raiskavaid töövõtteid. Sellel formaadil on mitu väljundit. Piirkondlikud arenduskeskused võiks näiteks korraldada tehniliste oskuste töötubasid. Talgutel osalevad ettevõtted võiksid ka majasiseselt korraldada nõupidamisi oma probleemidele kiirete lahenduste leidmiseks või otsustavalt ära lahendada mõne pikalt edasi lükatud probleemi. IT- ja analüüsiettevõtete jaoks võiks see olla nädal, kus pakutakse tasuta know-how’d mõnele olemasolevale või potentsiaalsele kliendile väikeste probleemide lahendamiseks.
Selle käigus saaks koolitada kliente targemalt ja agiilsemalt IT arendusi kavandama ning julgustada koostööle neid, kellel IT teenuste sisseostmise kogemus veel puudub. Samuti võiks tugeva majasisese kompetentsiga mitte-IT-ettevõtted ulatada abikäe enda koostööpartneritele. Kasu oleks sealjuures kahetine: üks, mida saab protsesside parendamisest, ja teine, mis sünnib paremast koostöösuhtest.
Eestlastes on kindlasti seda jonnakat rammu, mis oli Vargamäe Andresel, et kui ei tea, kuidas paremini saaks, siis püüda ropu tööga soo ära kuivendada, et sinna ühel päeval mets istutada. Vahest tuleks aga tänapäeval juhinduda „tee tööd ja näe vaeva…“ asemel hoopis Tammsaare ühest teisest mõttest „pisiasjad on tihti paljuütlevamad kui kangelasteod“ ning alustada väikestest asjadest. Usun, et just see suhtumine on Eesti pikaajalisest edust puudu.
Edukas Eesti on Advokaadibüroo Cobalt, Eesti Gaasi, Harju Elektri, Silberauto, Tallinna Kaubamaja ja Äripäeva arvamuskonkurss.
Seotud lood
Muuseumikvaliteediga kunsti on võimalik osta vähem kui poole iPhone’i eest, leiab investor Riivo Anton. “Ma paneks piiri 500 euro peale– sealt on kindlasti võimalik leida häid teoseid, mille järeltulijad saavad pandimajja viia.”