Algoritme na Berkeleyu ga je učil profesor Billa Gatesa

 

Bojana Selinšek in Alek Pikl

10 minutno branje


V tokratnem podcastu VTIS Inovator smo gostili Davida Marna, ki od leta 2018 programira pri Googlu. Trenutno je član Google Safety Engineering Centra v Münchnu in gradi orodja za merjenje zasebnosti. Posebej ga zanima zasebnost v modelih strojnega učenja. Za svoje dosežke je na Berkeleyju prejel nagrado Warrena Y. Dera za dizajn in štipendijo Jamesa H. Eatona. 


Pri izbiri univerze ga je vodila misel, da ob druženju in pogovoru s pametnimi postaneš pametnejši ali, kot pravi pregovor, da okolica naredi človeka.
— David Marn
 
 

Pot v tujino

David je po mednarodni maturi na II. gimnaziji Maribor zaključil dodiplomski študij na univerzi Berkley v Kaliforniji, ki velja za eno najboljših računalniških univerz. Pri izbiri univerze ga je vodila misel, da ob druženju in pogovoru s pametnimi postaneš pametnejši ali, kot pravi pregovor, da okolica naredi človeka. David si je torej obetal, da bo tam veliko profesorjev, ki si bodo vzeli čas zate in s katerimi se boš lahko pogovarjal. Seveda smo ga povprašali, ali se je ta hipoteza potrdila, in povedal nam je, da se njegov koncept pametnosti izmika in se skozi leta spreminja. Kot pravi, pa se je to delno izpolnilo, in sicer to, da se je lahko družil s pametnimi ljudmi. V zvezi s študijem na Berkeleyju mu je ostala v spominu posebna anekdota, ko ga je algoritme učil profesor Billa Gatesa.

Prednosti študija na Berkeleyju: študij v Ameriki je v primerjavi z evropskim zelo fleksibilen, veliko predmetov je izbirnih, zelo veliko je svobode, ki se kaže tudi v drugih vidikih študijskega življenja, na primer v stanovanjski kooperativi v Berkeleyju. Študentje živijo skupaj v hišah blizu kampusa (alternativa študentskim domovom), ki jih upravljajo sami. Tukaj je David med drugim pripravljal jogurt, skrbel za kokoši ter na strehe montiral laserje in antene za deljenje internetne povezave med več hišami v študentskem naselju.

Programiranje za Google

Iz Berkeleyja ga je pot vodila v podjetje Amazon, ki mu je službo obljubilo že med študijem (posebnost študija v Ameriki je tudi to, da se zaposlovalci zelo hitro »zagrebejo« za študente), nato h Googlu v Seattlu, nazadnje pa v München.

Veliko mladih programerjev sanja o programiranju pri Googlu. David dela pri Googlu na področju zasebnosti, natančneje na področju anonimizacije podatkov. Z orodji, ki jih izdeluje, se iz določenih podatkov sestavi statistika, pri čemer je zasebnost posameznikov zaščitena, saj jih ni mogoče povezati s podatki, še vedno pa dajejo koristne informacije o celotni populaciji. Veliko sodeluje z ostalimi oddelki, ki si želijo anonimizirati svoje podatke in jih zanima, kako bi lahko to izvedli ob varovanju zasebnosti. Pri tem torej ne gre zares za klasično programiranje.

Vsak se mora najprej vprašati, kaj je zanj zasebnost.
— David Marn

Skrb zaradi zasebnosti in osebnih podatkov

Vsak ima svojo idejo zasebnosti, vsem pa je skupno to, da se moramo strinjati s predstavljenimi pogoji in vedeti, kako se bodo naši podatki uporabljali in procesirali. Glavno vprašanje pa je seveda, ali posameznik res razume sporočilo o procesiranju osebnih podatkov, ki se pojavi na spletni strani. Pri Googlu obstaja zavihek »My Account«, kjer vidiš, kateri podatki se bodo zbirali, in to lahko preprosto izklopiš za vse Googlove produkte. Tako lahko nadziraš, katere osebne podatke bo Google shranjeval in uporabljal.

Koncept razvoja zaposlenih pri Googlu

Kot pravi David, sta ustanovitelja Googla verjela, da lahko vsak posameznik oziroma zaposleni 20 % svojega časa porabi za ideje – za tisto, kar ga zanima. Svoji vodji na primer poveš, da bi se želel ob petkih ukvarjati z drugim projektom oziroma svojo idejo. Te želje večinoma upoštevajo. David zelo rad raziskuje, zato hodi na predavanja raziskovalcev. To je sedaj mogoče, ker večina predavanj poteka virtualno. Udeležuje se tudi konferenc. Teoretično lahko vsaka ideja, ki si ji namenil 20 % svojega službenega časa pri Googlu, kasneje postane tudi tvoja služba ali pa celo startup.

Diferencialna zasebnost

Davida še posebej zanima diferencialna zasebnost, pri kateri gre za to, da lahko matematično izmerimo količino zasebnosti. 

Vprašali smo, kaj je boljše uporabljati s stališča zasebnosti, Zoom ali Teams? David pravi, da bi vsak rekel drugače, pravilnega odgovora ni. Smo pa sedaj že tako daleč, da lahko zasebnost matematično izmerimo. To lahko delamo s strojnim učenjem ali brez njega. Pri nestrojnem učenju posamezniki sodelujejo v določeni raziskavi, na podlagi katere dobimo statistiko rezultatov. Statistika se spreminja, ko dodajaš posameznike. In glavno vprašanje oziroma to, kar spremljaš, je, v kolikšni meri se spremeni statistika, ko dodaš posameznika.

Smo pa sedaj že tako daleč, da lahko zasebnost matematično izmerimo. To lahko delamo s strojnim učenjem ali brez njega.
— David Marn

Kaj je strojno učenje?

David nam je na poenostavljen način razložil, kaj je strojno učenje: to je učenje računalnika, da se odloča v primerih, ki jih še ni »videl«, pri tem pa izhajamo iz tega, kako se uči človek. Računalniku na primer pokažeš sto stolov in potem upaš, da bo, ko bo videl stoprvega, vedel, da je to stol. Uporaba strojnega učenja na področju zasebnosti pa gre v smeri, da bi računalnik prepoznal, kaj je zasebnost (če si računalnik zapomni stvari, ki niso relevantne, npr. »ta stol je takšen, kot sem ga videl pri Davidu doma«, to ni v redu). Stvari so bolj zapletene, saj sta odgovora na vprašanji, kako definirati zasebnost in kako jo sploh izmeriti, nejasna. Kot pravi David, obstajajo različni načini, med katerimi je tudi generalizacija. Še bolj zapletena je zasebnost v medicini, saj naletimo na različne težave že na ravni študije. Rešujemo jih na različne načine, najpogostejše je »dodajanje šuma«, pri čemer dodamo med rezultate dodatne primere, ki na koncu zamaknejo rezultat, tako pa se izognemo temu, da bi lahko v rezultatih prepoznali posameznike, ki so sodelovali v študiji.

Prisluškovanje z mobilnimi napravami in oglasi

David je povedal, da Google in ostale aplikacije v resnici ne prisluškujejo posamezniku. Algoritmi prikazujejo oglase denimo na podlagi preteklih iskanj ali obiskanih spletnih strani. Kot Googlov uporabnik lahko izbereš, da se ti prikazujejo naključni oglasi, ki niso povezani s tvojimi preteklimi iskanji, lokacijo in zanimanji, ali pa takšni, ki bi te na podlagi algoritmov tvojih preteklih iskanj, starostne skupine in lokacije morda zanimali.

Kot pravi, pri njih veliko vlagajo v zasebnost. Velike korporacije namenjajo varovanju zasebnosti v zadnjem času res veliko denarja. Pri manjših podjetjih in startupih je za to slabše poskrbljeno, pa tudi ljudje smo premalo pozorni. Potrebovali bi več opozarjanja, pa tudi pozitivnih zgodb in primerov v medijih, da bi se še bolj zavedali pomena zasebnosti.

Ravnotežje med delom in zasebnim življenjem

Postaviti si je treba meje, pravi David. Delo zaključi takrat, ko je konec sestankov z Američani, za katere je takrat zaradi časovne razlike popoldan. Poudaril je tudi, da dajejo v Googlu velik poudarek usklajevanju profesionalnega in zasebnega življenja, kar pomeni, da se lahko, če na svojem delovnem mestu nisi zadovoljen, brez težav prestaviš na drugo pozicijo. Ima pa tudi srečo, da je njegovo delo asinhrono in ni zelo pomembno, kdaj ga opravi. Tako si lahko med delom vzame odmor in dela kasneje.

Za konec pa ...

Kot programerja Davida zelo zanima družboslovje. Pravi, da morajo programerji razumeti, kaj delajo in kaj je smiselno početi. Morda je sam še bolj pozoren na to, ker dela na področju zasebnosti. Želi si, da bi se ljudje vedno več ukvarjali z družboslovjem. Na ameriških univerzah je super, da lahko hodiš tudi na druga predavanja na svojem kolidžu (npr. greš poslušat predavanje iz psihologije). V Ljubljani je to težje, ker so fakultete razpršene po vsem mestu. Pomembna je torej interdisciplinarnost, seveda pa na drugi strani tudi zelo dobro poznavanje izbrane discipline. David ne ve, kam ga bo pot vodila v prihodnosti. Tako ali tako so časi takšni, da nihče od nas ne ve prav dobro. 😊

Davidu se zahvaljujemo za zanimiv intervju in ji želimo uspešno pot še naprej in naj ga vodi tja, kamor mora.