Big Data-ei minulla ole mitään salattavaa

hansai

Ylipäällikkö
#1
Miettimisen arvoinen HS:n "lainattu" kirjoitus..

Siivittivätkö keinoäly ja Facebookin valtava data brexitin ja Trumpin voittoon? Taustalta löytyy eksentrinen miljardööri ja hämäriä ”vaalienhallintayhtiöitä”
Facebook osoittautui tehokkaaksi vaaliaseeksi.

Marraskuussa 2016 Donald Trump voitti Yhdysvaltojen presidentinvaalit. Televisiosta uutisen nähtyään psykologi Michal Kosinski muisti oitis kummallisen tapauksen Cambridgen yliopistosta parin vuoden takaa ja sulki television heti kättelyssä.

Vuonna 2008 Kosinski oli vielä nuori tutkija Varsovan yliopistosta. Hänet oli juuri hyväksytty tekemään väitöskirjaa arvostettuun Cambridgen yliopistoon. Syy löytyi pienestä Facebook-sovelluksesta nimeltä MyPersonality, ”minun persoonallisuuteni”. Se perustui viittä persoonallisuuden osa-aluetta mittaavaan parametriin, ja huimaa tahtia kasvavan yhteisöpalvelu Facebookin käyttäjät saivat halutessaan jakaa sovelluksen antamat tulokset tutkijoiden kanssa.

Kosinski ei ollut varautunut sosiaalisen median voimaan. Ei juuri kukaan silloin ollut. Sovelluksesta tuli Facebookin räjähtävän suosion vanavedessä niin klikattu, että profiilinsa ja tuloksensa jakoivat lopulta miljoonat ihmiset. Kosinskilla ja hänen kollegallaan oli pian koossa maailman suurin kasa dataa, joissa ihmisten Facebook-tietoja ja tykkäyksiä yhdistettiin heidän persoonallisuutensa piirteisiin.

Yksinkertaista: esimerkiksi kosmetiikkamerkki Macista Facebookissa tykkäävät miehet olivat hiukan todennäköisemmin homoseksuaaleja kuin muut. Yksi todennäköisimmistä heteroseksuaalisuuden merkeistä oli puolestaan Wu-Tang Clanista tykkääminen. Lady Gagasta tykkäävät olivat muita todennäköisemmin ulospäin suuntautuneita.

Vuonna 2012 Kosinski ja hänen työryhmänsä pystyivät 68:n Facebook-tykkäyksen perusteella ennustamaan ihmisen ihonvärin 95 prosentin varmuudella, sukupuolisen suuntauksen 88 prosentin varmuudella ja yhdysvaltalaisista puoluekannan joko demokraatiksi tai republikaaniksi 85 prosentin varmuudella.

70 tykkäyksellä Kosinskin tiimi pystyi ennakoimaan saman verran kuin mitä Facebook-käyttäjän ystävät tiesivät. 150 tykkäyksellä pystyi kertomaan mitä hänen vanhempansa tiesivät ja 300 tykkäyksellä mitä käyttäjän puoliso tiesi.

Kun Vice-lehti haastatteli Kosinskia tammikussa, tämä kertoi, että sai julkaistuaan löytönsä kaksi puhelua. Toisessa puhelussa uhattiin oikeusjutulla, toisessa tarjottiin työpaikkaa. Molemmat puhelut tulivat Facebookilta.

Muutamaa viikkoa myöhemmin Facebook muutti yksityisyysasetuksiaan siten, että lähtökohtaisesti ihmisen tykkäykset eivät enää olleet julkisia. Mutta Kosinskin tiimin data pystyi tekemään psykologisen profiilin senkin perusteella, montako profiilikuvaa tai kaveria Facebook-käyttäjällä oli.

Ja pystyihän dataa käyttämään niinkin päin, että etsi sieltä vaikka kaikki ahdistuneisuutta osoittavat isät tai ärtyneet introvertit – ehkä jopa epäröivät demokraattipuolueen kannattajat.

Kosinski jatkoi työtään Cambridgen yliopiston psykometriikan keskuksessa. Alkuvuodesta 2014 häntä lähestyi nuori apulaisprofessori psykologian laitokselta. Hän kertoi toimivansa erään yrityksen pyynnöstä: yritys oli kiinnostunut Kosinskin tiedonhankinta- ja analyysityökalusta. Apulaisprofessori halusi käyttää heidän tietokantaansa eikä halunnut paljastaa toimeksiantajaansa.

Lopulta Kosinski sai tietää, että apulaisprofessori Alexandr Koganin toimeksiantaja oli nimeltään Strategic Communication Laboratories, SCL. Se oli vasta edeltävänä vuonna perustanut tytäryhtiön nimeltä Cambridge Analytica.

Kosinski tutustui SCL:n sivuihin. Yhtiö kertoi olevansa ”johtava vaalienhallintayhtiö”. Nyt SCL:n sivuilta käy ilmi, että se on tehnyt kokonaisvaltaista vaalityötä muiden muassa Etelä-Afrikassa, Intiassa, Ukrainassa vuoden 2004 ”Oranssissa vallankumouksessa” sekä Nigeriassa. Esimerkiksi juuri Nigeriassa yhtiö järjesti vaalipäivänä oppositiolle mielenosoituksia.

Kosinskia alkoi epäilyttää.

”Koko homma alkoi haista”, Kosinski sanoi Vice-lehdelle tammikuussa.

Hän lakkasi vastaamasta apulaisprofessori Koganin yhteydenottoihin ja ilmoitti asiasta yliopiston johtoon. Hyvämaineinen Cambridgen yliopisto huolestui. Apulaisprofessori Kogan muutti Vicen mukaan oikopäätä Singaporeen ja vaihtoi nimensä. Kosinskista alkoi tuntua, että hän oli aavistanut oikein: apulaisprofessori oli ilmeisesti monistanut heidän työkalunsa ja myynyt sen eteenpäin.

Kosinski väitteli tohtoriksi ja sai työtarjouksen Stanfordin yliopistosta. Hän muutti Yhdysvaltoihin ja on edelleen Stanfordissa apulaisprofessorina.

Mutta marraskuussa 2015 Kosinskin yöunet alkoivat taas jäädä vähiin.

Britannia halusi irti Euroopan unionista. Asiaa varten oli perustettu kaksikin eri kampanjaa. Kävi ilmi että niistä kahdesta radikaalimpi, se jota Nigel Farage tuki, oli palkannut tutun kuuloisen yrityksen tekemään verkkokampanjaansa.

Yrityksen nimi oli Cambridge Analytica, SCL:n tytäryhtiö.

Paljon myöhemmin, helmikuussa 2017, brittiläinen Guardian-lehti haastatteli Leave.EU -kampanjan viestintäpäällikköä Andy Wigmorea. Kävi ilmi, että Nigel Farage ja SCL:n suursijoittaja Robert Mercer ovat läheisiä ystäviä.

”Keinoäly, jota me käytimme, kertoi meille kaikenlaisia asioita ihmisestä ja siitä, miten hänet voi vakuuttaa jostain tietystä viestistä”, Wigmore kertoi.

”Ja sitten sitä tietysti tiesi, että heidän verkostossaan on ihmisiä jotka pitävät siitä mistä hekin pitävät, joten viestiä pystyi levittämään. Ja sitten heitä seurataan. Tietokone ei koskaan lakkaa oppimasta, eikä se koskaan lakkaa tarkkailemasta.”

Facebook oli kampanjassa aseista tehokkain, sanoi entinen viestintäpäällikkö ja vuokrasi talon Yhdysvalloista.

Vain vähän ennen Britannian brexit-kansanäänestystä kesäkuussa 2016 Yhdysvalloissa republikaani nimeltä Ted Cruz luopui Trumpin hyväksi hankkeestaan pyrkiä Yhdysvaltojen presidentiksi. Cruzin kampanjassa oli ollut tähän saakka mukana datayritys Cambridge Analytica.

Ted Cruzin vaalityöhön oli lahjoittanut rahaa liikemies nimeltä Robert Mercer. Hän on se sama mies, jonka viestintäpäällikkö Wigmore nimesi Nigel Faragen ystäväksi.

Nyt suursijoittaja Mercer siirtyi Donald Trumpin kampanjan tukijaksi.

Kesäkuussa myös Cambridge Analytica ryhtyi työskentelemään Trumpin kampanjassa.

”Pian he kutsuvat minua HERRA BREXITIKSI”, Trump tviittasi.

Robert Mercer on mies, joka ei viihdy julkisuudessa. 71-vuotias suursijoittaja aloitti uransa IBM:lla vuonna 1972. Kielten- ja puheentunnistusta kehitellyt mies osoittautui hyvin lahjakkaaksi. Nykyään hän johtaa Renaissance -nimistä sijoitusrahastoa, jonka arvo oli talouslehti Forbesin mukaan vuonna 2015 29 miljardia dollaria. Forbes kertoo myös, että Mercer lahjoitti Ted Cruzin presidentinvaalikampanjaan 11 miljoonaa dollaria.

Useat yhdysvaltalaislehdet ehtivät hämmästellä, miten Mercer siirtyi niin liukkaasti Cruzin tukijasta Trumpin tukijaksi. Vaikka molemmat ehdokkaat republikaaneja olivatkin, heidän vaaliohjelmansa eivät olleet samasta puusta veistetyt.

Leave.EU -kampanjassa toiminut viestintäpäällikkö Wigmore kertoi Guardianille, että tapasi Trumpin kampanjatiimiä ennen brexit-kampanjan alkua.

”He sanoivat että tekoäly on Graalin malja”, Wigmore sanoi ja viittasi Jared Kushnerin ja Jason Millneriin. Jared Kushner on Donald Trumpin tyttären Ivankan aviomies ja Millner toimi tuolloin Trumpin kampanjan tiedottajana.

Mutta kuka käänsi Trumpin pään, vävypoikako? Entä miljardööri Mercer?

Vastaus saattaa löytyä Mercerin toisesta sijoituskohteesta. Mercer sijoitti kymmenen miljoonaa dollaria Breitbart-nimiseen verkon iltapäivälehteen, jolla on äänekäs muukalaisvastainen, oikeistolainen idelogia – alt right, kuten sanotaan. Breitbartin hallituksen puheenjohtajasta Steve Bannonista tuli Trumpin valinnan jälkeen tämän hallinnon päästrategi ja presidentin neuvonantaja.

Bannon tuotti yhdessä Robert Mercerin tyttären Rebekah Mercerin kanssa elokuvan kirjasta, jota rahoitti säätiö nimeltä GAI. Säätiön perusti Bannon saatuaan Robert Merceriltä kahden miljoonan dollarin pääoman. Kirja, josta elokuva tehtiin, oli nimeltään Clinton Cash. Se käsittelee Clintonin pariskunnan saamaa ulkomaista rahoitusta.

”Ei nykyaikaisella uutishuoneella ole rahaa pitää toimittajaa kiinni yksittäisessä hankkeessa seitsemää kuukautta. Me voimme tehdä niin”, Bannon sanoi Guardianin mukaan Forbes-lehdessä vuonna 2015 julkaistussa haastattelussa. ”Nykyaikaisen uutistoimituksen toimintalogiikka ei mahdollista suuria tutkivia hankkeita. Ei synny Watergatea, ei Pentagonin papereita.”

Samassa haastattelussa Bannonin sanotaan ylpeilleen sillä, että GAI-säätiöllä on 1,3 miljardin dollarin supertietokone, jonka avulla datatieteilijä tutkii verkon syövereitä sieltä, minne Google ei koskaan tule ulottumaan.

Tässä kohtaa on hyvä muistuttaa, että Robert Mercer tosiaan on erittäin varakas mies.

Tässä kohtaa on myös hyvä muistuttaa, että Mercer on hänet tuntevien mukaan ollut aina erittäin konservatiivinen mies – varsinainen eksentrikko suorastaan.

Ja tässä kohtaa on hyvä muistuttaa siitä, että Mercerin tiedetään sijoittaneen pieneen datafirma Cambridge Analyticaan noin kymmenen miljoonaa dollaria.

Syyskuussa 2016 Cambridge Analytican toimitusjohtaja Alexander Nix piti esityksen New Yorkissa Concordia Summit -tapahtumassa. Esityksestä olevassa Youtube-tallenteessa Nix kertoo, miten Cambridge Analytica käyttää samaa persoonallisuustyyppien luokittelumallia kuin tutkija Michal Kosinski. Cambridge Analytica käyttää datansa pohjana ”sosiaalisen median kyselyitä” ja Facebookin dataa.

Ja juuri niin kuten Kosinski Vice-lehden mukaan oli aiemmin pelännyt, Cambridge Analytica toimi kuin Kosinskin malli olisi syönyt steroideja:

”Olemme profiloineet jokaisen Yhdysvaltoissa asuvan aikuisen persoonallisuuden – 220 miljoonaa ihmistä”, Nix kertoi yleisölle.

Yhdysvalloissa datan käyttö on joustavampaa kuin Euroopassa. Käyttäjän tulee Yhdysvalloissa erikseen kieltää datansa käyttö, siinä missä Euroopassa datan käyttö on lähtökohtaisesti kiellettyä ellei käyttäjä sitä erikseen hyväksy.

Maaliskuun alussa 2017 Cambridge Analytican etusivulla on esittelyvideo, joka kertoo yrityksestä ja Donald Trumpista. Cambridge Analytican emoyhtiön SCL Groupin etusivun animaatiossa vilahtaa salintäysi ihmisiä käsissään Yhdysvaltojen liput.

Vice-lehti sai haastattelun Cambridge Analytican Alexander Nixiltä. Hän vahvisti, että Trumpin irrationaaliselta vaikuttava viestintä ei suinkaan ole irrationaalista: se vain huomioi tarkasti kaikki ryhmät keinoälyä optimoivalla tavalla.

Yksinkertaisimmillaan tämä tarkoittaa esimerkiksi sitä, että sanat fake news, valheelliset uutiset, tai illegal immigrants eli laittomat maahanmuuttajat, saadaan yliedustetuiksi vaikkapa Googlen hakutuloksissa. Toimintaa voi tehostaa helposti esimerkiksi sosiaalisen median koneellisilla valetileillä eli boteilla, jotka ohjelmoidaan toistamaan haluttuja hakusanoja.

Vice-lehden haastattelussa toimitusjohtaja Nix kertoi, että kun Trump ja Hillary Clinton kohtasivat viimeisessä vaaliväittelyssä, Cambridge Analytica testasi noin 175 000 erilaista variaatiota Trumpin viesteille. Niihin lukeutui vaihtoehtoja väreistä, teksteistä, otsikoista, valitako kuva vai video. Hienosäädöllä pystytään saavuttamaan pienimmätkin kohderyhmät ja vaikkapa kohdentamaan paikkatietoja hyödyntämällä kasvokkain tapahtuva vaikuttaminen, paikallinen ”feissaus”, vain vastaanottavaisten ihmisten ovikellojen soittamiseen.

”Pystymme tavoittamaan kyliä tai asuinkortteleita kohdentamalla. Jopa yksilöitä”, Nix sanoi.

Esimerkiksi Miamin kaupunginosassa nimeltä Little Haiti äänestäjien ei haluttu äänestävän Clintonia. Niinpä alueen ihmisille kohdennettiin uutisia siitä, miten Clintonin säätiö möhli kun Haitia oli kohdannut maanjäristys. Asiasta lokakuussa 2016 kertoneen uutistoimisto Bloombergin mukaan kohdentamisen tarkoituksena oli kääntää erityisesti nuorten naisten päät. Parempi etteivät äänestäisi ollenkaan, kuin että äänestäisivät Hillary Clintonia.

Tämä tuo mieleen Nigerian vaalit vuonna 2007. SCL kertoo toimineensa opposition edustajan hyväksi ja pyrkineensä kannustamaan opposition kannattajia jättämään äänestämisen kokonaan väliin. SCL:n sivuilta tieto on poistettu, mutta se löytyy sivun joulukuun 2016 alussa arkistoidusta versiosta.

Näin toimii tyypillisesti ihminen tai organisaatio, joka haluaa salata jotain. Ihminen, joka arvioi, että menneisyyden yksityiskohdat voivat haitata nykyaikaa.

Mutta palataan vielä hetkeksi Andy Wigmoreen, Nigel Faragen uskottuun brexit-viestintäpäällikköön. Siihen, joka kertoo Twitter-profiilissaan olevansa Trumpin rakastama ja lähteneensä Washingtoniin ärsyttämään Britannian Yhdysvaltojen-lähettilästä.

Wigmoren mukaan Cambridge Analytica antoi brexitiä ajaneelle Leave.EU -kampanjalle neuvoja sosiaalisen median suhteen.

Keinoäly on aika hurja työkalu, Wigmore myönsi Guardianille.

”Se on todella puistattavaa! Siksi en olekaan Facebookissa. Kokeilin sitä itseeni ja katsoin mitä tietoja minusta löytyy ja olin ihan että herrajumala. Se tiesi jopa missä lapseni käyvät koulua.”
http://www.hs.fi/ulkomaat/art-2000005113671.html?share=df3084c9f54a599eb6511d4cb695bd0d
 
#2

Sardaukar

Ylipäällikkö
Lahjoittaja
#3
Tuohan on aivan törkeän ja pelottavan tarkka juttu....
 
#4
Olisipa jännää jos joku analytiikkafirma vuotaisi ulos satojen miljoonien ihmisten "persoonallisuustiedot" ja jonkinlaiset tiivistelmät siitä mistä kukin tykkää ..

Onko naapuri "typerä suvakki" vaiko "rajat kiinni typerys"?
Entä mitä puoluetta hän kannattaa? Harrastukset?

Vielä henkilökohtaisempiin.. kuinkas monta kertaa hän on viestitellyt "sillai" exän kanssa?
Entä naapurin naisen tai miehen?

Kaikista noistahan on koneille kerrottu. Siellä ne ovat tallessa.
 

SJ

Ylipäällikkö
Lahjoittaja
#5
Ei sillä, että olisin Trumpin voittoa tai Brexittiä vastaan, mutta kuten olen jo aikaisemminkin sanonut, niin facebookkia ei tueta!
 
#6
Olisipa jännää jos joku analytiikkafirma vuotaisi ulos satojen miljoonien ihmisten "persoonallisuustiedot" ja jonkinlaiset tiivistelmät siitä mistä kukin tykkää ..

Onko naapuri "typerä suvakki" vaiko "rajat kiinni typerys"?
Entä mitä puoluetta hän kannattaa? Harrastukset?

Vielä henkilökohtaisempiin.. kuinkas monta kertaa hän on viestitellyt "sillai" exän kanssa?
Entä naapurin naisen tai miehen?

Kaikista noistahan on koneille kerrottu. Siellä ne ovat tallessa.
Ei nykytilan ja tuon skenaarion (tai oikeastaan sitä vielä kertaluokkaa pahemman) toteutumisen välillä ole kuin Googlen joutuminen hakkeroiduksi (tai vuotajan löytyminen talon sisältä). Jos pääsisi käsiin kaikkeen siihen tietoon, mitä Googlelle on kerääntynyt esim. sen hakukonetta, sähköpostia ja karttoja käyttäneistä tahoista, pystyisi paljastamaan aika monen ihmisen elämästä arkaluonteista tietoa. Periaatteessa Google tietää sen palveluita käyttävien henkilöiden osalta, kuka on hakenut netistä vaikkapa herpeslääkkeitä, transseksuaalisia prostituituja, lasten alastonkuvia, huumeita, raiskauspornoa, gore-väkivaltaa, pettämisseuraa tai jotain muuta epämääräistä.