Top 3 răspunsuri pe care le primesc atunci când povestesc cunoscuților de o încălcare a confidențialității datelor sau o colectare abuzivă de date care a mai apărut:
- exagerezi!
- și ce? eu nu am nimic de ascuns.
- da, asta e, n-avem ce face. Dacă vrem să folosim, trebuie să „suportăm”.
De câte ori ați oferit astfel de scuze la astfel de povești, cum ar fi faptul că televizorul smart poate asculta orice conversație care are loc în cameră sau că aspiratorul smart face o hartă a casei tale ca să o poată naviga, dar o și trimite mai departe la compania producătoare? De multe ori, mă gândesc. Și eu am spus cel puțin o dată că nu am nimic de ascuns și că poate trebuie să facem acest sacrificiu pentru ca tehnologia să poată progresa.
Postarea de azi nu este despre a prezenta exemple peste exemple de astfel de încălcări ale confidențialității sau colectări abuzive pentru că sigur m-aș întâlni cu răspunsuri de genul celor de mai sus. După astfel de răspunsuri, recunosc că mi-e greu să vin cu alt argument mai concret și risc să merg în tărâmul teoriilor unde deja îi pierd pe oameni.
O să încerc azi aici niște explicații despre cine și de ce colectează date, cum e cu confidențialitatea și care sunt principalele narative despre colectarea datelor de orice fel. De ce?
- pentru conștientizare – vreau să fac colectarea de date aproape „palpabilă/tangibilă” pentru voi
- pentru contextualizare – ca să înțelegem de ce auzim din gura politicienilor că datele sunt noul petrol
Disclaimer: nu sunt avocat, nici IT-istă, nici data scientist să ofer explicații tehnice sau legale despre colectarea de date sau modul în care se realizează. Misiunea mea este mai degrabă să traduc în limbaj simplu atât ceea ce se întâmplă, cât și contextul în care ni se întâmplă. Mă mai interesează ideea de guvernanță a datelor – ale cui sunt, cine le manevrează și cum.
Cine și de ce colectează date?
Toată lumea. Pentru că pot. Site-ul acesta colectează date. De exemplu, săptămâna aceasta am avut un utilizator din Buenos Aires, nu știu cine ești, dar gracias! Atenție, chiar dacă știu că e din Buenos Aires, nu știu cine e cu nume și prenume, ca n-am cum și nici nu mă interesează neapărat. S-ar putea să fie conectat printr-un browser securizat cum e Tor și de fapt să fie de altundeva. Oricum, nu stochez și nici nu țintesc pe nimeni cu reclame.
Astea sunt răspunsurile simple. Răspunsurile complicate, mai jos.
Companiile private au fost întotdeauna în avangarda colectării de date în era digitală, modelul de business din spatele Google fiind construit exact pe asta. Lumea caută tot felul de chestii, motorul de căutare colectează și apoi ne dau reclame cu ce deduc ei că ne interesează. Doar că în timp acest „ce deduc ei că ne interesează” a devenit mult mai precis și mult mai extins la multe companii. Mențiune importantă: Google a anunțat recent că va elimina targetarea utilizatorilor cu reclame bazată pe urmărirea activității lor pe alte site-uri, dar e foarte probabil că vor înlocui această tehnologie cu altceva care tot ne urmărește, dar mai subtil 🙂
De ce colectează companiile? Poezia livrată către consumator este: pentru a-ți furniza servicii personalizate și tot mai bune, colectarea de date despre tine, consumatorul, este necesară. Dacă nu vrei, atunci experiența ta cu inserați aici orice nume de aplicație/program/platformă nu va fi optimă și posibil să existe deficiențe în experiența de utilizare pe care o ai. Aici intervine nudge-ul, ghiontul psihologic pe care ni-l dau spunându-ne că nu ne va merge bine aplicația dacă nu suntem de acord cu colectare de date extinsă. Fiindcă noi, oamenii, suntem risk averse, vrem să evităm problemele, atunci o să fim de acord cu colectarea extinsă pentru personalizarea serviciilor. Personalizare care automat vine cu reclamele ei în spate.
Să nu uităm de state, care colectează date despre cetățenii lor. Recensămintele și statisticile mai clare despre populație au fost făcute pentru a înțelege dinamica societății și pentru a crea politici în concordanță cu efectiv cum arăta societatea. Doar că statul a rămas mult în urma companiilor private în ceea ce privește colectarea de date. Pot să pun pariu că Google îi cunoaște mai bine pe români decât statul român îi cunoaște pe cetățenii săi. Nu dispune de resurse sau de tehnologie pentru a colecta și analiza datele așa cum o fac companiile private cu noi.
Totuși, statul n-a rămas în urmă la capitolul „motive ascunse pentru colectarea datelor”. Analogul lui „colectare de date – experiență mai bună de utilizare” în cazul statului sună cam așa, în special după 11 septembrie: „trebuie să extindem supravegherea asupra cetățenilor noștri pentru că ne confruntăm cu amenințări de securitate, deci aveți de ales între siguranța vieții și supraveghere”.
Și cu noi cum rămâne?
Chiar așa. Noi suntem sursa de date – directă sau indirectă – pentru ambele entități. Direct și voluntar atunci când noi furnizăm datele pentru a ne crea un cont sau dăm un like pe o rețea socială, dar involuntar atunci când „trackers” de date colectează informații despre noi dintr-o aplicație de pe telefonul nostru de exemplu. Dezvoltatorii de aplicații pot include „trackers”, „urmăritoare” de date, care sunt un fel de uși semi-deschise pentru ca părți terțe să colecteze date despre noi și să le dea mai departe desigur. Apple zice, de exemplu, că o aplicație are în medie 6 trackers de genul acesta care pot urmări totul de la locația ta (că e pornită, că nu e pornită) până la modul în care se mișcă telefonul tău sau dacă ai trecut pe lângă vreun magazin care ar mai putea furniza ceva date despre tine.
Pentru stat, suntem surse de date și directe și indirecte. Normal, statul trebuie să știe despre cetățenii săi, nicio problemă aici. Datele noastre personale sunt mânuite de zeci de mii de funcționari publici care știu sau nu care ar trebui să fie regimul de colectare și utilizare a datelor personale. Mai nou, se discută foarte mult despre datele industriale sau cele care nu sunt personale. Ele pot fi rezultatul unor senzori plasați printr-un oraș sau într-o fabrică sau cele păstorite de instituțiile statului. Ministerul Educației are, de exemplu, platforme prin care se colectează date despre studenți și mediul universitar care nu identifică studenții cu nume, prenume și specializare, dar pot da date despre dinamica unor facultăți – aceste date nu sunt date personale. Exemplele pot continua, dar ce e de reținut e faptul că noi, cetățenii suntem sursa de date.
Motivația pentru stat e simplă aici: avem nevoie de date nu doar pentru politici mai bune, ci și pentru a dezvolta economia care se bazează din ce în ce mai mult pe date. De la roboți industriali la tramvaie mai noi, toate emit și utilizează date într-o formă sau alta. Dar să nu uităm că, într-o formă sau alta. tot oamenii oferă aceste date pentru funcționarea lor.
Și ca să vizualizați și să înțelegeți de ce e semnificativ, nu pot să nu fac apel la Matrix când Neo se trezește în câmpurile unde milioane de oameni sunt folosite ca surse de energie pentru mașini. Nu-i vine să creadă nici când i se explică interacțiunile care au dus la un război dintre inteligența artificială și oameni. La o scară mai mică și mai puțin cinematografică, noi suntem sursa de date.
Ale cui sunt datele? Nu am pretenția să intru într-o dezbatere legală, dar începe să crească curentul de opinie care consideră că datele sunt proprietatea celor care le emit, adică proprietatea noastră, și nu a celor care le colectează și deci ar trebui să ne bucurăm de un drept de proprietate asupra lor.
Datele nu ar trebui să fie noul petrol.
Dacă datele sunt proprietatea noastră, suntem liberi să le utilizăm și să le distribuim așa cum dorim. Dar sigur vi s-a întâmplat să nu puteți accesa un serviciu decât după ce v-ați dat numele, numărul de telefon, adresa de e-mail sau poate chiar numărul de la pantofi. Ce să mai spun despre simplul acces în setările de reclame și confidențialitate ale Facebook, unde afli cu stupoare că Facebook are mult mai multe date despre tine decât credeai. Pe alea de unde le-a scos? Păi, le-a extras, deși verbul din limba română nu explică nici pe jumătate cât spune cel din limba engleză: to mine = to dig coal or another substance out of the ground (cf. Cambridge English Dictionary). Deci, sapă pentru a le scoate la suprafață.
Cu cât mai multe, cu atât mai bine, doar așa era și cu cărbunele. Cu cât mai mult cărbune, cu atât mai mult se dezvoltă o industrie. Aici intervine și metafora conform căreia datele sunt noul petrol al economiei digitale. Petrolul a fost piesa de bază a celei de-a doua revoluții industriale, așa cum a fost cărbunele pentru prima. Vor fi, se pare, fundamentul unei noi economii. Dar metafora asta se poate citi și în alte feluri
Hai să mergem pe urmele acestei metafore. Petrolul și cărbunele încă se mai extrag, dar sunt resurse finite. Prin comparație, datele sunt infinite (sau cel puțin așa zic cercetătorii pe care i-am citit), putându-se extrage în numeroase moduri fără sfârșit. Companiile valorifică foarte bine acest potențial, creând dispozitive și modalități de a colecta date care merg tot mai adânc în intimitatea noastră – până și pulsul și somnul ni-l pot urmări.
Extracția și utilizarea petrolului și a cărbunelui în exces nu fac bine mediului înconjurător. Putem spune acest lucru despre date? Putem spune că pot face rău societății și indivizilor. Extracția de date și personalizarea făcute de companiile private ne țin captivi în bulele noastre, ajungându-ne să ne urâm unii pe alți și să erodăm coeziunea socială. Nu văd cum acest lucru poate fi benefic pentru dezvoltare economică. În cartea ei Privacy is Power, Carissa Veliz are un alt exemplu puternic pentru calitatea vieții și aduce vorba despre o femeie, victimă a furtului de identitate pe Internet, care se trezea arestată și trebuia să-și dovedească identitatea în mod constant. De altfel, autoarea spune că datele personale sunt toxice și periculoase, fiindcă sunt vânate de mulți și sunt greu de securizat. De altfel, ea folosește altă metaforă: datele sunt azbestul societății digitale.
Ce fac statele în privința asta? Se uită cu îngrijorare și încearcă să reglementeze spațiul digital, spunând pe altă voce că datele sunt noul petrol și că trebuie să le valorificăm – de la senzori până la datele din instituțiile statului. E destul de greu să încerci să limitezi colectarea de date făcută de companii, ce reprezintă materia lor primă pentru modelul de business, în timp ce tu ca stat vrei să faci un lucru asemănător, să normalizezi colectarea de date din ce în ce mai multe. E o disonanță cognitivă aici care poate crea confuzii pentru cetățeni, având în vedere că poate nu reușim să facem diferența dintre ele și cum ni se colectează datele. Regulamentul pentru Protecția Datelor face o parte din munca asta, dar este doar un prim pas.
Dacă datele vor fi noul petrol, e foarte probabil să ne trezim peste câțiva zeci de ani cu polemici asemănătoare celor actuale referitoare la eliminarea combustibililor fosili din economia globală. Ne putem imagina astfel de discuții?
Datele nu sunt tangibile.
„Avantajul” petrolului și cărbunelui e că sunt resurse pe care „putem pune mâna” și despre ale căror efecte putem să ne convingem cu ochii noștri. Vedem zilnic gazele care ies din mașini și pe care le inhalăm noi. Aici e problema cu datele: nu putem pune mâna pe ele, sunt invizibile și, mai ales, nu știm când se „sapă” după ele. Dacă nu le vedem, nu ne dăm seama când dispar, când sunt colectate sau vândute mai departe.
De asta aud acele răspunsuri de mai sus. Dacă ai avea în spatele casei un puț de unde ar țâșni țiței în fiecare zi, nu cred că ți-ar conveni dacă ar veni zilnic unii cu gălețile să-și ia și ei o porție. Așa că pe final, încerc să sugerez un exercițiu de vizualizare a datelor.
Temă de casă 🙂
Exercițiu de final de postare: pentru a conștientiza câte date ni se extrag în fiecare zi fără să știm, fă un exercițiu, asemănător celui făcut de Apple aici cu explicația „A day in your data”. Încearcă să urmărești activ ce fel de date și în ce cantități se colectează despre tine într-o zi pornind de la toate dispozitivele smart pe care le ai: telefon, tabletă, calculator, smartwatch, mașina cu sistem Apple/Android, etc.
- când te trezești și pui mâna pe telefon, deschizi aplicațiile preferate, iar fluxul de date deja curge – locație, scroll, impresii, reach, etc.
- deschizi e-mail-ul, conținutul se citește..și nu doar de către tine
- deja ceasul inteligent știe cum ai dormit și ce puls ai
- orice cauți pe google se contorizează ..și tot așa.
Numără măcar interacțiunile cu tehnologia avute într-o zi și veți avea o mică impresie despre câte date se colectează despre 1 persoană. Ești sigur că vrei să se știe atâta despre tine?