Prepoznavanje obraznih čustev (Facial Emotion Recognition – FER) je tehnologija, ki analizira mimiko tako statičnih slik kot video posnetkov, da bi razkrila informacije o čustvenem stanju.
Kompleksnost izrazov obraza, možna uporaba tehnologije v katerem koli kontekstu in vključevanje novih tehnologij, kot je umetna inteligenca, povečujejo tveganje zasebnosti.
1. Kaj je prepoznavanje obraznih čustev?
Prepoznavanje obraznih čustev je tehnologija, ki se uporablja za analizo občutkov iz različnih virov, kot so slike in videoposnetki. Spada v družino tehnologij, ki jih pogosto imenujemo “afektivno računalništvo”, multidisciplinarno področje raziskav o zmogljivostih računalnika za prepoznavanje in razlago človeških čustev in afektivnih stanj ter pogosto temelji na tehnologijah umetne inteligence.
Mimika je oblika neverbalne komunikacije, ki namiguje na človeška čustva. Dekodiranje takšnih čustev je že desetletja raziskovalni interes na področju psihologije, pa tudi na področju interakcije računalnikov. V zadnjem času sta velika razširjenost kamer in tehnološki napredek pri analizi biometrije, strojnem učenju in prepoznavanju vzorcev igrala pomembno vlogo pri razvoju tehnologije FER.
Številna podjetja, od tehnoloških velikanov, kot sta NEC ali Google, do manjših, na primer Affectiva ali Eyeris, vlagajo v tehnologijo, kar kaže na njen vse večji pomen. Obstaja tudi več pobud programa EU za raziskave in inovacije Obzorje 2020, ki preučujejo uporabo tehnologije.
Analiza FER obsega tri korake:
a) odkrivanje obrazov,
b) odkrivanje izraza obraza,
c) razvrščanje izraza v čustveno stanje.
Odkrivanje čustev temelji na analizi orientacijskih položajev obraza (npr. konca nosu, obrvi). Poleg tega se v videoposnetkih analizirajo tudi spremembe teh položajev, da bi ugotovili krčenje v skupini obraznih mišic. Odvisno od algoritma lahko mimiko uvrstimo v osnovna čustva (npr. jeza, gnus, strah, veselje, žalost in presenečenje) ali sestavljena čustva (npr. veselo žalostno, veselo presenečeno, veselo gnusno, žalostno strašno, žalostno jezno, žalostno presenečeno). V drugih primerih je lahko mimika povezana s fiziološkim ali duševnim stanjem duha (npr. utrujenost ali dolgčas).
Vir slik ali videoposnetkov, ki služijo kot vhod za algoritme FER, se razlikuje od nadzornih kamer do kamer, nameščenih blizu oglaševalskih zaslonov v trgovinah, pa tudi na družabnih medijih in storitvah pretakanja ali lastnih osebnih napravah. FER je mogoče kombinirati tudi z biometrično identifikacijo. Njegovo natančnost je mogoče izboljšati s tehnologijo, ki analizira različne vrste virov, kot so glas, besedilo, zdravstveni podatki s senzorjev ali vzorci krvnega pretoka, ki izhajajo iz slike. Potencialne uporabe FER pokrivajo široko paleto aplikacij, katerih primeri so spodaj navedeni v skupinah po področjih uporabe.
– Nudenje prilagojenih storitev
– Analiza vedenja strank in oglaševanje
– Skrb za zdravje
– Zaposlitev
– Izobraževanje
– Javna varnost
– Odkrivanje kriminala
– Drugo
2. Kakšna so vprašanja varstva podatkov?
Zaradi uporabe biometričnih podatkov in tehnologij umetne inteligence FER deli nekaj tveganj pri uporabi prepoznavanja obrazov in umetne inteligence. Kljub temu ta tehnologija nosi tudi svoja posebna tveganja. Ker gre za biometrično tehnologijo, kjer se identifikacija ne zdi primarni cilj, so tveganja, povezana z natančnostjo interpretacije čustev in njeno uporabo, pomembna.
2.1 Nujnost in sorazmernost
Pretvarjanje človeških izrazov v vir podatkov za sklepanje čustev se očitno dotika dela najbolj zasebnih podatkov ljudi. Ker je tehnologija moteča, FER odpira pomembna vprašanja glede nujnosti in sorazmernosti.
Treba je skrbno oceniti, ali je uvajanje FER res potrebno za dosego zastavljenih ciljev ali obstaja manj vsiljiva alternativa. Obstaja nevarnost uporabe FER brez ocenjevanja nujnosti in sorazmernosti za vsak posamezen primer, zaveden zaradi odločitve o uporabi tehnologije v drugačnem kontekstu. Vendar je sorazmernost odvisna od številnih dejavnikov, kot so vrsta zbranih podatkov, vrsta sklepov, obdobje hrambe podatkov ali morebitna nadaljnja obdelava.
2.2 Natančnost podatkov
Analiza čustev na podlagi mimike morda ni natančna, saj se lahko izrazi obraza med posamezniki nekoliko razlikujejo, lahko mešajo različna čustvena stanja, ki jih doživljamo hkrati (npr. strah in jeza, veselo in žalostno) ali pa sploh ne izražajo čustev. Po drugi strani pa obstajajo čustva, ki se morda ne izrazijo na obrazu nekoga, zato lahko sklepanje, ki temelji samo na izrazu obraza, povzroči napačne vtise. Nejasnosti izrazov obraza lahko prispevajo dodatni dejavniki, kot so kontekstualne klavzule (sarkazem) in družbeno-kulturni kontekst. Poleg tega lahko tehnični vidiki (različni koti kamere, svetlobni pogoji in prikrivanje več delov obraza) vplivajo na kakovost ujetega izraza obraza.
Poleg tega lahko tudi v primeru natančnega prepoznavanja čustev uporaba rezultatov povzroči napačne sklepe o osebi, saj FER ne pojasni sprožilca čustev, ki je lahko misel na nedavni ali pretekli dogodek. Vendar se rezultati FER, ne glede na omejitve natančnosti, običajno obravnavajo kot dejstva in se vnesejo v procese, ki vplivajo na življenje posameznika, na katerega se nanašajo osebni podatki, namesto da bi sprožili vrednotenje, da bi odkrili več o njihovem položaju v določenem kontekstu.
2.3 Poštenost
Natančnost rezultatov algoritma obraznih čustev lahko igra pomembno vlogo pri razlikovanju glede na barvo kože ali etnično poreklo. Ugotovljeno je bilo, da družbene norme in kulturne razlike vplivajo na stopnjo izražanja nekaterih čustev, medtem ko je bilo ugotovljeno, da so nekateri algoritmi pristranski glede na več skupin glede na barvo kože. Na primer, študija, ki je preizkušala algoritme za prepoznavanje obraznih čustev, je pokazala, da so osebam afriškega porekla pripisali več negativnih čustev (jeza) kot drugim obrazom. Poleg tega so bili prvi, kadar je prišlo do nejasnosti, ocenjeni kot jezni.
Izbira pravega nabora podatkov, ki je reprezentativen, je ključnega pomena za preprečevanje diskriminacije. Če podatki o usposabljanju niso dovolj raznoliki, bi lahko bila tehnologija pristranska do premalo zastopanega prebivalstva. Diskriminacija, ki jo sproži napačna baza podatkov ali napake pri odkrivanju pravilnega čustvenega stanja, ima lahko resne posledice, npr. nezmožnost uporabe določenih storitev.
V drugem vidiku iste težave je v primeru zdravstvenih stanj ali telesnih okvar, pri katerih pride do začasne ali trajne paralize obraznih mišic, čustva posameznikov, na katere se nanašajo osebni podatki, napačno razumljeni z algoritmi. To lahko povzroči številne situacije napačne razvrstitve, posledice pa segajo od prejema nezaželenih storitev do napačne diagnoze psihološke motnje.
2.4 Preglednost in nadzor
Slike in video posnetke obraza lahko posnamete kjer koli, zahvaljujoč vseprisotnosti in majhnosti fotoaparatov. Nadzorne kamere v javnih prostorih ali trgovinah niso edine kamere, ki na daljavo snemajo podobe obraza, saj lahko lastne mobilne naprave med uporabo zajamejo izraze. V teh situacijah se pojavljajo vprašanja preglednosti pri zbiranju in nadaljnji obdelavi osebnih podatkov.
Če so izrazi obraza posameznikov, na katere se nanašajo osebni podatki, zajeti na daljavo, jim morda ne bo jasno, kateri sistem ali aplikacija bo obdelovala njihove podatke, za katere namene in kdo so upravljavci. Posledično ne bi mogli prostovoljno dati soglasja ali izvajati nadzora nad obdelavo svojih osebnih podatkov, vključno z delitvijo s tretjimi osebami. Kadar posamezniki, na katere se nanašajo osebni podatki, ne dobijo točnih informacij, dostopa in nadzora nad uporabo FER, so prikrajšani za svobodo izbire, kateri vidiki njihovega življenja se lahko uporabijo za vplivanje na druga konteksta (npr. čustva v družbenih interakcijah bi se lahko uporabila v kontekst zaposlovanja). Poleg tega morajo posamezniki, na katere se nanašajo osebni podatki, nadzorovati, v kolikšnem času bodo njihovi zajeti podatki obdelani in združeni v zgodovinske zapise njihovega čustvenega položaja, saj sklepanja o čustvih po določenem času za njih morda ne bodo veljavna.
Druga posledica daljinskega zajemanja izrazov obraza in nejasnosti njihove obdelave je, da posameznikom, na katere se nanašajo osebni podatki, morda ne bodo na voljo podatki, v katere druge vire podatkov bodo združeni. Napredni algoritmi AI dodajajo kompleksnost potrebam po preglednosti, saj lahko zaznajo rahle premike obrazne mišice, ki so nezavedni tudi za posameznike. To bi prispevalo k neprijetnemu občutku ranljivosti zaradi neželene izpostavljenosti.
2.5 Obdelava posebnih kategorij osebnih podatkov
Tehnologija FER lahko zazna obstoj, spremembe ali popolno pomanjkanje mimike in to poveže s čustvenim stanjem. Posledično lahko v nekaterih kontekstih algoritmi vplivajo na posebne kategorije osebnih podatkov, kot so politična mnenja ali zdravstveni podatki. Na primer z uporabo tehnologije FER na političnih prireditvah lahko o političnih stališčih sklepamo tako, da pogledamo mimiko in odzive občinstva. Zaradi pomanjkanja obrazne mimike lahko algoritmi zaznajo znake aleksitimije, stanja, v katerem človek ne more razumeti občutkov, ki jih doživljajo, ali jim primanjkuje besed za opis teh občutkov. To ugotovitev lahko povežemo s hudimi psihiatričnimi in nevrološkimi motnjami, kot je psihoza. Poleg tega lahko analiza zgodovinskih podatkov o čustvenem stanju človeka razkrije druga zdravstvena stanja, kot je depresija. Takšni podatki, če se uporabljajo v okviru zdravstvenega varstva, bi lahko pomagali pri napovedovanju in pravočasnem zdravljenju pacienta. Kadar pa posamezniki, na katere se nanašajo osebni podatki, ne morejo nadzorovati pretoka izpeljanih informacij in njihove uporabe v drugih kontekstih, se lahko soočijo s situacijo sklepanja in uporabe takšnih občutljivih osebnih podatkov s strani nepooblaščenih subjektov, kot so delodajalci ali zavarovalnice.
2.6 Profiliranje in avtomatizirano odločanje
Tehnologija FER se lahko nadalje uporablja za ustvarjanje profilov ljudi v številnih situacijah. Lahko bi ga uporabili za pridobivanje sprejemljivosti izdelka, oglasa ali predlagane ideje. Uporablja se lahko tudi za razvrščanje produktivnosti in odpornosti proti utrujenosti na delovnih mestih. Tveganje je v tem, da se posameznik, na katerega se nanašajo osebni podatki, morda ne zaveda te vrste ciljanja in bi se lahko počutil neprijetno, če bi zanj izvedel. Nadaljnje posledice lahko nastanejo zaradi napačnega profiliranja ali sklepanja, ki temelji izključno na povezanosti z določeno skupino ljudi, ki doživljajo ista čustva.
Poleg tega lahko poznavanje čustev posameznikov olajša njihovo manipulacijo. Na primer, znanje o čustvih, ki razkrivajo ranljivo čustveno stanje, se lahko uporabi za mentalno prisilitev ljudi k dejanjem, ki jih drugače ne bi storili – npr. za nakup blaga, ki ga ne potrebujejo.
Tehnologijo FER bi lahko uporabili za varovanje javne varnosti, na primer na koncertih, športnih prireditvah ali letališčih, za hitro prepoznavanje znakov agresije in stresa ter prepoznavanje potencialnih teroristov. Če pa bi takšna identifikacija temeljila izključno na FER in ni bila kombinirana z drugimi dejanji ali sprožilci, da je ta oseba nevarna, bi to lahko povzročilo dodatna tveganja za posameznike, na katere se nanašajo osebni podatki. Oseba bi lahko bila na primer podvržena neupravičenim zamudam pri izvajanju nadaljnjih varnostnih pregledov ali preiskav, zaradi česar ne bi sodelovala na dogodku, se vkrcala na let ali celo privedla do neupravičene aretacije.
Nenazadnje lahko FER vpliva na vedenjske spremembe, če se oseba zaveda izpostavljenosti tej tehnologiji (v psihologiji znana kot reaktivnost). Posamezniki lahko spremenijo svoje navade ali se izognejo določenim področjem, kjer se tehnologija uporablja, da bi poskušali samo-zaznati in se zaščititi. Lahko si predstavljamo grozljiv učinek, ki bi ga to lahko imelo na družbo, in občutek negotovosti med državljani, če bi takšno tehnologijo uporabljale nedemokratične vlade, da bi sklepali kakšen je politični odnos državljanov.
Vir: EDPS
Naslovna fotografija: RawPixel