Wednesday, April 13, 2016

Co o nás prozradí facebookový like?

 Co o nás prozradí facebookový like?

Je možné jen pomocí analýzy tzv. facebookových „like“ neboli „to se mi líbí“ zjistit citlivé soukromé informace konkrétních uživatelů této sociální sítě a s jakou přesností?
Touto otázkou se ve svém výzkumu zabýval tým vědců Kosinski, Stillwell a Graephel. Ti za pomoci téměř šedesáti tisíc dobrovolníků přihlášených prostřednictvím facebookové aplikace myPersonality shromáždili data potřebná pro vytvoření počátečního modelu a pokusili se dokázat skrz výpočetní technologie poznat vlastnosti uživatelů.

Studie byla realizována za spolupráce Stanford University a University of Cambridge, konkrétně tamějšího Psychometrics Centre zabývajícího se výzkumem, výukou a vývojem produktů v oboru obecné a aplikované psychologické diagnostiky v online prostředí. Centrum na univerzitě funguje již od roku 2005 a v posledních třech letech zažívá v souvislosti s prudkým nárůstem lidské aktivity v oblasti online komunikace a sociálních sítí velký rozvoj. Psychologové, statistici, matematici, počítačoví vědci, ale i jazykovědci se zde snaží psychologické jevy v online prostředí nejen zkoumat, ale i najít jejich praktické využití pro vládní, obchodní a průmyslové subjekty.

Dr. Michal Kosinski je sociologem zabývajícím se organizačním chováním na Stanford Graduate School of Business. Až do nedávné doby, kdy své působiště přenesl do San Francisca, byl zástupcem ředitele institutu v Cambridge a také výzkumným konzultantem společnosti Microsoft Research v oblasti strojového učení, data miningu a programování. Jeho současný výzkum se zaměřuje na vztahy mezi uživatelskými stopami v digitálním prostředí a psychickými vlastnostmi, crowdsourcingové a aukční platformy a v neposlední řadě on-line psychometrií. I nadále koordinuje myPersonality projekt, který zahrnuje globální spolupráci mezi více než 80 výzkumnými týmy analyzujícími podrobné psycho-demografické profily více než 8 milionů uživatelů Facebooku.

Dr. David Stillwell je nástupcem Kosinského, který se na University of Cambridge věnuje především analytice velkoobjemových dat a kvantitativní stránce společenských věd. Je také jedním z představitelů computativně behaviorálně vědního oddělení v Cambridge Judge Business School.
Sám sebe popisuje jako velkého nerda, ale odbornou veřejností je vnímán spíše jako Mark Zuckerberg psychometrie. Ještě během studií se začal věnovat projektu vývoje aplikací pro sociální sítě a právě on stál u zrodu myPersonality, která umožňuje uživatelům v reálném čase nejen vyplňovat psychometrické testy, ale i dostat zpětnou vazbu s výsledky. Vědecké komunitě tak umožnil přístup k nedocenitelnému zdroji dat k dalšímu výzkumu. Pacifik Magazine ho dokonce nedávno zařadil mezi TOP 30 mladých myslitelů do 30 let, kteří budou mít v budoucnu zásadní vliv na sociální, politické a ekonomické otázky.

Thore Graepel je hlavní výzkumný pracovník v Microsoft Research Cambridge (MSRC) ve Velké Británii a vede výzkumnou část online služby a reklamní skupiny (OSA). Skupina OSA provádí výzkum v oblasti aplikovaného strojového učení a teorie her s aplikací na on-line reklamy, online hry, a webové vyhledávání. Je Senior Member of Wolfson College v Cambridgi, a také vedoucí člen IEEE. Jeho výzkum zahrnuje pravděpodobnostní modely, reprezentace znalostí a v současné době i aspekty behaviorální teorie her, crowdsourcingu, a psychometrie.

Spolupráce těchto tří vyhlášených odborníků vedla ke vzniku experimentu, jehož výsledek může otřást mnohým z nás, kteří si myslí, že jejich soukromí na internetových sociálních sítích je zabezpečeno mírou informací, které o sobě explicitně napíší. Zmínění výzkumníci vytvořili počítačový model, který zpracovával informace o přidělených „likes“ uživateli a na jejich základě vytvářel jejich demografický i psychologický profil. Jednalo se o obyvatel Spojených států amerických, čemuž odpovídá i nastavení modelu a výsledky výzkumu.

Pro zjištění shody se skutečností byli daní účastníci experimentu osloveni o vyplnění podrobných dotazníků, které obsahovaly jejich vysoce soukromé údaje od sexuální orientace, etnické příslušnosti, politických názorů, přes inteligenční kvocient, věk, pohlaví až po psychické vlastnosti určované psychometrickými testy. Výzkumný model na základě lineární regrese zredukoval počet výskytů „to se mi líbí“ na přijatelnou mez, ve které již jeho výpočetní kapacity vystačovaly na výpočet vlastností osoby.


Ve své výzkumné zprávě odborníci vyhodnotili, že jejich algoritmus nejen dokáže z daných „likes“ rozpoznat nejen základní obecné charakteristiky uživatele jako je pohlaví či věk. Tento kvantitativní výzkum experimentálně prokázal schopnosti jejich modelu správně přiřadit osobám dokonce také politické názory – v 85% případů model správně určil, zda je osoba nakloněna Demokratické straně či spíše fandí Republikánům. Ještě o něco vyšší úspěšnost model vykázal při rozlišování sexuální orientace, zde správně rozpoznal mezi homoxesuální a heterosexuální osobou v 88% případů.

Úplně nejvyšší přesnost ovšem vykázal v rozlišení rasy (95% shodných případů rozeznání bělošského Američana od afroamerického) a překvapivě také u psychologických vlastností. Například v případě vlastnosti „otevřenost“ dosahoval výsledků, které jsou běžnou odchylkou při opakování psychometrických testů stejným uživatelem.

Otázkou zůstává, nakolik přsné výsledky by tento model mohl poskytovat v České republice, která je multipartistickou zemí s převážně monokulturní společností. Pokud by ovšem model dokázal rozeznat příznivce ČSSD od TOP 09, lidovců, pirátů, komunistů či dalších stran, dalo by se polemizovat, zda se jedná o velký úspěch či hrozbu. Přestože sociální sítě umožňují svým uživatelům vysokou míru zabezpečení soukromí, jimi přidělované „likes“ jsou veřejně viditelné. Pokud by tato data byla systematicky zpracovávána, umožnilo by to velkým společnostem či politickým stranám perfektně cílit reklamu na uživatele, kteří mají predispozice jim být nakloněni. Nemluvě o faktorech jako je sexuální orientace, či či náboženské vyznání, kdy může v nškterých prostředích i k bezprostřednímu ohrožení dané osoby. Mají vůbec společnosti právo o nás získávat tyto informace bez našeho souhlasu? Výzkum Kosinskiho, Stillwella a Graephela otevřel dveře nové diskuzi o soukromí na internetových sociálních sítích.

 zdroj:
KOSINSKI, Michal, David STILLWELL a Thore GRAEPEL. Private traits and attributes are predictable from digital records of human behavior. PNAS. 2013, vol. 110 (no. 15), 5802–5805. DOI: 10.1073.

No comments:

Post a Comment