Sunday, April 12, 2015

Úskalí analýzy sentimentu v politických (anti)kampaních

Politický marketing byl v posledních letech díky sociálním sítím obohacen o novou dimenzi. A stejně tak, jako jsou nástroje politického PR využívány ve prospěch svých objednatelů, slouží mnohdy i v jejich neprospěch, samozřejmě ve službách rivalů. Antikampaně na sociálních sítích si vyžádaly rovněž nové poptávky u tzv. výstřižkových služeb (pozadu nezůstala ani česká společnost Newton Media, která monitoring sociálních služeb nabízí již několik let). Portál First Monday před několika lety k tomuto tématu publikoval text Changes in the discourse of online hate blogs: The effect of Barack Obama’s election in 2008 autorů Shlomi Sela, Tsvi Kuflik a Gustavo S. Mesche.

Všichni tři autoři textu působí na univerzitě v izraelské Haifě (University of Haifa) a ve svém profesním životě věnují novým médiím, blogům, sociálním sítím a internetu obecně. Shlomi Sela byl v době publikování článku (2012) studentem doktorandského programu na fakultě sociálních věd haifské univerzity (Faculty of Social Sciences). Tento autor se dlouhodobě zabývá sběrem a tříděním dat na internetu. Ve své diplomové práci se zabýval automatickou identifikací tzv. hate blogů. Druhý z autorů, Tsvi Kuflik, byl v době publikování textu (2012) vedoucím katedry informačních systémů univerzity v Haifě (Information Systems Department). Vedl zde skupinu, která měla za cíl zkoumat a modelovat inteligentní uživatelské rozhraní pro potřeby kulturního dědictví. Na toto téma napsal několik desítek odborných článků. Třetí autor, Gustavo S. Mesch, je profesorem sociologie na univerzitě v Haifě. Již mnoho let se zabývá sociálními dopady používání internetu a sociálních sítí.

Studie, o které pojednává tento text, a kterou autoři publikovali na portálu First Monday v roce 2012, se zabývá rozdíly v obsahu tzv. hate blogů před a po volbách amerického prezidenta v roce 2008. Autoři testovali na vzorku 600 tzv. hate blogů dvě alternativní hypotézy odvozené z teorie sociální identifikace. Zkoumaným obdobím byl rok před volbami v roce 2008 a doba bezprostředně po této volbě. Zjištění jsou velmi zajímavá, a totiž, že v blozích se po volbách zvýšil počet projevů nepřátelství a že se uživatelé – tzv. hate bloggeři – začali vykazovat prvky blížící se konkurenčnímu prostředí a začali se tak vzdalovat individuálnímu přístupu k tématu samotných voleb.

Nástup internetu a zdánlivých vymožeností, které nabídl široké veřejnosti, vedl ke změnám mediálního prostředí. Zatímco dříve byla novinářská profese, a tudíž možnost ovlivňovat názory skrze média, určena pouze „vyvoleným“, dnes, právě díky novým médiím, může být „novinářem“ prakticky každý. Tento fakt s sebou přinesl i fenomén tzv. hate blogů – nenávistných blogů. Cílem je ovlivňování široké masy veřejnosti skrze tzv. hate bloggery, tedy autory těchto textů, kteří jsou většinou „naočkováni“, aby prezentovali postoje a směřovali tak diskusi kýženým negativním směrem, samozřejmě proti předem danému soupeři. V případě studie z First Monday to byl kandidát na amerického prezidenta Barack Obama, tedy první, tehdy ještě potenciální, afro-americký prezident USA. Tzv. hate blogy se tehdy zaměřovaly především na rasové a etnické prvky této historické volby.

Výzkum tří autorů článků je případovou studií a jejím hlavním nástrojem je analýza sentimentu jednotlivých blogů týkajících se volby amerického prezidenta v roce 2008. Sentiment se dá charakterizovat jako bezprostřední hnutí mysli, a to ať v pozitivním či negativním smyslu, které závisí na subjektivní úvaze. Hlavním hlediskem je tedy zaujatý postoj zkoumaného subjektu k hodnocené veličině. Nejprve je však třeba zjistit, zda hodnocená veličina, v případě výzkumu, kterého se tento text týká, jsou to písemné projevy, vůbec nějaký názor obsahuje. Zde se rozlišují dvě kategorie – objektivní, tedy neobsahující sentiment, a subjektivní, ve kterém je naopak obsažen. Sentiment se pak dělí na několik kategorií. Existuje sentiment pozitivní, negativní, neutrální a bipolární. Poslední ze jmenovaných představuje zapeklitý problém, protože je v něm obsažen jak pozitivní, tak negativní sentiment zároveň. Existují algoritmy, které dokáží částečně – ale samozřejmě s určitou chybovostí hodnou strojového zpracování dat – klasifikovat obsah sentimentu a jeho druh. Pro snížení prvku chybovosti je vždy třeba vycházet z co nejobjemnějšího vzorku dat.

 Zdroj: First Monday

Současné nástroje analýzy sentimentu pracují na základě různých prostředků. Jsou to například bayesovské filtry nebo tzv. support vector machines (SVM). První ze jmenovaných se používají například i při třídění e-mailové pošty a odhalování tzv. spamů. V praxi to funguje tak, že ke každému slovu je přiřazena pravděpodobnost sentimentu a výsledek zkoumá pomocí speciálního algoritmu četnost takových slov v návaznosti na celkový obsah sdělení. Podle odborníků je však úspěšnost obou přístupů maximálně 70 %. Tedy jinými slovy, výzkum se neobejde bez zásahu výzkumníka a částečné zpětné kontroly dat.

Autoři textu si pomocí nasbíraných dat z tzv. hate blogů, vytvořili jakýsi korpus, ze kterého při svém výzkumu vycházeli. Zaměřili se například na výrazy a fráze typu “Hussein Obama”, “white pride” nebo „we hate blacks”. Cílem studie bylo podle autorů zjistit četnost projevů nepřátelství, a to i ve smyslu rasismu, v aktivní blogosféře. Prvním cílem bylo zjištění, jak se emoce v rámci blogosféry změnila po zvolení prvního afro-amerického prezidenta Obamy ve srovnání s dobou rok před samotnou volbou. Ihned po volbách byl zjistěn mírný nárůst nepřátelských projevů vůči novému americkému prezidentovi. A to i přes domněnky, že tomu bude naopak – autoři blogů začali vykazovat prvky chování, které jsou typické spíše pro hospodářskou soutěž (ve smyslu konkurenčního prostředí) než obecnou diskusi s názorovými střety.

Zdroj: First Monday

Autoři nicméně přiznávají, že jejich studie má hned několik omezení. První z nich je, že se jedná pouze o prostředí blogů – blogosféru. Diskuse v této oblasti se týká pouze specifického vzorku veřejnosti a výsledky studie tedy nelze zobecňovat na širší populaci. Další slabinou jsou omezení spojená s výše popsanou analýzou sentimentu a nepřesnostmi, které s sebou metody s ní spojené přináší.

Pokud bychom měli hodnotit relevanci studie v kontextu České republiky, pak jediným srovnatelným politickým kláním byla volba prezidenta z ledna roku 2013. Prvek rasismu, který je využit ve studii ve zmíněných amerických volbách, by se dal nahradit v českém prostředí prvkem nacionalismu, který se v rámci kampaně citelně projevoval. Zjednodušeně řečeno – Američané volili Američana s evidentními afro-americkými kořeny, Češi volili Čecha s evidentními rakousko-šlechtickými kořeny. Pokud se ve studii vědců Sela, Kuflika a Mescheho objevil nárůst prvků nepřátelství ihned po zvolení amerického prezidenta, lze to přirovnat k různým projevům nenávisti vůči zvolenému českému prezidentovi rovněž ihned po volbě (projevy typu "Zeman není můj prezident" apod.). V této souvislosti lze tedy zcela laicky usoudit, že studie, ač autoři přiznávají určitá omezení, lze aplikovat – ale pouze v případě určitých prvků podobnosti (např. rasismus - nacionalismus) – na podobné případy mimo území USA a dokonce i mimo blogosféru.

Použitá literatura:

SELA, Shlomi. KUFLIK, Tsvi. MESH, Gustavo S. Changes in the discourse of online hate blogs: The effect of Barack Obama’s election in 2008. First Monday. 2012, ročník 17, číslo 11. Dostupné online z: http://firstmonday.org/ojs/index.php/fm/article/view/4154/3354 (přístup 8. 4. 2015)

KOUDELA, Michal. Emoce a jejich fyziologický význam. Masarykova univerzita, 2012.


HAN, Jiawei, KAMBER, Micheline. Data mining: concepts and techniques. San Francisco, 2006. ISBN: 1-55860-901-6.

No comments:

Post a Comment