Överdrivna påståenden om Cambridge Analytica

Cambridge Analytica är ett företag som samlat in över 5 000 datapunkter på över 220 miljoner amerikanska Facebookanvändare. Det var så de lyckades få det republikanska partiet att vinna presidentvalet i USA under slutet av 2016.  Titta bara på videon nedan. Big data kan förutsäga beteende in i minsta detalj.

Det är så det låter ibland, åtminstone. Men beläggen för påståendena har till viss del lyst med sin frånvaro, och de som har kommit med påståendet har varit företaget själva, som finansieras av bland annat av en republikansk investerare.

I en intervju kallad Google Post-Election Review säger exempelvis Matt Oczkowski, produktchef för Cambridge Analytica:

we actually didn’t do any psychographics with the Trump campaign

Men det var ju så Trump vann valet? Analys av sociala medier och riktade budskap? En artikel vid New York Times ifrågasätter påståendet från Cambridge Analytica att de hade ett 50-tal kunder under 2016, en uppgift som har skiftat över tid och enligt officiella register var betydligt färre:

Cambridge executives now concede that the company never used psychographics in the Trump campaign. The technology — prominently featured in the firm’s sales materials and in media reports that cast Cambridge as a master of the dark campaign arts — remains unproved, according to former employees and Republicans familiar with the firm’s work.

Cambridge Analytica arbetade först för Ted Cruz. Han slogs ut under valkampanjen. Företaget började då arbeta för Trump. Så i stället för att Cambridge Analytica skapade förutsättningarna för en republikansk seger skulle man mycket väl kunna hävda att kausaliteten var omvänd: Cambridge Analytica följde de bästa förutsättningarna för en republikansk seger. Det är därför inte speciellt konstigt om det vinnande laget använder deras produkter om man får byta häst mitt under pågående lopp. Då kan det vara bra att reflektera kring survivorship bias.

De överdrivna påståendena om Cambridge Analytica var dock inte negativt för företaget, tvärtom. De fick finansiärer och det var också deras huvudfokus. Från Matt Oczkowski och Google Post-Election Review igen:

the emphasis was always on fundraising

Cambridge Analytica använde NLP och sentimentanalys (men inte psykografisk analys), vilket på sätt och vis är ganska triviala saker i jämförelse. Som brukligt är det inhämtandet av data och att få det i rätt format som är det svåra och som tar tid.

Cambridge Analytica verkar vara den vanliga historien. Grandiosa påståenden följt av massmedier som okritiskt rapporterar vidare. Om man befinner sig i ett kunskapsvakuum och inte vet varför någonting händer, och det finns någon som kommer med en inte allt för otrolig historia, är det lätt att acceptera den förklaringen utan att först grundligt kontrollera både sannolikheten i förklaringen liksom alternativa förklaringar. Då kan man skapa feedbackloopar och självuppfyllande profetior, där uppfattningen om ett problem leder till att problemet ifråga också uppstår.

Därför kan påverkanskampanjer spelas upp inför öppen ridå samtidigt som man kliar sig i huvudet och undrar vad för slags osynlig kraft det är som orkestrerat kampanjen. Då kan det vara lättare att tolka in en aktör med ett syfte snarare än resultatet av flera stokastiska processer. Slutsatsen kan väl för enkelhetens skull vara att det inte är lätt att vara människa alla gånger…

Uppdaterat 17 mars 2018: En tidigare anställd säger att de mycket väl använde Facebookdata. Se videon Cambridge Analytica whistleblower: ’We spent $1m harvesting millions of Facebook profiles’ hos The Guardian samt relaterade nyheter på sidan.

Relevant litteratur om selektiv exponering

Jag får då och då frågor från studenter om vilka artiklar de bör läsa om selektiv exponering (och fenomenet ”filterbubblor” som ofta förekommer i medierna). I stället för att skicka mail till varje student kan jag lika väl lägga listan här, och sedan länka till det här inlägget. Två flugor i en smäll alltså, både transparens och mindre jobb för mig i framtiden!

Urval

Jag har samlat på mig drygt 300 referenser enbart om selektiv exponering, samt ett tusental andra referenser om närliggande ämnen. De kan man enklast hitta genom att söka på Google Scholar efter ”selective exposure”.  Tänk dock på att ”selektiv exponering” också är ett begrepp som förekommer inom kemin och medicin när man selektivt exponeras för vissa ämnen. Så även om man får runt 25 000 resultat på Google Scholar är de flesta inom andra ämnen.

Listan med litteraturtips nedan är framför allt baserat på mitt eget godtycke, och mitt godtycke gillar (a) översiktsartiklar och meta-analyser, (b) historiska tillbakablickar med empiri för att få lite perspektiv på frågan, (c) teoretisk kritik och utveckling, samt (d) artiklar som är kritiska mot fenomenet (eftersom logik, genom modus tollens, innebär att empiriska påståenden som är falsifierade alltid är starkare än påståenden som är verifierade – allt annat lika – men litteraturen behandlas dock inte på det sättet på grund av publication bias där man tror att positiva resultat på något vis skulle vara ”bättre”).

Litteratur

Narrativa översiktsartiklar och meta-analyser om selektiv exponering, confirmation bias och motivated reasoning:

  • Cotton, J. L. (1985). Cognitive dissonance in selective exposure. In D. Zillmann & J. Bryant (Eds.), Selective Exposure to Communication (pp. 11–33). Hillsdale, N.J.: Lawrence Erlbaum Associates.
  • Hart, W., Albarracín, D., Eagly, A. H., Brechan, I., Lindberg, M. J., & Merrill, L. (2009). Feeling validated versus being correct: A meta-analysis of selective exposure to information. Psychological Bulletin, 135(4), 555–588. https://doi.org/10.1037/a0015701
  • Nickerson, R. S. (1998). Confirmation bias: A ubiquitous phenomenon in many guises. Review of General Psychology, 2(2), 175–220. https://doi.org/10.1037/1089-2680.2.2.175
  • Smith, S. M., Fabrigar, L. R., & Norris, M. E. (2008). Reflecting on Six Decades of Selective Exposure Research: Progress, Challenges, and Opportunities. Social and Personality Psychology Compass, 2(1), 464–493. https://doi.org/10.1111/j.1751-9004.2007.00060.x
  • Sweeny, K., Melnyk, D., Miller, W., & Shepperd, J. A. (2010). Information Avoidance: Who, What, When, and Why. Review of General Psychology, 14(4), 340–353. https://doi.org/10.1037/a0021288

Nedan följer empiriska artiklar med viktiga teoretiska bidrag. Garrett påpekar exempelvis att selektiv exponering har två dimensioner (söka upp information respektive undvika information) där undvikande är mycket svagare av de två. Tappin med kollegor skiljer på confirmation och desirability bias, det vill säga vad vi tror är inte nödvändigtvis detsamma som vad vi önskar, och där önskandet är det starkare av de två.

  • Garrett, R. K. (2009). Politically Motivated Reinforcement Seeking: Reframing the Selective Exposure Debate. Journal of Communication, 59(4), 676–699. https://doi.org/10.1111/j.1460-2466.2009.01452.x
  • Tappin, B. M., van der Leer, L., & McKay, R. T. (2017). The heart trumps the head: Desirability bias in political belief revision. Journal of Experimental Psychology: General, 146(8), 1143–1149. https://doi.org/10.1037/xge0000298

Tidigare översiktsartiklar om selektiv exponering (dessa är dock svårare att få tag på):

  • Freedman, J. L., & Sears, D. O. (1965). Selective Exposure. In Leonard Berkowitz (Ed.), Advances in Experimental Social Psychology (Vol. 2, pp. 57–97). New York: Academic Press.
  • Frey, D. (1986). Recent research on selective exposure to information. In L. Berkowitz (Ed.), Advances in Experimental Social Psychology (Vol. 19, pp. 41–80). San Diego, CA: Academic Press.
  • Sears, D. O. (1968). The Paradox of De Facto Selective Exposure Without Preference for Supportive Information. In R. P. Abelson, E. Aronsson, W. J. McGuire, T. M. Newcomb, M. J. Rosenberg, & P. H. Tannenbaum (Eds.), Theories of Cognitive Consistency: A Sourcebook (pp. 777–787). Chicago: Rand-McNally.

Specifikt om filterbubblor (Pariser och Sunstein är förespråkare, och delvis också Bennett och Iyengar):

  • Bennett, W. L., & Iyengar, S. (2008). A New Era of Minimal Effects? The Changing Foundations of Political Communication. Journal of Communication, 58(4), 707–731. https://doi.org/10.1111/j.1460-2466.2008.00410.x
  • Hannak, A., Sapiezynski, P., Molavi Kakhki, A., Krishnamurthy, B., Lazer, D., Mislove, A., & Wilson, C. (2013). Measuring Personalization of Web Search. In Proceedings of the 22Nd International Conference on World Wide Web (pp. 527–538). Republic and Canton of Geneva, Switzerland: International World Wide Web Conferences Steering Committee. Retrieved from http://dl.acm.org/citation.cfm?id=2488388.2488435
  • Pariser, E. (2011). The Filter Bubble: What the Internet Is Hiding from You. London: Viking.
  • Sunstein, C. R. (2001). Republic.com. Princeton, N.J.: Princeton University Press.
  • Zuiderveen Borgesius, F. J., Trilling, D., Möller, J., Bodó, B., de Vreese, C. H., & Helberger, N. (2016). Should we worry about filter bubbles? Internet Policy Review, 5(1). https://doi.org/10.14763/2016.1.401

Selektiv exponering och polarisering:

  • Stroud, N. J. (2010). Polarization and Partisan Selective Exposure. Journal of Communication, 60(3), 556–576. https://doi.org/10.1111/j.1460-2466.2010.01497.x
  • Trilling, D., Klingeren, M. van, & Tsfati, Y. (2017). Selective Exposure, Political Polarization, and Possible Mediators: Evidence From the Netherlands. International Journal of Public Opinion Research, 29(2), 189–213. https://doi.org/10.1093/ijpor/edw003

Notera att alla artiklar ovan inte framför allt handlar om internet eller tjänsterna på internet, utan främst om människor. Det finns flera anledningar till det. För det första kan internettjänsterna ändras inom loppet av fem minuter så alla specifika slutsatser i en studie blir meningslösa. Vem bryr sig till exempel om MySpace-forskning i dag? För det andra måste man ta hänsyn till människans psykologi och huruvida vi undviker information. Om vi inte gör det, innebär det att tjänsternas utformning har mindre betydelse än vad förespråkarna för filterbubblor påstår (deras argument bygger ju nämligen på att vi nästan uteslutande bara bekräftar våra övertygelser).

Forskare

Några inflytelserika forskare inom selektiv exponering som kan vara bra att hålla koll på:

  • Silvia Knobloch-Westerwick
  • R. Kelly Garrett
  • Natalie Stroud

Hoppas detta kan vara en bra väg in i litteraturen för er!

Filterbubblor finns och finns inte på samma gång (om man får definiera begrepp efter eget godtycke)

Någon säger att det är uppenbart att filterbubblor finns. Man behöver bara slänga ett öga i olika Facebookgrupper så ser man att människor tar del av olika information. Vi har inte samma vänner i våra Faceobookflöden, och därmed befinner vi oss i olika bubblor. Någon annan säger att människor inte undviker information på nätet som går emot deras övertygelser, vilket innebär att filterbubblor inte finns. En tredje hänvisar till Eli Parisers bok och att två identiska Googlesökningar kan ge helt olika sökresultat. Det är därmed uppenbart att filterbubblor finns.

Vem har då rätt?

Alla.

Om vi låter var och en definiera ord efter eget godtycke kan man förstås få vad som helst att vara sant: ”Gud är kärlek, kärlek finns, alltså finns Gud.” Enkelt. Använder man olika definitioner, får man också olika slutsatser.

I inlägget Därför är filterbubblan inte det vi borde prata om beskriver Anna Loverus, digital strateg och forskare i beteendevetenskap, detta problem och att filterbubblor ofta beskrivs felaktigt samt att det inte är det vi egentligen borde fokusera på:

Eftersom begreppet ofta väcker en intuitiv idé om vad det är så är det inte konstigt att folk hör det, och tror att de vet vad det är. Särskilt eftersom mycket av debatten handlar om huruvida det finns bubblor eller inte, känns det prioriterat att vi vet vad en bubbla är innan vi ger oss in i detta.

  1. Alla har sin egen filterbubbla. Själva definitionen av filterbubblor utgår från att två personer som är tillsynes väldigt lika får olika sökresultat på samma sökord. Men du delar inte din filterbubbla med andra människor.

Om syftet är att beskriva vad filterbubblor faktiskt är, så kan man omedelbart avfärda den definitionen eftersom inte ens Eli Pariser (som myntade begreppet!) håller med om den definitionen. I boken The Filter Bubble skriver han om personaliseringsalgoritmer (alltså inte specifikt sökmotorer) på sidan 9:

The new generation of Internet filters looks at the things you seem to like – the actual things you’ve done, or the things people like you like – and tries to extrapolate. They are prediction engines, constantly creating and refining a theory of who you are and what you’ll do and want next. Together, these engines create a unique universe of information for each of us – what I’ve come to call a filter bubble – which fundamentally alters the way we encounter ideas and information.

Vidare säger han inte alls att alla har sin egen filterbubbla, utan att det är en konsekvens som kan uppstå: ”the filter bubble introduces three dynamics we’eve never dealt with before: First, you’re alone in it” (s. 9). Cass Sunstein menar också att det kan leda till en ”Daily me” där alla nyheter skräddarsys efter en själv, utan tillstymmelse till någon oliktänkare. De andra två konsekvenserna är dels att filterbubblor är osynliga för användaren, och dels att man inte kan välja om man vill gå ur filterbubblan eftersom företagen vill tjäna mer pengar genom att öka personaliseringen. Men Facebook, Twitter och Google låter användarna välja själva, i varierande utsträckning, och frågan kvarstår därför om riktningen verkligen går åt mer, snarare än mindre, personalisering. Däremot är det möjliga konsekvenser som vi i allra högsta grad bör ta på allvar, i synnerhet den bristande transparensen.

Med andra ord pratar Pariser (samt Sunstein och övriga) om de demokratiska konsekvenserna personligt utformade tjänster kan ge. De gör med andra ord inte enbart den triviala observationen att tjänsterna är personligt utformade i varierande grad, utan ger också skäl för ett kausalt samband som de menar kommer (eller åtminstone kan) uppstå. Det är detta kausala samband jag tycker är intressant.

I bilden nedan visas det argument jag presenterade i föreläsningen på Internetdagarna, vilket utgår från framför allt Pariser och Sunstein men också vad andra forskare och förståsigpåare har påstått kommer hända. Jag argumenterar för att detta kedjeargument bryts redan på steg två.

Vidare skriver Anna Loverus:

I debatten om filterbubblor används ofta dagstidningen som exempel på att fenomenet inte är nytt eller att de inte finns. Du hade en socialistisk eller liberal morgontidning, kanske även en kvällstidning, och det var dina enda perspektiv. Men tidningsexemplet missar nästan alltid två aspekter när det används för att förklara att filterbubblor inte är något nytt:

  1. Du visste vilket perspektiv din tidning förmedlade, det var även något tidningen själv kommunicerade.
  2. Du kunde alltid gå och köpa ytterligare tidningar om du vill veta vilka perspektiv du inte fick.

Men dagens rekommendationsalgoritmer skiljer sig på båda dessa punkter:

  1. Du har ingen aning om varför just du får just de träffar som dyker upp när du letar viss information.
  2. Du kan inte ta reda på vilken information du hade fått om du varit någon annan.

De här två faktorerna i sig är varför vi började prata om filterbubblor över huvud taget.

Den andra punkten (”Du kan inte ta reda på vilken information du hade fått om du varit någon annan.”) stämmer inte nödvändigtvis, det är bara att öppna ett inkognito-fönster och söka på Google så försvinner oftast personaliseringen. Däremot vet jag naturligtvis inte vad andra har fått för personalisering eftersom det bygger på deras tidigare beteende. Men även om vi hade sökmotorer helt utan personalisering, vet jag ändå inte vad en annan person har sökt efter (eller vilka länkar de klickar på). Å andra sidan vet jag inte vilka böcker folk lånar på biblioteket heller. De kanske främst läser böcker som deras vänner har rekommenderat? Det är därför vi frågar vad folk faktiskt gör.

Inte ens Pariser själv tror på filterbubblor i den betydelsen

Anna Loverus igen:

När forskaren Peter Dahlgren står på Internetdagarnas konferensscen och pratar om att filterbubblor inte finns, argumenterar han genom att säga att vi har mer information att tillgå idag, än någonsin tidigare, och att vi kan mäta att folk får information från fler olika källor. Det stämmer. Men eftersom filterbubblor egentligen inte handlar om antalet perspektiv vi möts av blir det problematiskt när det måttet används som bevis för filterbubblor eventuella existens. Vi kan helt enkelt inte mäta huruvida filterbubblor finns genom att mäta antal nyhetssajter vi tar del av. Vi kan mäta huruvida filterbubblor finns genom att titta på vilken information som sorteras bort när folk försöker aktivt ta reda på hur något ligger till, och hur mycket två individers sökresultat varierar när de söker svar på samma fråga.

Det vore befängt om någon tror att antalet informationskällor en person tar del av är ett mått på huruvida ”två personer som är tillsynes väldigt lika får olika sökresultat på samma sökord”. Men vem är det som har påstått det? Inte jag i alla fall.

Vidare var det just det kausala sambandet som Pariser påstod, nämligen att filterbubblor leder till isolering, som motbevisas genom att hänvisa till att människor får fler perspektiv. Med andra ord, förekomsten av fler perspektiv på internet är ett kraftigt argument mot filterbubblor (antalet perspektiv är däremot inte, som Loverus verkar tro, ett mått på filterbubblors existens). Det erkänner till och med Pariser själv, som hänvisar just till hur folk använder andra medier:

What role do you think the filter bubble played in the election?

[…] In fact it’s still the case in 2016 that most Americans get their news from local TV news, according to Pew. So I actually think it’s very hard to attribute the results of this election to social media generally or the filter bubble in particular.

Och återigen, Pariser gör alltså inte den triviala observationen att personaliseringsalgoritmer kan ge viss information, men inte annan, när man söker på Google.

Även om allt vi gör på nätet leder till total personalisering, där alla ser helt olika saker trots identiska sökord eller utgångspunkter, innebär det inte nödvändigtvis att ”alla har sin egen filterbubbla” och därmed blir avskurna från resten av samhället då vi fortfarande kan ta del av andra medier. Därför är en individs hela mediediet viktig att ta i beaktande när man pratar om vilka (demokratiska) konsekvenser medier har. Pariser erkänner själv detta, och påpekar i intervjun i länken ovan att han överspelade sociala mediers betydelse.

För det är ingen konst att konstruera domedagsscenarier om man först får exkludera alla andra medier.

Det egentliga problemet

De är många som säger vad debatten eller problemet egentligen handlar om, samtidigt som de säger olika saker. Jag citerar här återigen vad Anna Loverus skrev, från föregående citat:

Men eftersom filterbubblor egentligen inte handlar om antalet perspektiv vi möts av blir det problematiskt när det måttet används som bevis för filterbubblor eventuella existens.

Det är lustigt med tanke på att Pariser hävdar raka motsatsen: ”Ultimately, democracy works only if we citizens are capabe of thinking beyound our narrow self-interest. But to do so, we need a shared view of the world we cohabit. We need to come into contact with other peoples’ lives and needs and desires. The filter bubble pushes us in the opposite direction – it creates the impression that our narrow self-interest is all that exists.” (s. 164)

Så här skrev däremot Jesper Åström, som jag citerade i Filterbubblor: 3 kommentarer – 3 svar:

Men problemet ÄR INTE utgången i det amerikanska valet, eller falska nyheter eller ens urvalet av information. Problemet ligger i att användare upplever extremer som majoriteter vilket gör att normen för vad som är rimligt i ett samhälle förskjuts. Då får extrema människor luft under vingarna.

Så vi har med andra ord tre olika personer (Loverus, Pariser och Åström) som hävdar vad det egentliga problemet med filterbubblor är, och vilka konsekvenser det får, men alla tre säger olika saker.

Samma sak sker när forskare berättar för oss vad vi egentligen vill veta från statistiska test, samtidigt som alla forskarna säger olika saker. Det hade varit mer rimligt att säga ”jag tycker att detta egentligen handlar om…”

Detta problem påtalade jag just i min föreläsning under termen concept creep (se bild 27 i presentationen), nämligen att begrepp utvidgats efterhand som de används, vilket också var anledningen till att jag presenterade det specifika argumentet jag kritiserade (baserat på bland annat Pariser och Sunsteins argument).

Sökningar och Facebookflöden är personliga redan från början

Jag kan också utveckla några ord om sökningar och till viss del Facebookflöden. Personaliserade sökningar på sökmotorer är i nuläget inte speciellt stort problem (ur ett demokratiskt perspektiv) av tre skäl:

  1. Sökningar är redan kraftigt styrda utifrån vad individen vill ha.
  2. Sökningar görs sällan om det som är gemensamt på samma sätt som nyhetskonsumtion. Det vill säga, blotta förekomsten av en sökning är redan i hög grad uttryck för något personligt.
  3. Man kan enkelt undvika personaliserad sök genom att öppna ett inkognito-fönster. (Däremot kan plats spela roll, sök exempelvis efter namnet på en restaurang när du är i en specifik stad.)

Det är sant att vi inte vet vad olika sökningar leder till för en specifik individ när sökresultaten är personaliserade, men det innebär förmodligen också att de inte var ute efter samma sak från början. Det vill säga, anledningen till att man använder en sökmotor är att man redan från början vill ha svar på en specifik fråga. Att prata om ”gemensam” kunskap eller information ter sig därför något paradoxalt när sökningar ofta syftar på det rakt motsatta. (Däremot accepterar jag det principiella problemet med en sökmotor som ger olika svar beroende på frågeställaren.)

Låt mig ta Eli Parisers eget Egypten-exempel, se Eli Parisers presentation (PDF). Två personer söker efter ”Egypten” och får olika resultat. Men söker vi oftast så? Nej, inte riktigt. Om du exempelvis vill åka på semester i Egypten och din kompis vill veta vad huvudstaden i Egypten heter kommer ni att skriva mer explicita sökningar, såsom ”Egypten pris flyg”, ”vad heter Egyptens huvudstad” eller bara ”Egypten huvudstad”. Detta faller alltså utanför det som många är intresserade utav, däribland jag själv, eftersom personalisering blir verkningslös när man använder specifika sökord snarare än det mångtydiga sökordet ”Egypten”. Det vill säga, ju mindre specifik sökfråga, desto mer kan Google använda dina tidigare beteenden för att ge resultat Google gissar att du vill ha. När du är mer specifik, desto mindre betydelse får personaliseringen. Och om sökningar redan i hög grad är personliga, borde inte heller en speciellt stor andel av sökningarna vara personaliserade.

En uppskattning bland 200 personer visar att ungefär 12 % av sökningarna som görs på Google är personaliserade (16 % för Bing), och det varierar beroende på sökord, plats och om man är inloggad eller ej. Så om denna siffra skulle kunna generaliseras, vilket är tveksamt på grund av urvalet och de få personerna, betyder det omvänt att 88 % av alla sökningar inte leder till isolerande filterbubblor.

Dessutom finns det inga skäl att anta att mitt Facebookflöde skulle stämma överens med någon annans flöde, eftersom vi inte har samma vänner till att börja med. Så personalisering specifikt på Facebook har förmodligen ringa betydelse just på grund av att människors mediediet i övrigt är bred, och dessutom verkar bli bredare med internet.

Huruvida människor isolerar sig mer och mer från information som går emot deras politiska övertygelser (vilket jag är intresserad av, inte personalisering av information i stort), kan därför inte enbart avgöras genom att hänvisa till förekomsten av recommender systems. Man måste även ta hänsyn till vad människor gör – vilken information de väljer och inte väljer – samt hur deras informationsmiljö i övrigt ser ut.

En semantisk ordlek

Så finns filterbubblor? Ja och nej. Om alla definierar begrepp efter eget godtycke (vilket man naturligtvis får!) så finns det och finns inte på samma gång, och det blir blott en semantisk ordlek. Utgår man från Parisers beskrivning så erkänner dock till och med Pariser att filterbubblor inte har speciellt stort stöd och hänvisar till andra mediers betydelse (däremot säger Pariser dock att filterbubblor kan ha andra konsekvenser än de som han själv hävdade inledningsvis). Och utgår man dessutom från det argument jag lade fram i bilden (som explicit rör samhällsfrågor och inte information i allmänhet) ovan börjar hålet i bubblan bli vidöppet.

Dessutom har jag inte ens sagt att filterbubblor inte finns, utan det är framför allt rubriker som journalister har satt på tidningsartiklar. Däremot skrev och sa jag ”Om filterbubblor inte finns, varför påstår medier det?” i min presentation för att aktualisera mediernas oförmåga att påvisa belägg för fenomen utan snarare antar dem som sanningar. Men jag är högt tveksam till att alla är lika intresserade av betingade sannolikheter som jag. Det är inte första gången jag blivit missuppfattad när jag presenterar kontingenta argument. Jag får nog försöka komma på något sätt att göra det svårare att missuppfatta.

Filterbubblor och faktaresistens – min föreläsning på Internetdagarna 2017

Häromdagen var jag på Internetdagarna 2017 och pratade på temat ”Filterbubblor och faktaresistens” tillsammans med några andra personer.

Du kan se videoklippet nedan, dryga 30 minuter. Här är några intressanta hållpunkter i videoklippet:

  • 0:40 Finns filterbubblor?
  • 5:50 Sverige är inte USA
  • 9:15 Viktig skillnad: att vi föredrar något betyder inte att vi undviker det motsatta
  • 9:38 Information sprids i flera steg
  • 14:00 Motivated reasoning: hur vi börjar med en slutsats och sedan söker stöd för den
  • 18:40 Argument allra mest polariserande
  • 19:20 Påverkansparadoxen
  • 19:55 Om filterbubblor inte finns, varför påstår medier det?
  • 25:00 Är selektiv exponering ett nytt fenomen?
  • 26:50 Vad vi bör göra

Du kan också följa med i Powerpoint-presentationen nedan där du också hittar referenser till de studier jag pratar om. Klicka på högerpilen för att hoppa till nästa bild så slipper du se videon en gång till. Källkoden till graferna (gjorda med ggplot i R) på bild nummer 22-23 finns att ladda ned på github.com/peterdalle/filterbubblor för den intresserade.

Olyckligtvis sa jag i inledningen att filterbubblor inte finns beskrivet i forskningslitteraturen, men jag menar naturligtvis att ordet filterbubblor sällan förekommer, mer än att hänvisa till populärkulturen eller mer generellt tala om filterbubblor som en tänkbar konsekvens av någonting. ”Selektiv exponering” är det begrepp som huvudsakligen använts och det är dels lite bredare och har dels använts sedan 1940-talet.

Lyssna också på min kollega, Ulrika Hedman, som pratar om ”fake news” och varför detta är ett problematiskt begrepp. Hon visar också en typologi över falska nyheter utifrån graden av sanningshalt och graden av vilseledning.

Har nazister rätt att demonstrera? Två experter säger nej, två andra ja. Vem ska man lita på?

Henry Ascher är professor och säger i artikeln Nazism är ett brott – inte en åsikt att nazism är brott mot de mänskliga rättigheterna och sakfrågan därmed är enkel, det är ett brott mot de mänskliga rättigheterna att ens låta nazister få demonstrera:

Att förvägra eller begränsa andra människors mänskliga rättigheter innebär alltså ett brott mot mänskliga rättigheter. Det är just detta som är kärnan i nazismen och högerextremismen. Därför bryter Bokmässans och Polisens beslut mot de mänskliga rättigheterna. Både i teorin och i praktiken.

En annan professor, Stefan Jonsson, säger också samma sak i artikeln Experter: Redan stöd att stoppa nazisterna:

Det finns redan idag stöd i lagen för att stoppa nazisterna och deras demonstrationer, anser en rad experter.
– Polisen är okunniga och principlösa och framstår som rent ryggradslösa, säger professor Stefan Jonsson.

Men det finns de som inte håller med.

Mårten Schultz, också professor, säger motsatsen i tv-inslaget Därför går det inte att stoppa nazistdemonstrationer.

I en annan artikel, Experterna svarar: Därför får nazisterna marschera, säger professor Eva-Maria Svensson följande:

Varför får nazister marschera?

– Demonstationsfriheten är långtgående. Man kan inte stoppa någon från att demonstrera bara för att de har en speciell åsikt, säger Eva-Maria Svensson.

Så inte ens experterna kan komma överens om nazister får demonstrera eller inte. Två experter säger ja, två andra experter säger nej.

Just det ja, jag glömde säga att Henry Ascher är professor i folkhälsovetenskap och barnöverläkare, medan Stefan Jonsson är professor i etnicitet. Eva-Maria Svensson är professor i rättsvetenskap, medan Mårten Schultz är professor i civilrätt.

Jag låter er läsare avgöra vem som är mest lämpad att uttala sig om juridiken i Sverige.

Medieforskare blir av med sin doktorsexamen

Enligt Retraction Watch så har Ohio State University sett till att en av deras tidigare doktorander har fått sin doktorsgrad tillbakadragen. En vetenskaplig tidskrift har nämligen dragit tillbaka en av hennes artiklar (samförfattad med hennes handledare) på grund av ”inkonsistens i datan”, vilket är ett förmildrande uttryck för något som inte har gjorts på ett korrekt sätt.

Det gäller artikeln ‘Boom, Headshot!?’: Effect of Video Game Play and Controller Type on Firing Aim and Accuracy som publicerades på nätet 2012 och som kom ut i tryck 2014. Artikeln argumenterade för att first-person shooter tv-spel förbättrar människors hanterande av riktiga vapen.

Men under 2015 hörde andra forskare av sig och ville titta på datan ifråga, eftersom de hade upptäckt ”inkonsistenser”. Men forskarna till artikeln kunde inte hitta datan, vilket är sannerligen misstänksamt.

Så här skriver Communication Research, tidskriften som drog tillbaka artikeln, om varför de dragit tillbaka den:

The editors of Communication Research, Drs. Gibbs and Knobloch-Westerwick, wish to issue a retraction of the article entitled ““Boom, Headshot!?”: Effect of Video Game Play and Controller Type on Firing Aim and Accuracy” by Jodi L. Whitaker and Brad J. Bushman.

This article was first published online on April 30, 2012 and in print in the October 2014 issue of Communication Research (issue 41, pp. 879-891) as doi:10.1177/0093650212446622. It should be noted that, to ensure impartiality, Dr. Knobloch-Westerwick was not involved in the preparation of this decision, because she is on the faculty at the same institution as the corresponding author. This retraction is in response to inquiries from Drs. Markey (Villanova U) and Elson (Ruhr U Bochum), in agreement with the corresponding author Dr. Bushman.

A Committee of Initial Inquiry at Ohio State University recommended retracting this article after being alerted to irregularities in some variables of the data set by Drs. Markey and Elson in January 2015. Unfortunately, the values of the questioned variables could not be confirmed because the original research records were unavailable. In 2016, Drs. Markey and Elson sent their report to Dr. Gibbs, one of the editors of Communication Research, who decided that a retraction was warranted. A replication of the study by Dr. Bushman is in review.

Här hittar man abstractet till originalstudien:

Video games are excellent training tools. Some writers have called violent video games “murder simulators.” Can violent games “train” a person to shoot a gun? There are theoretical reasons to believe they can. Participants (N = 151) played a violent shooting game with humanoid targets that rewarded headshots, a nonviolent shooting game with bull’s-eye targets, or a nonviolent nonshooting game. Those who played a shooting game used either a pistol-shaped or a standard controller. Next, participants shot a realistic gun at a mannequin. Participants who played a violent shooting game using a pistol-shaped controller had 99% more headshots and 33% more other shots than did other participants. These results remained significant even after controlling for firearm experience, gun attitudes, habitual exposure to violent shooting games, and trait aggressiveness. Habitual exposure to violent shooting games also predicted shooting accuracy. Thus, playing violent shooting video games can improve firing accuracy and can influence players to aim for the head.

Enligt Google Scholar har artikeln redan hunnit citerats 14 gånger sedan den publicerades 2012, bland annat i en översiktsartikel vilket förmodligen förvärrar situationen med tanke på att alla som läser översiktsartikeln förmodligen inte kommer att läsa tillbakadragandet av originalartikeln.

Det är som viskleken för forskning, och mängden myter som florerar inom forskning behöver på inga sätt vara mindre än utanför forskarsamhället därför att det som bekräftar vad forskare tror är också det som i högre utsträckning kommer i tryck.

Enligt Retraction Watch var handledaren omedveten om dessa inkonsistenser, och verkar inte ha fått några repressalier.

Retraction Watch bevakar tillbakadragna vetenskapliga artiklar inom akademin (det är många, många, många forskningsartiklar som dras tillbaka regelbundet) och har skrivit följande om forskaren ifråga:

Överdrifter och alarmism när medierna beskriver filterbubblor

Hur har medierna skrivit om så kallade filterbubblor? Dagens Nyheter och Svenska Dagbladet har sedan 2011 systematiskt beskrivit filterbubblor alarmistiskt och negativt, där algoritmer är onda och dolda medan journalistiken är god och transparent.

Det framkommer i en ny masteruppsats som Sofia Henriksson lade fram hos Stockholms universitet, vilken publicerades för två veckor sedan.

Henriksson har genomfört diskurs- och innehållsanalys med alla artiklar från DN och SvD som omnämner begreppet. Innehållsanalysen av totalt 83 artiklar visade bland annat att

  • 48 % av artiklarna beskriver filterbubblor som ett vedertaget begrepp som läsaren förutsätts känna till, exempelvis om begreppet nämns i förbifarten, eller att begreppet får en helt annan innebörd
  • 42 % av artiklarna är negativa
  • 31 % av artiklarna är alarmistiska
  • 6 % av artiklarna är positiva

Mediepanik

Hennes slutsats är att det finns en tendens till mediepanik bland artikelförfattarna i DN och SvD som skrivit om ämnet. Vidare skriver hon att:

Den alarmistiska och negativa diskursen har varit framträdande i rapporteringen sedan start från 2011 fram till 2017. […] I det empiriska materialet ger sig den negativa diskursen också i uttryck genom sarkastiska konnotationer kring filterbubblan. Där fungerar bubblan som ett omslutande och på vissa sätt inlåsande rum där det nästan enbart förekommer farliga och hotfulla åsikter. […] Den alarmistiska konnotationen där ord i materialet som hot, hat och terrorism förekommer står nästan helt utan att ifrågasättas i mediediskussionen kring filterbubblor.

Det förekommer väldigt sällan beskrivningar av hur algoritmerna faktiskt fungerar. Dessutom, människors ”individuella val att idag kunna bestämma vad denne vill konsumera tas inte med i diskursen”, vilket är anmärkningsvärt med tanke på att människors ökade valmöjligheter är en av grundsatserna som forskningen på området ifråga utgår ifrån.

Vi har alltså ett begrepp – filterbubbla – som beskriver hur både teknik och människa interagerar. Men medierna nämner sällan människans roll, och beskriver sällan hur tekniken fungerar. Det lämnar inte mycket kvar av begreppet, förutom som Henriksson påpekar: ”Medierna beskrev sällan den tekniska bakgrunden kring filterbubblan utan såg filterbubblan mest som ett hotfullt begrepp.”

I stället har filterbubblor ”ensamt [fått] ta ansvar för vem som valdes till USA:s president och att britterna valde att gå ur EU”, vilket innebär att diskussionen ”blir i dessa fall nästan för extremt”, enligt Henriksson.

Goda journalister, onda algoritmer

Några andra intressanta citat och observationer från uppsatsen:

  • I artiklarna ”hyllas journalisters sätt att sortera innehåll, medan den enbart algoritmstyrda sorteringen i sociala medier svartmålas på grund av brist på transparens.”
  • Henriksson menar att journalister ”förflyttar definitionen av filterbubblor till att de endast kan förekomma på andra plattformar än sina egna, gör dem det möjligt att kunna kritisera filterbubblorna på ett onyanserat sätt”
  • Journalister beskriver det som att de sorterar information medan algoritmer manipulerar sökresultaten och sociala medier. Men massmediers egna förstasidor styrs också av algoritmer samtidigt som journalisterna lägger ut nyheter på sociala medier.
  • Vidare beskrivs filterbubblor som att de ”aktivt hindrar journalister från att skapa demokratiskt material och bidra till ett fritt samhälle. Facebook beskrivs som laglöst och gränslöst där pedofiler och högerextrema får härja fritt och även gynnas av algoritmer […] Journalistiken beskrivs däremot med ord som hederligt och trovärdigt”.

Jag intervjuades för övrigt av Dagens Nyheter på telefon där jag påpekade att beskrivningarna av filterbubblor var tämligen överdriven i nyhetsmedierna. Jag kom inte med i artikeln.

Jag finner det tämligen ironiskt att journalister som skriver om falska nyheter eller filterbubblor inte är intresserade av att lyfta fram vare sig fakta eller andra synsätt. Det saknas nu bara artiklar om faktaresistens som ignorerar de omständigheter där människor tar till sig fakta.

Läs mer

Referens

Henriksson, S. (2017). Med nålen mot filterbubblan: En diskursanalys av DN:s och SvD:s användning av begreppet filterbubbla. Stockholms universitet. http://www.diva-portal.org/smash/record.jsf?pid=diva2:1107037

De snabbast växande orden i två miljoner nyhetsrubriker under tre år

Vilka ord har ökat och minskat i bruk bland drygt två miljoner nyhetsrubriker från 2014 till 2017? I den här analysen har jag tagit nyhetsrubriker som är insamlade från början av 2014 till och med juni 2017 för att se vilka ord som förekommit mest och vilka som har snabbast ökat i popularitet.

Vilka ord har ökat mest på kortast tid? Kanske inte så förvånande är Donald Trump väldigt omskriven, precis som på Twitter. Lika lite förvånande är det ett väldigt fokus på USA och Storbritannien.

Men intressant nog verkar också vanlig lokal nyhetsvärdering öka relativt mycket, apropå ”trafikolycka” och ”singelolycka”.

Se också de snabbast sjunkande orden.

Tittar man på de ord som ökade mest under 2015 så är det ”flyktingar”, vilket jag satt i relation till ”migrationer” respektive ”nyanlända”. Av grafen att döma verkar de svenska medierna nästan unisont börja skriva om flyktingar vid samma tillfälle, därav den vertikala ökningen av texter.

De här graferna har jag mest gjort för skojs skull, men jag tänker mig att denna typ av analyser kan vara en förhållandevis enkel början till att forska om agenda-sättning. Över lång tid ger de här analyserna väldigt intressant information jämfört med de korta nedslag som ofta görs i forskningen.

Mer intressant, tror jag, är att de också också kan användas för att identifiera var man bör starta sin undersökning (eftersom de är helt induktiva), snarare än att hipp som happ sätta upp sitt blöta finger i luften för att mäta vart vinden blåser.

Den fullständiga analysen har jag som vanligt lagt upp på GitHub där du hittar både källkod och länkar till datan som du kan ladda ned. Kom gärna med förslag på hur det kan göras annorlunda.

Fler analyser

Här är några andra analyser jag gjort i R med framför allt öppna data:

Big data i medieforskning

Att bara analysera rubriker går bra på en vanlig laptop. Det var inga svårigheter att ladda in en miljon rubriker i minnet. Vid två miljoner rubriker började datorn gå på knäna. R tog 11 gigabyte i anspråk för att köra unnest_tokens för att skapa en vektor på drygt 5,1 miljoner ord mappat till nyhetsrubrikerna.

Framöver behövs mer datorkraft för analyser av hela brödtexten, kanske med hjälp av Apache Spark som jag använt tidigare. Dock ska jag testa om bigmemory i R kan fungera eftersom den, vad jag förstår, genomför analysen på disken snarare än i minnet. Det går lite långsammare, men om man sysslar med forskning så är allt redan långsamt.

RMarkdown

Dokumenten i listan med länkarna ovan är gjorda med hjälp av RMarkdown, ett sätt att blanda källkod i valfritt språk, bilder, text och… tja, allt man kan tänka sig. Även om RMarkdown är skapat för språket R fungerar även andra språk och jag har exempelvis skrivit Python-kod i RMarkdown som jag använde som presentation under en lektion i web scraping. Det går med andra ord utmärkt att exportera till Powerpoint, Word, hemsidor eller PDF.

Det är ett behändigt sätt att paketera sina analyser. Steget från källkod till presentation blir minimalt, och det är också varför den brittiska regeringen valt att satsa på RMarkdown.

Jag tror detta kommer bli vanligare i framtiden. I stället för att presentera ett begränsat antal analyser på ett lika begränsat antal sidor så kan man dokumentera hela sin process för att låta andra upptäcka hur tankeprocessen har gått till, och även se resultat man kanske borde följa upp. Detta kan sedan bifogas till artikeln i ett appendix så att man kan se diagram och källkod tillsammans.

Frågan är vilken tidskrift som blir först med kräva att analyserna i Markdown bifogas till varje artikel? Stata 15 har ju också kommit ut med Markdown så R är ju knappast något krav längre.

5 intressanta föreläsningar du bör se

Internet är fantastiskt. Om man inte kan närvara på en konferens kan man alltid se de intressanta föredragen i efterhand eftersom de ofta spelas in och läggs på nätet. Här har jag därför samlat några intressanta föreläsningar jag sett och rekommenderar.

1. Reproducerbarhet i vetenskap

Brian Nosek, professor i socialpsykologi, pratar om hur man man kan öka reproducerbarheten inom vetenskap samt praktiska råd för hur man kan göra.

2. Vetenskapskommunikation och kriskommunikation

Hur både journalister och forskare kan minimera att vetenskapen förvanskas när den sprids i massmedierna, med Kathleen Hall Jamieson, professor i kommunikation.

3. Faktaresistens och motivated reasoning

Åsa Wikforss, professor teoretisk filosofi, pratar om motivated reasoning och hur våra motivationer kan påverka vad vi väljer att tro på. Video från Fjärde uppgiften.

4. Psykologin bakom konspirationsteorier

Varför tror folk på konspirationsteorier? Psykologen Rob Brotherton beskriver hur vi alla är intuitiva konspirationsteoretiker men att vissa är bättre (eller sämre) på att resonera än andra.

5. Könsskillnader mellan kvinnor och män

Debatt mellan Steven Pinker och Elizabeth Spelke, båda professorer i kognitionspsykologi, om könsskillnader mellan kvinnor och män.