• No results found

5. Analyse weerbaarheid middels sociale media

5.6 Automatische bottom-up analyse

Het uiteindelijke doel is om te komen tot een methode waarmee relatief eenvoudig, op automatische, betrouwbare en niet-subjectieve wijze de weerbaarheid in de Nederlandse samenleving kan worden gemeten. De handmatige inhoudsanalyse zoals hierboven

beschreven is inhoudelijk de meest betrouwbare wijze om te meten. Het probleem is echter dat deze methode behoorlijk arbeidsintensief is en daarmee kostbaar. Om die reden streven we naar een automatische inhoudsanalyse op basis van relevante zoektermen. De handmatige inhoudsanalyse heeft daar aan bijgedragen. Daarnaast hebben we gebruik gemaakt van een bottom-up analyse met behulp van Latente Dirichlet Allocatie (LDA) van de 149.394

posts/berichten. Deze methode kan gezien worden als het andere uiterste ten opzichte van de handmatige inhoudsanalyse (Blei & Jordan, 2003).

De LDA-methode werkt als volgt: alle teksten die we willen doorzoeken worden in de computer geladen, in dit geval betreft dit dus de berichten/posts op Marokko.nl in de vooraf bepaalde periode. De computer analyseert per bericht/post hoe vaak een woord daarin voorkomt en maakt per bericht een woordenlijst aan. Deze woordenlijst wordt daarna

gereduceerd tot een lijst van lemma’s (woordstammen) aan de hand waarvan per lemma wordt bekeken hoe vaak deze voorkomt in het bericht. Vervolgens wordt berekend welke woorden vaak tegelijkertijd voorkomen in de berichten. Deze woorden kunnen we vervolgens

analyseren en ook gebruiken voor een automatische inhoudsanalyse op basis van zoektermen, de top-down automatische kwantitatieve inhoudsanalyse. De gevonden woorden vormen samen een cluster, oftewel een (deel)onderwerp, in de berichtgeving.

Deze bottom-up analyse over de berichten/posts op Marokko.nl resulteerde in een 25-tal subtopics die voorkomen in de data, dat wil zeggen, de specifieke onderwerpen binnen de frames waar de discussies over gaan. Van deze 25 subtopics zijn we vervolgens nagegaan in hoeverre het onderwerpen betreffen die relevant zijn voor het onderzoek. In totaal konden er vijf clusters worden geduid, en dit zijn ook de belangrijkste topics op het forum, die

betrekking hebben op:

1. De leer van het geloof, 2. De praktijk van het geloof,

3. Het al dan niet geloven, 4. De profeet,

5. Het huwelijk.

Deze topics geven we in onderstaande Figuur 5.5. weer over de tijd, waarbij per maand wordt weergegeven hoe vaak de verschillende topics voorkomen. Op de Y-as staat de mate waarin het woord-cluster gemiddeld voorkomt in die maand ten opzichte van de andere clusters (het totaal van de 25 clusters is steeds 100% per maand).

Figuur 5.5. Aanwezigheid van de Verschillende Geloof-Gerelateerde Subtopics in de Posts op Marokko.nl per Maand

Figuur 5.5. laat zien dat het in de discussies veelal gaat over de leer van de islam en de islam in de praktijk. Een duidelijk voorbeeld hiervan is de discussie die ontstaat onder het kopje “Het verschil tussen salafi-manhadj en salafi-sekte.” Het praktiseren van de islam (‘de praktijk’) komt vooral naar voren in discussies waarbij mensen hulp vragen aan mede-gelovigen. Een voorbeeld van deze discussie: “Ik heb geen zin meer om te leven door mijn nadelen/ziektes ik vraag om steun”. Het cluster ‘profeet’ gaat vooral om de Hadith die de profeet heeft achtergelaten voor de moslims, terwijl het in de discussies rond het cluster ‘huwelijk’ vooral gaat over het aantal vrouwen dat een gelovige man mag hebben en wat de

0 1 2 3 4 5 6

Leer vd Islam Geloven/ongelovigen Profeet Huwelijk Islam in de praktijk

rol van de vrouw in een modern huwelijk is of kan zijn. In het cluster ‘gelovigen en

ongelovigen’ gaat het om de discussie wat gelovigen wel en niet mogen, zoals “Het oordeel omtrent vlees (Halal/Haraam)”. Dit cluster vertoont ook veel overlap met bijvoorbeeld de discussies over ‘de islam in de praktijk’.

Voor ons onderzoek naar ‘weerbaarheid’ hebben we ons echter vooral gericht op een vijftal clusters die te maken hebben met (inter)nationale politieke ontwikkelingen:

1. Marokko, 2. IS, 3. Racisme, 4. Gaza-oorlog, 5. Syrië.

Deze geven we weer in Figuur 5.6. Figuur 5.6. laat zien dat deze topics in vergelijking met de hierboven genoemde topics aanzienlijk minder voorkomen. Het gemiddelde aandeel van deze topics schommelt per maand tussen de 0,5% en 2,5% ten opzichte van de overige topics zoals die in eerste instantie zijn onderscheiden (25 in totaal).

Figuur 5.6. laat tevens zien dat in de eerste maanden van de analyse-periode (nu ruim een jaar geleden, voordat er sprake was van videoboodschappen met onthoofdingen van Westerse journalisten), vooral het cluster dat samenhangt met discussies over ‘racisme’ opkomt (groene, lang onderbroken lijn). Dit cluster is in de afgelopen maanden ook weer zichtbaar toegenomen op het forum. Het gaat hierbij vooral om de discussie over Zwarte Piet, waarbij er ook veel gesproken wordt over racisme in Nederland. Door veel schrijvers op Marokko.nl wordt dat zo ervaren, zoals te lezen valt in de post “VN duidelijk: Zwarte Piet is racistisch.”

De clusters ‘Syrië’ (roze stippellijn) en ‘Gazaoorlog’ (paarse doorlopende lijn) komen respectievelijk in de maand mei en juni op (zie ook Figuur 5.1.), waarbij de discussie over Syrië voort blijft duren. Het cluster waarin ‘IS’ centraal staat (rode doorlopende lijn) is minder prominent aanwezig, maar is wel iets sterker aanwezig in de discussies van de laatste maanden in de Figuur, vooral na berichten over Nederlandse betrokkenen (“Nederlanse jihadisten in top Islamitische Staat”).

Figuur 5.6. Aanwezigheid van de Verschillende Politiek-Gerelateerde Subtopics in de Posts op Marokko.nl per Maand

Figuur 5.7. geeft de ‘word clouds’ per cluster weer; de woorden die het grootst gedrukt zijn en centraal staan in de word cloud zijn de woorden die het meest dominant zijn in een gegeven cluster. De naamgeving per cluster is hierop gebaseerd.

Toegevoegde waarde van de topic modeling

Deze zogenoemde topic modeling laat zien wat de grote bewegingen op het forum zijn wat topics betreft. De toe- en afname van de discussies rondom een specifiek topic is in grote lijnen te volgen zonder dat daarbij de specifieke inhoud van de discussie zichtbaar is. Wel geven de word clouds een indicatie van de woorden die worden gebruikt in de discussie rondom een topic. Deze hebben we gebruikt voor de kwantitatieve automatische

inhoudsanalyse die we in de volgende paragraaf nader bespreken. 0 0,5 1 1,5 2 2,5 3

Marokko IS Racisme Gazaoorlog Syrie

Figuur 5.7. Word Clouds van de Vijf Subtopics in de Discussies op Marokko.nl