• No results found

Traden met Twitter : handelsstrategieën gebaseerd op twittervolume, -sentiment en -events

N/A
N/A
Protected

Academic year: 2021

Share "Traden met Twitter : handelsstrategieën gebaseerd op twittervolume, -sentiment en -events"

Copied!
24
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Faculteit Economie en Bedrijfskunde, Amsterdam School of Economics Bachelorscriptie en Afstudeerseminar Econometrie

Traden met Twitter

Handelsstrategieën gebaseerd op twittervolume, -sentiment en -events

door Calvin Venema (10810064) 26-juni-2018

begeleid door: dr. Bram Wouters

Abstract:

In dit onderzoek is de potentie van handelsstrategieën gebaseerd op twittervariabelen onderzocht met data voor de 30 bedrijven die samen de DJIA-index vormen. Er zijn strategieën getest op basis van twittersentiment, -volume en -events. De strategie geba-seerd op sentiment is het meest bruikbaar gebleken met het hoogste behaalde rendement en de meeste significante verbanden. De andere twee variabelen blijken niet geschikt om aan de basis te staan van een strategie.

(2)

This document is written by Student Calvin Venema who declares to take full re-sponsibility for the contents of this document.

I declare that the text and the work presented in this document are original and that no sources other than those mentioned in the text and its references have been used in creating it.

The Faculty of Economics and Business is responsible solely for the supervision of completion of the work, not for the contents.

(3)

Inhoudsopgave

1 Inleiding 4

2 Theoretisch Kader 5

2.1 Overview . . . 5

2.2 Het effect van Twitter op de financiële markt . . . 6

2.3 Volume versus sentiment . . . 7

2.4 Strategieën . . . 9 3 Data en Methode 10 3.1 Marktdata . . . 10 3.2 Twitterdata . . . 12 3.3 Events . . . 13 3.4 Werkwijze . . . 14 3.5 Strategie . . . 14 4 Resultaten 15 4.1 Volume . . . 15 4.2 Sentiment . . . 16 4.3 Events . . . 18 4.4 Rendementen . . . 19 5 Conclusie 20

(4)

1

Inleiding

Door de explosieve groei in het gebruik van het internet de afgelopen jaren is er een enorme hoeveelheid nuttige data beschikbaar voor onderzoek. De drie voornaamste bronnen van webdata zijn online nieuws, zoekmachine-opdrachten en sociale media. Omdat het internet tegenwoordig is uitgegroeid tot een primaire bron van informatie voor alle soorten topics, leggen deze datasets op een unieke manier collectief gedrag, interesses en stemmingen vast van een groot deel van de populatie. Ranco et al. (2015, p.2) stellen dat grote marktverschuivingen en in het ergste geval een financiële crisis vaak het gevolg zijn van collectief gedrag van investeerders. Als het mogelijk is om met dit soort datasets te anticiperen op een mogelijke crisis kan dit van specifiek belang zijn voor beleidsmakers van zowel bedrijven als regeringen, aldus Ranco.

De mogelijkheden van onderzoek op dit gebied zijn eindeloos. Zo is er een on-derzoek dat een verband vindt tussen het aantal bezoekers van financieel gerelateerde Wikipediapagina’s en bewegingen van de aandelenmarkt (Moat et al., 2013). Het is bijvoorbeeld ook mogelijk om merkpopulariteit te onderzoeken met behulp van sociale media. Dit onderzoek focust zich op de sociale media en in het bijzonder op Twit-ter, omdat het bij sociale media goed mogelijk is de stemming van de gebruikers te interpreteren.

De relatie tussen twitteractiviteit en de financiële markt kan dan op verschillende manieren worden geanalyseerd. Met machine learning is het tegenwoordig mogelijk om de inhoud van de berichten te interpreteren en te classificeren als bijvoorbeeld goed, slecht of neutraal. Zo kan er niet alleen gebruik worden gemaakt van het volume aan Tweets als variabele, maar er kan ook gebruik worden gemaakt van de sentimenten van de berichten. Uit onderzoek blijkt dat het gebruik van sentimenten een betere optie is dan slechts het gebruik van Twittervolume als variabele. Zo vinden Sprenger et al. (2014) een betere correlatie met de aandelenmarkt bij het gebruik van sentimentendata dan bij het gebruik van volumedata. Ook kan er onderscheid gemaakt worden in het tijdsframe van het onderzoek. De data kan verdeeld worden in uren of in dagen. Zo maken Zheludev, Smith en Aste (2014) gebruik van een urenverdeling en onderzochten of een verschuiving in de sentimentendata leidende informatie bevat over de aandelen-markt. Sprenger et al. (2014) maken gebruik van een dagenverdeling. Wat beter is, is nog onduidelijk.

Deze eerder genoemde onderzoeken hebben zich vooral gericht op de correlatie tussen twitteractiviteit en de financiële markt. Een vraag die menig zakenman zich zal stellen is of het mogelijk is dit verband te gebruiken om geld te verdienen. Echter, onderzoek naar praktische applicaties van deze relatie is nog weinig gedaan. Het doel van dit onderzoek is dan ook om dit verband in de praktijk te brengen door te onderzoeken in hoeverre het mogelijk is een handelsstrategie op basis van Twitter te formuleren

(5)

waarmee de marktindex kan worden verslagen en welke strategie het beste werkt. Er wordt gebruik gemaakt van Twitterdata met betrekking tot de dertig bedrijven die de Dow Jones Industrial Average (DJIA) index vormen. Deze data wordt geanalyseerd met behulp van tijdreeks-analytische technieken en een sentimentenanalyse.

De rest van dit onderzoek is als volgt gestructureerd. In de volgende sectie wordt de theorie behandeld. In sectie 3 wordt de opzet van het onderzoek besproken. Sectie 4 bevat de resultaten van het onderzoek en in sectie 5 worden deze geanalyseerd. Sectie 6 bevat de conclusie.

2

Theoretisch Kader

Deze sectie bespreekt waarom Twitter gebruikt wordt om de aandelenmarkt te voor-spellen en op welke manier. Er worden gerelateerde onderzoeken besproken. De opbouw van deze sectie is als volgt. Allereerst wordt kort behandeld welke drie bronnen van web-data gebruikt kunnen worden voor onderzoek met betrekking tot de aandelenmarkt op basis van online data. Ten tweede wordt besproken waarom twitteractiviteit een nuttige variabele is voor het voorspellen van aandelenprijzen. Vervolgens wordt ingegaan op de twee scholen van onderzoek met betrekking tot twitteractiviteit en de financiële markt. De ene school maakt gebruik van het twittervolume. De andere school gebruikt het twittersentiment. Daarna worden verschillende gebruikte handelsstrategieën behandeld en tot slot wordt besproken hoe het te gebruiken model eruit gaat zien.

2.1

Overview

Zoals eerder besproken zijn er drie typen bronnen van webdata die gebruikt kunnen wor-den voor onderzoek naar de relatie met financiële markten. Zoekmachine-opdrachten en online nieuws zijn er twee van. Zo kunnen veranderingen in het volume van zoekop-drachten op google met financieel gerelateerde termen een vroeg waarschuwingssignaal zijn voor bewegingen in de aandelenmarkt (Preis, Moat, & Stanley, 2013) en kan online nieuws gebruikt worden voor het voorspellen van de bewegingsrichting van sommige aandelen (Uhl, 2014). Als derde is er nog de sociale media. Uit onderzoek is gebleken dat ook sociale media nuttig is voor het voorspellen van de bewegingsrichting van de aandelenmarkt (Bollen, Mao, & Zeng, 2011). In veel van de onderzoeken waar sociale media wordt gebruikt als bron van data wordt gebruik gemaakt van Twitter, evenals in dit onderzoek. De reden voor deze keuze wordt toegelicht in de volgende paragraaf.

(6)

2.2

Het effect van Twitter op de financiële markt

Eerdere onderzoeken op het gebied van het verband tussen de financiële markt en nieuwsberichten maakten vooral gebruik van nieuwsberichten van de zakelijke pers en stock message boards. Omdat dit onderzoek gebruikmaakt van twitterdata is het van belang om Twitter te bespreken als platform voor financiële informatie. Uit recente onderzoeken is al gebleken dat twitterdata een significante hoeveelheid informatie bevat over bepaalde indicatoren van de financiële markt, zoals handelsvolume en volatiliteit. Op basis van deze onderzoeken stellen Sprenger et al. (2014) dat Twitter gezien kan worden als een informatie-intermediair, omdat het nieuwe informatie creëert, bestaande informatie samenvoegt en dit ook verspreidt. Twitter kan in deze zin vergeleken worden met andere informatie-intermediairs, zoals de zakelijke pers en stock message boards. Er is echter wel een aantal belangrijke verschillen, aldus Sprenger et al.

Volgens Sprenger et al. (2014) heeft het gebruiken van de zakelijke pers voor dit type onderzoek een aantal nadelen. Zij stellen dat professionele nieuwsbureaus niet altijd reflecteren wat investeerders belangrijk vinden. Bovendien is het aantal auteurs dat een nieuwsartikel publiceert beperkt en worden bepaalde bedrijven maar sporadisch genoemd. In tegenstelling tot Twitter, waar iedereen nieuwe informatie kan creëren en verspreiden. Verder dient Twitter ook als relais voor kleinere nieuwsitems, waar de zakelijke pers alleen verslag doet van grote items. Zij stellen dat investeerders en aandelenprijzen niet alleen reageren op groot nieuws, maar dat zij ook elke dag reageren op de ontvangst van verschillende vormen van nieuwe informatie. Op basis hiervan draagt Twitter bij aan een veel uitgebreidere en meer zeggende database dan de zakelijke pers.

Verder bespreken zij nog een belangrijk verschil met stock message boards. Op deze fora worden de berichten gecategoriseerd per bedrijf. Daardoor is het mogelijk dat gebruikers groot nieuws missen over een bedrijf, omdat zij niet specifiek op zoek zijn naar nieuws over dat bedrijf. Bij Twitter daarentegen worden de gebruikers via de tijdslijn blootgesteld aan recente informatie over alle bedrijven en wordt er regelmatig gereageerd. Dit zorgt voor een beter beeld van wat gezien wordt als nieuws vanuit het perspectief van de investeerder.

Behalve deze verschillen bespreken Sprenger et al. (2014) ook twee theorieën over hoe de media van invloed is op het gedrag van investeerders. Dit zijn de information view en de salience view. Volgens de information view vermindert de media de kosten van het zoeken naar informatie en stelt zo investeerders in staat hun besluitvorming te verbeteren. Zo leidt het gebruik van Twitter door bedrijven bijvoorbeeld tot een ver-mindering van informatie asymmetrie (Blankespoor, Miller, & White, 2013; aangehaald in Sprenger et al., 2014, p. 797).

(7)

in een bepaalde richting wordt gestuurd. Zo heeft de hoeveelheid media-aandacht voor een bepaald bedrijf bijvoorbeeld invloed op de vraag naar de aandelen daarvan. Uit onderzoek is gebleken dat er meer vraag is naar aandelen van bedrijven als deze veel media-aandacht krijgen (Solomon, Soltes, & Sosyura, 2012; aangehaald in Sprenger et al., 2014, p. 797). Een ander onderzoek concludeert dat stock message boards gebruikt kunnen worden om investeerders te manipuleren (Sabherwal, Sarkar, Zhang, 2011; aangehaald in Sprenger et al., 2014, p. 797).

Twitter lijkt een goede bron van data voor dit onderzoek, omdat Twitter eerder het perspectief van de investeerder aanneemt dan het professionele nieuwsperspectief. Dit is belangrijk, omdat de collectieve stemming en daarmee collectief gedrag van invloed is op de markt. Er zijn twee mogelijke manieren besproken hoe Twitter de financiële markt kan beïnvloeden. Het is echter onduidelijk of Twitter dat doet in overeenstemming met de information view of de salience view. Sprenger et al. (2014) stellen dat Twitter investeerders zowel kan informeren als hun aandacht kan laten vestigen op bepaalde factoren in de financiële markt. Zij geven twee voorbeelden. Wanneer een bedrijf veel in de media voorkomt, dient Twitter als een informatierelais. Wanneer dit niet het geval is, kan Twitter gebruikt worden om de aandacht van investeerders te richten op het financiële instrument in kwestie.

De achterliggende theorie over het effect van Twitter is nu besproken. De volgende paragraaf richt zich op de twee scholen van onderzoek met betrekking tot Twitter en de financiële markt.

2.3

Volume versus sentiment

Zoals eerder besproken zijn er twee richtingen van onderzoek met betrekking tot de invloed van de Twitter op de financiële markt. De eerste maakt gebruik van het twit-tervolume. Veel onderzoeken vinden een correlatie tussen het volume aan tweets en de financiële markt. Zo vinden Mao et al. (2012) een significante correlatie tussen het dagelijkse twittervolume en Standard Poor 500 (S&P500) aandelenindex. Ook conclu-deren zij dat het twittervolume in een autoregressief model gebruikt kan worden voor het voorspellen van de beweegrichting van de indexprijs.

De andere school van onderzoek richt zich op het gebruik van het sentiment van de twitterdata. Sprenger et al. (2014, p. 794) stellen dat het gebruik van het sentiment van een nieuwsbericht misschien wel de belangrijkste eigenschap is in relatie tot een bepaald aandeel.Uit veel onderzoeken blijkt dat het gebruik van een sentimentanalyse erg nuttig kan zijn voor het voorspellen van bewegingen van de aandelenmarkt. Zo vinden Bollen, Mao en Zeng (2011) een 86.7 procent nauwkeurigheid bij het voorspellen van stijgingen of dalingen van de DJIA-indexwaarde met het gebruik van sentimenten. Een ander onderzoek richt zich op de vraag of twitterdata leidende informatie bevat

(8)

over de S&P500-indexwaarde (Zheludev, Smith, & Aste, 2014). Zij concluderen dat het twittersentiment een aanzienlijke hoeveelheid extra leidende informatie bevat over deze indexwaarde dan alleen het twittervolume.

Sprenger et al. (2014, p. 819) merken op dat het effect van positief en negatief nieuws assymetrisch is. Het effect van negatief nieuws is vaak groter dan van positief nieuws. Een mogelijke verklaring voor deze assymetrie is dat mensen verliesavers zijn. Dat wil zeggen dat iemand meer waarde hecht aan het verliezen van een bepaald bedrag dan het missen van een kans om datzelfde bedrag te verdienen (Moat et al., 2013, p. 5). Een gevolg hiervan is dat de reactie op negatieve informatie vaak sterker is dan op positieve informatie. Sprenger et al. vinden dan ook een meer genuanceerd effect van positief geclassificeerde tweets dan van negatief geclassificeerde tweets. Zij geven als mogelijke oorzaak dat positief nieuws eerder uitlekt en dat negatief nieuws daardoor meer als een verassing komt, wat weer zorgt voor een groter effect op de markt.

Bij het gebruik van sentimenten zijn er nog verschillende mogelijkheden. Er zijn namelijk veel verschillende programma's en manieren voor het classificeren van de data. Het is bijvoorbeeld mogelijk de data te classificeren als positief, negatief of neutraal met het programma Opinionfinder, maar een uitgebreidere classificatie kan ook. Met het programma Google-profile of Mood states is het mogelijk om te classificeren in zes dimensies: kalm, alert, zeker, vitaal, welwillend en blij. Bollen, Mao en Zeng (2011) maakten in hun onderzoek gebruik van beiden programma's en concluderen dat de dimensie kalm in het bijzonder een duidelijk effect heeft op de DJIA-indexwaarde.

Het is ook mogelijk om gebruik te maken van zowel het volume als het sentiment van de data. Ranco et al. (2015) gebruiken het twittervolume om bepaalde bedrijfsspecifieke gebeurtenissen te detecteren. Behalve de te verwachten events, zoals kwartaalberichten, detecteren zij ook de kleinere minder voor de hand liggende events. Vervolgens krijgen deze events een polariteit toegeschreven met behulp van een sentimentanalyse. Zij vinden een significant verband tussen het twittersentiment en abnormale rendementen van de DJIA-index ten tijde van deze events. Zij concluderen dat de sentimentpolariteit de richting bepaalt van het rendement. Positief dan wel negatief en ook dat het grootste deel van dit rendement te halen is op de dag van het event.

De twee verschillende scholen van onderzoek zijn besproken. Er is een duidelijk significante correlatie tussen twitterdata en de financiële markt. Een aantal onderzoeken stellen dat het gebruik van het sentiment van de data betere resultaten geeft dan het gebruik van het volume. Er zijn ook onderzoeken die beide combineren. Een belangrijk resultaat van beide scholen is dat twitterdata gebruikt kan worden voor het voorspellen van bepaalde aandelen en indexen. Dit betekent dat het mogelijk is een handelsstrategie te formuleren op basis van dit verband. De volgende paragraaf gaat in op een aantal toegepaste strategieën en de resultaten daarvan.

(9)

2.4

Strategieën

Er is nog weinig onderzoek gedaan naar handelsstrategieën op basis van Twitter. Daarom bespreekt deze paragraaf ook strategieën gebaseerd op andere online data. De meeste onderzoeken gebruiken een eenvoudige strategie. Ze gaan dan wel long dan wel short op een aandeel of index. Echter, de eenvoud van de methodiek verschilt.

Allereerst waren er Tetlock, Saar-Tsechansky en Macskassy (2008) die gebruik maak-ten van nieuwsartikelen van de Wall Street Journal en de Dow Jones News Service om rendementen te voorspellen van individuele bedrijven van de S&P500-index. Zij ge-bruikten een eenvoudige methode per bedrijf. Was het nieuwssentiment positief, dan gingen zij long. Was het negatief, dan gingen zij short. Er werd elke dag gehandeld en na één dag werd de positie gesloten. Zij vonden een significante winst rond de twintig procent, maar deze winst zou negatief worden door het meerekenen van de transactie-kosten.

Een ander onderzoek maakte gebruik van het sentiment van nieuws van Reuters, een grote nieuwsdienst, en onderzocht het effect op de DJIA-index (Uhl, 2014). Uhl (2014) gebruikte een tijdslag van een maand waardoor de transactiekosten te verwaarlozen zijn. Zijn methode was ingewikkelder. Allereerst formuleerde en testte hij een variantie-autoregressiefmodel (VAR) met een optimale tijdslag. Dit model gebruikte hij om voorspellingen te doen over de indexwaarde. Hij ging long als de voorspelling hoger was dan de huidige indexwaarde op dat moment en short in het andere geval. Aan het eind van de maand werd de positie gesloten. Met deze methode lukte het om een rendement te halen 34 procent hoger dan dat van de index. In 83 procent van de gevallen voorspelde het model goed of de indexwaarde zou stijgen of dalen. Het grootste deel van het effect was van negatief nieuws, aldus Uhl.

Een derde onderzoek maakt gebruik van het aantal views op Wikipediapagina's gerelateerd aan DJIA-bedrijven (Moat et al., 2013). Moat et al. (2013) berekenen de stijging of daling van het aantal views ten opzichte van de afgelopen dagen. Bij een stijging gaan ze short. Bij een daling gaan ze long. Ze vinden significant hogere rendementen dan wanneer de keuze long of short te gaan gerandomiseerd wordt. Echter, ook bij deze strategie vormen de transactiekosten een probleem.

Er zijn dus onderzoeken gedaan naar strategieën gebaseerd op online data met ver-schillende lags en met zowel het sentiment als volume. Dagelijks handelen is niet winst-gevend gebleken door de transactiekosten in het onderzoek van Tetlock et al. (2008). Een groter tijdsinterval of hogere rendementen zullen nodig zijn. Uhl (2014) maakte gebruik van een lag van een maand, maar er is reden om aan te nemen dat dit interval voor dit onderzoek te groot is. De verwachting is dat nieuwe informatie via Twitter sneller wordt opgenomen in de prijs van een aandeel, want Ranco et al. (2015, p. 16) laten namelijk zien dat het grootste gedeelte van de prijsverschuiving op de dag van

(10)

de twitteractiviteit plaatsvindt. Daarom wordt in dit onderzoek toch geen lag gebruikt groter dan een dag.

Er is echter een oplossing voor het probleem van de transactiekosten en dat is door niet continu te handelen. Tetlock, Saar-Tsechansky en Macskassy (2008) handelden wanneer het sentiment positief dan wel negatief was. Moat et al. (2013) handelden bij een stijging of daling van het volume van de views. Het is ook mogelijk om beide te combineren. Ranco et al. (2015) bepaalden eerst of er sprake was van een event op basis van het twittervolume. Vervolgens werden deze events geclassificeerd als positief of negatief. Zij concluderen dat de correlatie met abnormale rendementen sterker is ten tijde van deze events. Dit betekent dat het ook mogelijk is een strategie te formuleren op basis van deze combinatie: sentiment en volume. Er wordt niet dagelijks gehandeld, waardoor de transactiekosten aanzienlijk lager zullen zijn.

De achterliggende theorie is behandeld en de reden voor de keuze om twitterdata te gebruiken is toegelicht. Met behulp van twitterdata is het mogelijk de collectieve stemming en collectief gedrag te interpreteren. Het sentiment is misschien wel de be-langrijkste indicator, maar ook het volume kan gebruikt worden in modellen. Het is zelfs mogelijk beide te combineren door gebruik te maken van events. Alle drie de va-riabelen kunnen gebruikt worden in een autoregressief model om aandelenrendementen te voorspellen. Deze modellen kunnen worden gebruikt bij een strategie, zoals in de vorige paragraaf besproken. Hoe dit precies in werking gaat, wordt besproken in de volgende sectie, die de methode bevat.

3

Data en Methode

In dit onderzoek wordt de data gebruikt uit het onderzoek van Ranco et al. (2015). Deze data bevat de marktdata en de Twitterdata van de 30 bedrijven die de Dow Jones Industrial Index (DJIA) vormen over een periode van vijftien maanden tussen 2013 en 2014. Een overzicht van welke bedrijven dit zijn en het totaal aantal tweets per bedrijf is te zien in figuur 1. De details van de twee typen data worden in het vervolg van deze sectie besproken.

3.1

Marktdata

De eerste bron van data bevat informatie over de aandelenprijzen van de bedrijven. In het weekend is er echter geen data beschikbaar over de prijzen, omdat de markten dan gesloten zijn. Deze datapunten zijn geïnterpoleerd met behulp van de interpolatie-functie in Eviews. In de analyse wordt gebruik gemaakt van de prijsrendementen. De

(11)

Ticker Company Tweets TRV Travelers Companies Corp 12,184 UNH United Health Group Inc 15,020 UTX United Technologies Corp 16,123

MMM 3M Co 17,001

DD E I du Pont de Nemours and Co 17,340

AXP American Express Co 21,941

PG Procter & Gample Co 25,751

NKE Nike Inc 29,220

CVX Chevron Corp 29,477

HD Home Depot Inc 30,923

Cat Caterpillar Inc 38,739

JNJ Johnson & Johnson 40,503

V Visa Inc 43,375

VZ Verizon Communications Inc 45,177

KO Coca-Cola Co 45,339

MCD McDonald’s Corp 45,971

XOM Exxon Mobil Corp 46,286

DIS Walt Disney Co 46,439

BA Boeing Co 51,799

MRK Merck & Co Inc 54,986

CSCO Cisco Systems Inc 57,427

GE General Electric Co 61,836

WMT Wal-Mart Stores Inc 63,405

INTC Intel Corp 68,079

PFE Pfizer Inc 71,415

T AT&T Inc 75,886

GS Goldman Sachs Group Inc 91,057

IBM International Business Machines Co 101,077

JPM JPMorgan Chase and Co 108,810

MSFT Microsoft Corp 183,184

Total 1,555,770

Figuur 1: de twitterdata voor de periode van 15 maanden: bedrijfsnamen en aantal tweets

(12)

rendementen worden berekend voor elke dag en zijn gedefinieerd als Rt:

Rt= (pt− pt−1)/pt−1 (1)

waarbij pt gelijk is aan de openingsprijs van een aandeel op dag t. Voor het berekenen

van de rendementen worden de openingsprijzen gebruikt, omdat er met de toe te passen strategie steeds pas aan het begin van de volgende dag kan worden gehandeld. In het vervolg van deze sectie wordt hier nogmaals op ingegaan.

3.2

Twitterdata

De tweede bron van data is Twitter en deze dataset bestaat uit alle relevante tweets tezamen met het sentiment ervan. De data is verzameld met behulp van een Twitter Search API en het sentiment is geclassificeerd met behulp van een machine learning techniek. De toepassing van deze techniek resulteert in een classificatie van positieve, negatieve en neutrale tweets per dag per bedrijf. Hoe dit precies in zijn werk gaat wordt uitgebreid beschreven in het artikel van Ranco et al. (2015, pp. 5-6). Er zijn dus twee typen twitterdata beschikbaar: sentiment en volume van de tweets per bedrijf per dag. Het totale volume per bedrijf is te zien in figuur 1. Het totaal aantal tweets in deze dataset is meer dan 1.5 miljoen. De volgende variabelen worden gedefinieerd:

• Volume aan tweets: Vt, totaal aantal tweets op dag t.

• Negatieve tweets: tw−

t , aantal negatieve tweets op dag t.

• Neutrale tweets: tw0

t, aantal neutrale tweets op dag t.

• Positieve tweets: tw+

t , aantal positieve tweets op dag t.

Om een indicatie te geven wat de stemming is per dag op basis van het sentiment wordt de polariteit gedefinieerd als Pt:

Pt = (twt+− tw − t )/(tw + t + tw − t ) (2)

De polariteit voor dag t is groter dan nul als er meer positieve dan negatieve tweets zijn op dag t en negatief als er meer negatieve dan positieve tweets zijn op dag t. In het geval dat tw+

t + tw −

(13)

3.3

Events

Naast een analyse gebaseerd op twittervolume en twittersentiment, wordt in dit onder-zoek ook een analyse gedaan op basis van events. Daarom is het belangrijk goed te definiëren wat gezien wordt als een event. In dit onderzoek wordt dezelfde methode gehanteerd als in het onderzoek van Ranco et al. (2015) met betrekking tot het de-tecteren van deze events. Allereerst worden events gedetecteerd op basis van pieken in het twittervolume en vervolgens krijgen deze events een polariteit toegeschreven aan de hand van de polariteit voor die dag.

Allereerst wordt voor de detectie van de events gebruik gemaakt van de tijdreeksdata voor het twittervolume, Vt. Bij Ranco et al. (2015) wordt gekeken naar de afwijking

ten opzichte van het gemiddelde van 21 dagen met dag t als de middelste dag. In dit onderzoek wordt voorspeld dus er kan niet gebruik worden gemaakt van data in de toekomst ten opzichte van dag t. De baseline volume activiteit, Vb, wordt gedefinieerd

als het gemiddelde volume van dag t-9 tot en met dag t. Vervolgens wordt de afwij-kingsfractie Od berekend als het relatieve verschil tussen de activiteit Vd ten opzichte

van de baseline Vb:

Ob(d) = [Vd− Vb]/max(Vb, nmin) (3)

waarbij nmin = 10wordt gebruikt als minimum activiteitwaarde om de waarde van Ob te

reguleren voor lage activiteitwaarden. Nu is er sprake van een event als Ob > Ot, waarbij

Ot =2. Ot is de drempelwaarde die het aantal gedetecteerde events maximaliseert en

de overlap tussen events minimaliseert. Deze waarde is overgenomen uit het onderzoek van Ranco et al. (2015). De methode in dit onderzoek verschilt enigszins van die in het onderzoek van Ranco et al., maar dit verschil is klein en daarom wordt voor de eenvoud deze waarde overgenomen.

Hierna krijgt elk event een polariteit toegeschreven: positief, negatief of neutraal. De polariteit van een event wordt gebaseerd op de polariteit voor de betreffende dag. Ranco et al. (2015) stelt dat de polariteit Pt voor de gedetecteerde events niet uniform

verdeeld is en vooral positief is. Daarom wordt de volgende classificatie gebruikt om drie ongeveer evengrote groepen te verkrijgen:

• Pt in [-1, 0.15) is een negatief event.

• Pt in [0.15, 0.7] is een neutraal event.

• Pt in (0.7, 1 ] is een positief event.

In dit onderzoek wordt dezelfde data en daarom ook dezelfde classificatie gebruikt als in het onderzoek van Ranco et al. (2015). Het resultaat van al deze stappen is een

(14)

variabele die gelijk is aan 0, 1 of -1 in het geval van geen event, een positief event of een negatief event respectievelijk.

3.4

Werkwijze

De eerste stap in de analyse is het vormen van een geschikt model per bedrijf. Voor elke richting, sentiment, volume en events, wordt per bedrijf een geschikt model ge-formuleerd. Het model voor de indicatoren sentiment en volume heeft de volgende vorm:

Rt = a + b1Rt−1+ b2Rt−2+ b3Rt−3+ b4X + et (4)

waarbij er maximaal drie autoregressieve termen worden gebruikt voor het rendement en X de polariteit of het volume op dag t-1 bevat. Het model voor events bevat een extra variabele en ziet er als volgt uit:

Rt= a + b1Rt−1+ b2Rt−2+ b3Rt−3+ b4X1+ b5X2+ et (5)

X1 bevat hier de polariteit op t-1 en X2 bevat de variabele voor events.

Wanneer een autoregressieve term niet significant is, wordt deze verwijderd totdat er een model overblijft met alleen significante coëfficiënten. Wanneer coëfficiënt b4 in

vergelijking (4) uiteindelijk niet significant is, wordt dit bedrijf niet gebruikt bij het toepassen van de strategie, omdat er statistisch gezien geen verband is tussen de varia-bele, waar het in dit onderzoek om draait, en het rendement op de volgende dag. Deze bedrijven toch gebruiken draagt niet bij aan het beantwoorden van de onderzoeksvraag, maar het feit dat deze bedrijven voor een variabele in X niet significant zijn geeft wel nuttige informatie over de bruikbaarheid van de betreffende indicator in een strategie in de werkelijkheid. Meer significante relaties betekent dat de variabele beter te gebruiken is voor een strategie. Bij het model met events worden vergelijkbare stappen gevolgd. Als in vergelijking (5) de autoregressieve termen en b4 niet significant zijn , worden deze

variabelen verwijderd uit het model. Wanneer coëfficiënt b5, de term voor events, niet

significant is, wordt dit bedrijf niet gebruikt voor de strategie. Bij het bepalen van de significantie van de coëfficiënten wordt de volledige dataset gebruikt.

3.5

Strategie

Na het formuleren van een geschikt model per bedrijf kan dat model gebruikt worden om te voorspellen. Echter, een model gebruiken wat gefit is op de hele dataset gebrui-ken om dezelfde dataset te voorspellen is econometrisch gezien niet verantwoord, omdat het model dan ge-overfit wordt. Daarom wordt gebruik gemaakt van een

(15)

crossvalida-hiervoor geschikt is gevonden per bedrijf wordt geschat op vier van de vijf blokken en vervolgens gebruikt om de rendementen te voorspellen voor het overige blok. Dit proces wordt herhaald tot elk blok één keer gebruikt is als set om te voorspellen. Op basis van deze voorspelde rendementen wordt uiteindelijk de strategie toegepast en deze is als volgt. Er zijn twee gevallen:

1. Het voorspelde rendement is positief: Rt+1> 0

2. Het voorspelde rendement is negatief: Rt+1 < 0

In geval 1, is het verwachte rendement op dag t+1 positief dus dat aandeel wordt op t+1 gekocht (long) voor een bedrag x en op t+2 weer verkocht tegen de openingsprijs van het betreffende aandeel. Omdat de gebruikte data pas het eind van de dag be-schikbaar is, kan er ook pas de volgende dag worden gehandeld. Daarom wordt gebruik gemaakt van de openingsprijs voor de berekening van het rendement. Het behaalde rendement met de hiervoor besproken actie is gelijk aan het werkelijke rendement op dag t+1: Rt+1. Voor geval 2 zijn de stappen hetzelfde, alleen wordt er dan verkocht

(short) in plaats van gekocht.

Met deze methode wordt er voor de indicatoren volume en sentiment elke dag ge-handeld. Bij events wordt er alleen de dag na een event gege-handeld. Op elk moment van handelen wordt een rendement gehaald. Deze rendementen worden gesommeerd tot een totaal rendement en vergeleken met het rendement van de DJIA-index over de periode van vijftien maanden. De data en de werkwijze zijn nu besproken. De volgende sectie bevat de resultaten.

4

Resultaten

In deze sectie worden de resultaten besproken. Voor elk van de drie richtingen, volume, sentiment en events wordt allereerst besproken welke modellen significant zijn. De coëfficiënten worden geanalyseerd en tot slot wordt het totale rendement per bedrijf bepaald na het toepassen van de strategie. Dit wordt nu eerst besproken voor het model met volume-activiteit als variabele.

4.1

Volume

De eerste stap van het onderzoek is om te bepalen welke modellen significant zijn per bedrijf. Modellen van de vorm in vergelijking (4) zijn getest en via het proces van eliminatie op basis van significantie vereenvoudigd. In dit model bevat X een variabele voor het volume op dag t-1 voor het betreffende bedrijf. Voor vier bedrijven uit de 30

(16)

Bedrijf constante p-waarde Rt−1 p-waarde Rt−2 p-waarde Vt−1 p-waarde

CSCO 0.0017 0.0036 -0.1343 0.0039 -1.2951e-05 0.0000

INTC -0.0009 0.1326 -0.0993 0.0290 1.1810e-05 0.0000

CAT 0.0011 0.0130 -7.5957e-06 0.0043

IBM 0.0005 0.3017 -3.0169e-06 0.0290

Figuur 2: modellen en coëfficiënten volume

wordt een significant model gevonden en de autoregressieve term met lag 3 is bij geen van de 30 bedrijven significant. Twee modellen zijn significant met een autoregressieve term voor het rendement, waarvan een keer met één lag en een keer met twee lags. Twee modellen zijn significant met alleen een variabele voor het volume. Welke bedrijven dit zijn, de coëfficiënten en de bijhorende p-waarden zijn te zien in figuur 2.

Het valt meteen op dat er voor vier bedrijven uit de 30 een significant model wordt gevonden op basis van het volume. Het valt ook op dat drie van de vier coëfficiënten van het volume negatief zijn. Dit is in overeenstemming met de strategie die in het onderzoek van Moat et al. (2013) wordt toegepast. Zij gaan short bij een stijging van het volume. Oftewel, er wordt van uitgegaan dat een toename van het volume zorgt voor een daling van de prijs. Het volgende onderdeel bespreekt de modellen met de variabele voor het sentiment.

4.2

Sentiment

Wederom is de eerste stap het bepalen van de significante modellen van de vorm in vergelijking (4). Voor 26 van de 30 bedrijven is een significant model gevonden. Dit is aanzienlijk meer dan bij het onderdeel volume. Een overzicht van de modellen, de coëfficiënten en bijhorende p-waarden is te vinden in figuur 3.

Het eerste wat opvalt is dat er nu 26 modellen significant zijn voor de Twitterva-riabele sentiment. Dit betekent dat sentiment een belangrijke vaTwitterva-riabele is voor het verklaren van het rendement. Dit is in overeenstemming met de theorie en de stelling van Sprenger et al. (2014) dat het sentiment misschien wel de belangrijkste twitterva-riabele is.

Alle coëfficiënten van de variabele sentiment zijn positief. Dat betekent dat wanneer het sentiment positief is op dag t, het rendement op dag t+1 stijgt. Ook dit is in overeenstemming met de besproken theorie. Er is een duidelijk consistent verband tussen het sentiment en het rendement in veelvoud. In het volgende onderdeel worden de modellen met de eventvariabele besproken.

(17)

Bedrijf constante p-waarde Rt−1 p-waarde Rt−2 p-waarde Pt−1 p-waarde CSCO -0.0012 0.0726 -0.1136 0.0152 0.0030 0.0073 DD -0.0006 0.2381 -0.1428 0.0023 0.0023 0.0013 KO -0.0008 0.0524 -0.1150 0.0095 0.0020 0.0032 MRK -0.0002 0.6851 -0.1224 0.0078 0.0016 0.0404 INTC -0.0015 0.0402 -0.0972 0.0329 0.0046 0.0002 XOM -0.0006 0.1155 0.1085 0.0184 0.0021 0.0034 AXP -0.0005 0.2730 0.0021 0.0034 BA -0.0020 0.0031 0.0051 0.000 CAT -0.0000 0.9878 0.0027 0.0001 CVX -0.0006 0.0888 0.0017 0.0019 DIS -0.0014 0.0616 0.0034 0.0008 GS -0.0004 0.2815 0.0052 0.0000 HD -0.0010 0.0369 0.0034 0.0000 IBM -0.0015 0.0011 0.0044 0.0000 JNJ -0.0003 0.4994 0.0018 0.0019 JPM 0.0003 0.4354 0.0020 0.0242 MCD -0.0002 0.4209 0.0013 0.0059 MSFT -0.0025 0.0059 0.0071 0.0000 NKE -0.0016 0.0182 0.0039 0.0000 PFE -0.0006 0.2626 0.0016 0.0302 PG -0.0005 0.1493 0.0018 0.0003 UNH -0.0000 0.8882 0.0020 0.0042 UTX -0.0008 0.1249 0.0021 0.0048 V -0.0017 0.0075 0.0048 0.0000 VZ -0.0019 0.0045 0.0033 0.0005 WMT -0.0001 0.6278 0.0022 0.0000

(18)

Bedrijf constante p-waarde Rt−1 p-waarde Pt−1 p-waarde Eventt−1 p-waarde CSCO 0.0003 0.4969 -0.2208 0.0000 0.0299 0.0000 MRK 0.0006 0.1240 -0.1239 0.0071 0.0057 0.0026 DD -0.0004 0.3648 -0.1716 0.0003 0.0022 0.0020 0.0099 0.0009 IBM -0.0012 0.0100 -0.1066 0.0232 0.0038 0.0000 0.0090 0.0000 KO -0.0070 0.0884 -0.1598 0.0007 0.0019 0.0044 0.0103 0.0002 CAT 0.0133 0.0000 0.0021 0.0030 0.0156 0.0000 INTC -0.0011 0.1325 0.0037 0.0022 0.0152 0.0003 MSFT -0.0020 0.0284 0.0059 0.0003 0.0168 0.0002 UNH -0.0000 0.9334 0.0018 0.0096 0.0090 0.0056 UTX -0.0008 0.1678 0.0019 0.0087 0.0105 0.0082

Figuur 4: modellen en coëfficiënten events

4.3

Events

Tot slot zijn er voor het model met een variabele voor het sentiment en voor events tien significante modellen van de vorm in vergelijking (5). Er zijn geen significante modellen met een autoregressieve term voor het rendement met twee of drie lags. De coëfficiënten van het sentiment zijn wederom steeds positief, zoals ook verwacht wordt op basis van de theorie. Er is een verband tussen positief sentiment en een positief rendement op de volgende dag. Daarnaast zijn ook alle coëfficiënten van de eventsvariabele positief. Dit betekent dat een positief event zorgt voor een toename van het rendement de volgende dag bovenop het effect van het sentiment. Dit is in overeenstemming met de bevindingen van Ranco et al. (2015) dat ten tijde van een event het effect van twittersentiment op het rendement wordt versterkt in de richting van de polariteit, positief of negatief.

Bovengenoemde coëfficiënten en modellen zijn te zien in figuur 4. Het is wel be-langrijk om op te merken dat er voor maar een derde van de bedrijven een significante relatie is tussen events op dag t en het rendement op dag t+1. Echter, deze tien mo-dellen zijn in overeenstemming met de besproken theorie en kunnen gebruikt worden voor het toepassen van de strategie.

Voor elke richting zijn de modellen behandeld. Deze modellen worden gebruikt om de rendementen te voorspellen en vervolgens wordt er gehandeld zoals besproken in de vorige sectie. Het volgende onderdeel bespreekt de behaalde resultaten van die strategieën.

(19)

4.4

Rendementen

Het rendement van de DJIA-index over de tijdspanne van 15 maanden is 11.62 procent. Alleen de strategie gebaseerd op sentiment haalt een hoger rendement dan de index met een rendement van 14.87 procent. Het rendement van de strategie gebaseerd op volume haalt een rendement van 2.22 procent met slechts vier bedrijven. Het is opvallend dat het gemiddelde rendement per bedrijf bijna net zo hoog is als het gemiddelde rende-ment per bedrijf bij de strategie gebaseerd op sentirende-ment en hoger dan het gemiddelde rendement van de index per bedrijf. De strategie gebaseerd op events behaalt met tien bedrijven het laagste rendement van 0.26 procent over de periode van vijftien maan-den. Alle modellen voorspellen in ongeveer evenveel gevallen of het rendement positief of negatief zal zijn. Een overzicht van de besproken resultaten is te vinden in figuur 5 en het verloop van het totale rendement in de tijd voor elke indicator is te zien in figuur 6.

Model Rendement Aantal bedrijven Gemiddeld rendement P(goede richting)

Index 11.6153 30 0.3872

-Volume 2.2236 4 0.5559 0.5517

Sentiment 14.8718 26 0.5720 0.5636

Events 0.2639 10 0.0264 0.5456

Figuur 5: Overzicht redementen per indicator

In figuur 6 is te zien dat de strategie gebaseerd op sentiment over bijna de gehele periode van 15 maanden een beter totaal rendement behaalt dan de index. De volume-en evvolume-entsstrategie behalvolume-en na verloop van tijd evolume-en aanzivolume-enlijk lager rvolume-endemvolume-ent dan de index. Echter, voor alle drie de strategieën geldt dat de variantie van het totale ren-dement lager is dan de variantie van het indexrenren-dement. Met een standaardafwijking van 1.1661 is het verschil tussen het totale rendement van de strategie gebaseerd op sen-timent en het indexrendement groter dan twee keer de standaardafwijking en daarmee is dit verschil significant (Appendix A1).

Alle resultaten zijn besproken en geanalyseerd. De volgende sectie bevat de conclu-sie.

(20)

Figuur 6: Totale rendement tegen de tijd per indicator en voor de index

5

Conclusie

In dit onderzoek wordt voortgebouwd op de relatie tussen twitteractiviteit en de aan-delenmarkt. Er is al veel onderzoek gedaan naar deze relatie en er zijn verschillende richtingen. Het is mogelijk om gebruik te maken van de variabelen twittervolume en twittersentiment, maar er kan ook geanalyseerd worden op basis van gedetecteerde events. Het doel van dit onderzoek is het in de praktijk brengen van deze relatie door te onderzoeken in hoeverre het mogelijk is de marktindex te verslaan met een han-delsstrategie gebaseerd op een van de eerdergenoemde twittervariabelen. Elk van deze strategieën zal nu kort besproken worden.

De eerste strategie was gebaseerd op volume. Met een rendement van 2.22 procent is de index niet verslagen, maar dit rendement is wel bereikt met slechts vier bedrijven van de 30. Een gemiddeld rendement van 0.56 procent per bedrijf. Er zijn slechts vier modellen significant gebleken en vergeleken met de andere indicatoren is dit erg weinig,

(21)

maar dit is mogelijk te wijten aan de relatief kleine dataset. Voor weinig bedrijven wordt er dus een significante relatie gevonden tussen het twittervolume en de rendementen van het betreffende aandeel, maar daar waar deze relatie wel significant is, blijkt een strategie gebaseerd op volume wel potentieel te hebben. Er zijn alleen meer dan vier modellen nodig om de markt te kunnen verslaan.

De strategie met het slechtste resultaat was de strategie gebaseerd op events. Deze strategie behaalde slechts een totaal rendement van 0.26 procent en komt daarmee verre van in de buurt van het indexrendement. Het is dan ook verrassend dat met 10 significante modellen zo'n laag rendement wordt gehaald. Het totale rendement is zelfs meer dan de helft kleiner dan het gemiddelde rendement per bedrijf voor de strategie gebaseerd op volume en de strategie gebaseerd op sentiment. Er moet wel een kanttekening gemaakt worden dat bij deze strategie slechts 92 keer wordt gehandeld, waar bij de twee andere strategieën elke dag, dus zo'n 470 keer voor elk bedrijf, wordt gehandeld. Het gemiddelde rendement per handeling is zelfs meer dan twee keer zo hoog als bij de andere strategieën. Er zijn alleen te weinig events, waardoor te weinig wordt gehandeld om met het totale rendement de markt te kunnen verslaan.

Bij de strategie gebaseerd op het twittersentiment bleken veel meer modellen signi-ficant, namelijk 26. Dit bevestigt de stelling van Sprenger et al. (2014) dat het zeer belangrijk is om het sentiment van nieuws mee te nemen in de analyse. Met een rende-ment van 14.87 procent verslaat deze strategie het renderende-ment van de index van 11.62 procent en dit verschil is significant. Het gemiddelde rendement per bedrijf is 0.57 pro-cent en dus net iets hoger dan bij de strategie gebaseerd op volume. Het enige verschil zit in het feit dat er op basis van sentiment veel meer significante modellen gevonden en gebruikt kunnen worden. Desalniettemin, is een strategie gebaseerd op sentiment het meest veelbelovend en daarom zal een strategie gebaseerd op twitter altijd gebruik moeten maken van de sentimentvariabele.

Samengevat, is het dus mogelijk om de marktindex te verslaan met een strategie gebaseerd de twittersentiment. De andere twee strategieën vertonen wel potentieel, maar zijn op basis van dit onderzoek niet geschikt bevonden om op zichzelf aan de basis te staan van een strategie om de marktindex te verslaan. De strategie gebaseerd op volume behaalt een gemiddeld rendement ongeveer net zo hoog als bij de strategie gebaseerd op sentiment, maar er zijn te weinig significante relaties. Wat betreft de stra-tegie gebaseerd op events, deze strastra-tegie haalt een gemiddeld rendement per handeling dat meer dan twee keer zo hoog is als bij de twee andere strategieën, maar er zijn te weinig events en daardoor wordt te weinig gehandeld om uiteindelijk de marktindex te kunnen verslaan.

Op basis van deze resultaten kan helaas nog niet geconcludeerd worden dat de stra-tegie op basis van sentiment in werkelijkheid ook kan worden toegepast om de markt te verslaan. In dit onderzoek is namelijk geen rekening gehouden met transactiekosten

(22)

bij het handelen. Net als bij het onderzoek van Tetlock et al. (2008) zullen de trans-actiekosten ervoor zorgen dat het rendement nihil zal zijn. Daarom is het in dit geval nog altijd de beste en meest veilige keuze om te investeren in de marktindex.

Echter, wanneer de rendementen van de strategieën hoger worden, wordt het steeds aantrekkelijker om deze te volgen. Volgens Ranco et al. (2015) vindt de grootste prijs-verschuiving en dus het moment om het hoogste rendement te behalen, plaats op de dag van de twitteractiviteit. In dit onderzoek wordt pas de volgende dag gehandeld, wat zorgt voor een groot verlies aan mogelijke rendementen. Daarom is het voor ver-volgonderzoek interessant om het potentieel van een strategie na te gaan waarbij een kleinere lag wordt gebruikt, zoals uren om zo toch deze rendementen te behalen.

Het is ook belangrijk om op te merken dat elke strategie in ongeveer 55 procent van de gevallen de juiste beweegrichting van de index wist te voorspellen, waar Bollen, Mao en Zeng (2011) dit in 86.7 procent van de gevallen juist wisten te voorspellen. Het moet duidelijk zijn dat een erg groot verschil is en dat hier veel ruimte voor verbetering is. Een mogelijke reden voor dit verschil is dat de kleine dataset en het gebruiken van weinig variabelen in dit onderzoek resulteert in onzuivere en slechte schatters, waardoor de nauwkeurigheid van de voorspellingen drastisch wordt beperkt. Daarom is het voor vervolgonderzoek in dezelfde richting van belang om een grotere dataset te gebruiken.

Daarnaast is het interessant om een groter model te formuleren en mogelijk de twittervariabelen allemaal in één model te combineren, want elk van deze variabelen blijkt potentie te hebben in een handelsstrategie. Er zouden zelfs ook andere soortgelijke variabelen gebruikt kunnen worden, zoals Google-zoekopdrachtendata. Alle variabelen die bijdragen aan de voorspelkracht van het model kunnen worden gebruikt. Behalve het model uitbreiden, kan het ook nuttig zijn om eenzelfde onderzoek te repliceren met data uit andere landen om het werkelijke potentieel van dit soort strategieën te achterhalen.

Tot slot, is het van belang om op te merken dat er in dit onderzoek een dataset gebruikt is uit het jaar 2013 en 2014. Het is goed mogelijk dat in de afgelopen jaren de twittervariabelen al door bedrijven en organisaties verwerkt zijn in modellen en gebruikt worden om te handelen. Dit wekt de vraag in hoeverre het op dit moment nog mogelijk is om abnormale rendementen te halen met strategieën gebaseerd op twitter. Daarom zal vervolgonderzoek met een recentere dataset moeten uitwijzen of het daadwerkelijk nog nuttig is handelsstrategieën gebaseerd op Twitter te onderzoeken.

(23)

Referenties

Bollen, J., Mao, H., & Zeng, X. J. (2011 ). Twitter Mood Predicts the Stock Market. Journal of Computational Science, 2 (1), 1-8.

Mao, Y., Wei, W., Wang, B., & Liu, B. (2012 ). Correlating S&P500 stocks with Twit-ter data. New York: ACM International Workshop on Hot Topics on Interdisciplinary Social Networks Research.

Moat, H. S., Curme, C., Avakian, A., Kenett, D. Y., Stanley, H. E. & Preis, T. (2013 ). Quantifying wikipedia usage patterns before stock market moves. Scientific Reports. Preis, T., Moat, H. S., & Stanley, H. E. (2013 ). Quantifying Trading Behavior in Fi-nancial Markets Using Google Trends. Scientific Reports, 3.

Ranco, G., Aleksovski, D., Caldarelli, G., Grar, M. & Mozeti, I. (2015 ). The effects of twitter sentiment on stock price returns. PLOS ONE, (9): 1-21.

Sprenger, T. O., Sandner, P. G., Tumasjan, A. & Welpe, I. M. (2014 ). News or noise? using twitter to identify and understand companyspecific news flow. Journal of Busi-ness Finance & Accounting, (7-8): 791-830.

Tetlock, P. C., Saar-Tsechansky, M., & Macskassy, S. (2008 ). More Than Words: Quantifying Language to Measure Firms’ Fundamentals. textitJournal of Finance, 63(3), 1437-1467.

Uhl, M. W. (2014 ). Reuters Sentiment and Stock Returns. textitJournal of Behavioral Finance, 15 (4), 287-298.

Zheludev, I., Smith, R. & Aste T. (2014 ). When can social media lead financial mar-kets? Scientific Reports, 4.

(24)

Appendix

A1. Test significant verschil rendement van sentiment en index

var(RS) = 1.3599

sd(RS) = 1.1661

Referenties

GERELATEERDE DOCUMENTEN

De oorzaken van een vroeggeboorte of spontane abortus bij koeien zijn velerlei: 30 tot 60 % van de gevallen wordt toegeschreven aan genetische afwijkingen zoals

De te onderzoeken governance variabele CG neemt de waarde 1 (0) aan als het aantal afwijkingen van best practices, waarover Duitse ondernemingen verplicht

10.8 Het belang van de interactie en relatie voor de kwaliteit van dienstverlening Uit diverse onderzoeken naar kwaliteit van dienstverlening en de commerciële interactie tussen

Deze scriptie is niet alleen een case study over Ceylon waarbij voor het eerst maritieme geschiedenis en milieugeschiedenis bij elkaar gebracht zijn, maar ook een

The decision analytic model in two very different settings (Indonesia and Uganda) in terms of contraceptive prevalence, unmet need and cost-effectiveness thresholds as described

Not only must this study examine the functions of participant reference at various levels of discourse, it must also be able to describe the non-formal, pragmatic effects achieved

Proefskrif voorgel~ ter gedeeltelike nakoming van die vereistes van die

The flood incidence of 2002 affected 53% vegetation land cover of the area followed by 38% farmland of the total inundated areas of Adamawa State.. Only 1% of settlement area