Palautedata kertoo: missä hotellissa Lontoossa on paras asiakaskokemus?

Featured

Suunnitteletko matkaa kesällä Lontooseen? Haluatko tietää, missä hotellissa on paras asiakaskokemus otannan perusteella? Mitkä hotellit asiakkaat rankkaavat kärkeen? Mitä tekijöitä asiakkaat arvostavat eniten hotellissa: sijaintia tai palvelua? Kumpi merkitsee enemmän?

Näihin kysymyksiin hain vastauksia, kun kävin läpi Lontoon hotellien avointa dataa, jossa oli mukana kymmenkunta hotellia sekä kalleimmasta että edullisimmista päästä.  Hain datan data.world-tietokannasta, jonne tiedot oli kerätty matkailuportaalin sivuilta vuosien 2012-2018 aikana.  

Aineisto löytyy osoitteesta:

https://data.world/promptcloud/customer-of-reviews-of-london-based-hotels

Koko aineistossa oli rivejä yhteensä 27 330 kpl. Aineistoja rajasin sillä, että poistin mielipiteistä ei englantia sisältävän palautteen. Rajausten jälkeen palauterivien määrä laski 23 578 kpl:een. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.

Otannassa oli mukana seuraavat hotellit, vastausten määräjärjestyksessä
The Savoy 5073
Mondrian London at Sea Containers 3937
The Rembrandt 2524
Corinthia Hotel London 2519
Apex London Wall Hotel 1977
The Dorchester 1560
Hotel Xenia, Autograph Collection 1230
Ridgemount Hotel 1026
Mandarin Oriental Hyde Park, London 1024
Rhodes Hotel 988

Missä hotellissa on sitten paras asiakaskokemus? Datassa hotellikävijät arvioivat asiakaskokemusta arvosanaskaalalla (1=huono – 5=erittäin hyvä. Tulosten perusteella asiakaskokemus on hyvällä tasolla, koska valtaosa oli rankannut kokemuksen joko arvosanaksi 4 tai 5.

Kun vastauksiin otin mukaan vain arvosanan 5, niin kärkeen nousivat Corinthia Hotel London, The Savoy and The Dorchester.


Paras asiakaskokemus, % vastausmäärästä, arvosana 5 vain mukana
Corinthia Hotel London 86,78
The Savoy 78,85
The Dorchester 77,05
Apex London Wall Hotel 75,82
Mondrian London at Sea Containers 74,14
Hotel Xenia, Autograph Collection 64,96
Mandarin Oriental Hyde Park, London 61,82
Ridgemount Hotel 54,19
The Rembrandt 45,13
Rhodes Hotel 38,06

Mitkä sanat sitten toistuivat palautteissa eniten? Yhtenä visualisointitapana on sanapilvi. Mitä suuremmalla fontti on, sitä tiheämmin sana esiintyy vastausdatassa. Sanapilvestä näkee, että muun muassa palvelukyky, sijainti, henkilökunta, palvelualttius, ravintola, baari, hyvä ja ihastuttava nousevat tiheyskärkeen. Sanapilven heikkoutena on se, että siitä on vaikea määrittää tiheysarvoja eksaktisti.

Toisena tapana on lemmatisoida eli perusmuotoistaa sanat perusmuotoon ja nostaa esiin tiheimmin esiintyvät sanat. Alta kuviosta selviää, että palvelukyky esiintyy useammin datassa kuin sijainti. Toisin sanoen kävijät arvostavat enemmän hotellin kykyä palvella asiakkaita kuin sen sijaintia.

Toisena tapana on käyttää n-gram-algoritmiä, joka laskee datasta eniten toistensa kanssa esiintyvät sanat. Alta selviää, että ystävällinen henkilökunta mainitaan useammin vastauksissa kuin esimerkiksi hyvä sijainti.

Mitkä kaksi sanaa esiintyivät palautteissa eniten yhdessä?
(afternoon, tea) 1720
(staff, friendly) 1638
(stay, hotel) 1576
(room, service) 1497
(tube, station) 1476
(highly, recommend) 1395
(great, location) 1344
(one, night) 1326
(hyde, park) 1283
(walk, distance) 1230
(friendly, helpful) 1205
(american, bar) 1128
(5, star) 1123
(recommend, hotel) 1115
(would, definitely) 1112
(come, back) 1059
(go, back) 1010
(room, clean) 994
(stay, savoy) 989
(room, small) 978

Lisäksi alta selviää, että ystävällinen, palvelualtis henkilökunta mainitaan useammin vastauksissa kuin esimerkiksi kävelymatkan päässä oleva sijainti tai hotellin hyvä sijainti.

Mitkä kolme sanaa esiintyivät palautteissa eniten yhdessä?
(stay, one, night) 548
(staff, friendly, helpful) 536
(nothing, much, trouble) 481
(within, walk, distance) 460
(would, highly, recommend) 444
(would, definitely, stay) 440
(make, us, feel) 436
(hotel, great, location) 339
(apex, london, wall) 332
(5, star, hotel) 313
(would, definitely, recommend) 311
(highly, recommend, hotel) 301
(south, kensington, tube) 291
(would, recommend, hotel) 244
(worth, every, penny) 241
(full, english, breakfast) 229
(victoria, albert, museum) 227
(5, minute, walk) 224
(kensington, tube, station) 210
(royal, albert, hall) 197

Johtopäätökset:

  • Hotellikävijät arvostavat ystävällistä, palvelualtista asiakaskokemusta enemmän kuin hotellin erinomaista sijaintia.
  • Sijainnilla on kuitenkin väliä. Kävijät arvostavat sijaintia metroaseman juuressa.
  • Aamiaisella on merkitystä. Kävijät haluavat nauttia englantilaisesta aamiaisesta.
  • Asiakkaille merkitsee hotellin läheisyydessä olevat maamerkit muun muassa Kensington, Hyde Park ja Royal Albert Hall.

Eksploratiivinen data-analyysi on nähtävissä github-kansiossani kahdessa osassa:

https://github.com/markok20/London-Hotels-exploratory-data-analysis

Advertisement

Traficomin avoin data: Näitä täyssähköautoja Suomi rekisteröi 2021-2022!

Featured

Mitkä ovat suosituimmat täyssähkömallit ja suosituimmat täyssähkömerkit ensirekisteröinneissä vuodesta 2021 alkaen? Missä Suomessa maantieteellisesti ensirekisteröitiin täyssähköautoja eniten?


Näihin kysymyksiin hain vastauksia, kun kävin läpi ajoneuvojen avointa datan aineistoa Traficomin sivuilta. Ajoneuvojen avoin data sisältää kaikkien liikennekäytössä olevien ajoneuvojen rekisteröinti-, hyväksyntä- ja teknisiä tietoja Traficomin ylläpitämästä liikenneasioiden rekisteristä.


Aineisto löytyy osoitteesta: https://tieto.traficom.fi/fi/tietotraficom/avoin-data?toggle=Ajoneuvojen%20avoin%20data


Aineistossa oli rivejä yhteensä 5 163 487 kpl ja se oli julkaistu 12.2.2023. Aineistosta poimin datan vain henkilöautoista (ajoneuvoluokat M1 ja M1G) ja rajasin sitä vielä vuoden 2021 alusta lähtien ensirekisteröityihin. Täyssähköautoja rekisteröitiin ajanjaksolla 35 494. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.


Mitkä ovat suosituimmat täyssähköautomerkit? Paalupaikalla on Tesla. Kakkosena on Volkswagen ja kolmantena Hyundai. Neljäntenä on Skoda ja viidentenä on Nissan.

SUOSITUIMMAT TÄYSSÄHKÖAUTOMERKIT
Tesla 7584
Volkswagen 5088
Hyundai 2308
Skoda 2125
Nissan 2091
Volvo 1883
Mercedes-Benz 1798
Kia 1646
Audi 1553
Polestar 1363
BMW 1337
Peugeot 856
Ford 757
Renault 725
Opel 588
Porsche 536
Tesla Motors 475
Seat 402
BMW i 339
Fiat 273

Mitkä ovat taas suosituimmat täyssähköautomallit? Kärkiviisikon muodostavat Teslan, Volkswagenin ja Nissanin mallit. Suosituimmissa täyssähköautoissa on paljon sedan-tyyppisiä malleja, kun perinteisissä käyttövoimissa suomalaiset suosivat käytännönläheisyyttä, kun he nostavat farmarit ja monikäyttöajoneuvot ostoslistan kärkeen.

SUOSITUIMMAT TÄYSSÄHKÖAUTOMALLIT
Model 3 Sedan (AA) 4ov 4784
Model Y Monikäyttöajoneuvo (AF) 5ov 2053
ID.4 PRO 150 KW Farmari (AC) 5ov A 1733
Nissan Leaf 40kWh Monikäyttöajoneuvo (AF) 4ov 1606
Polestar 2 Sedan (AA) 5ov 1339
XC40 Farmari (AC) 5ov 1255
Kona Monikäyttöajoneuvo (AF) 5ov 1067
ENYAQ 80 Farmari (AC) 5ov A 935
NIRO Farmari (AC) 5ov 779
Model S Viistoperä (AB) 5ov 761
Mustang Mach-E Viistoperä (AB) 4ov A 756
IONIQ5 Monikäyttöajoneuvo (AF) 5ov A 712
C40 Farmari (AC) 5ov 626
EV6 Monikäyttöajoneuvo (AF) 5ov A 598
EQC 400 4MATIC Farmari (AC) 5ov 583
ENYAQ 60 Farmari (AC) 5ov A 580
ENYAQ 80X Farmari (AC) 5ov A 534
IONIQ Viistoperä (AB) 5ov 495
ID.3 PRO 150 KW Farmari (AC) 5ov 491
UP! Viistoperä (AB) 5ov A 439

Mitkä ovat taas suosituimmat täyssähköautojen kaupalliset nimet? Teslan kaupallisten mallien nimet ovat ensimmäisellä ja toisella sijalla.

SUOSITUIMMAT TÄYSSÄHKÖAUTOJEN KAUPALLISET NIMET
Model 3 4794
Model Y 2053
ID.4 PRO 150 KW 1736
Nissan Leaf 40kWh 1607
Polestar 2 1348
XC40 1255
Kona 1067
ENYAQ 80 938
NIRO 898
Model S 803
Mustang Mach-E 756
IONIQ5 714
ID.3 PRO 150 KW 679
C40 626
EV6 598
EQC 400 4MATIC 586
ENYAQ 60 580
ENYAQ 80X 534
ZOE 524
IONIQ 497

Missä Suomessa maantieteellisesti ensirekisteröitiin täyssähköautoja eniten? Alueittain ensirekisteröintejä tehtiin eniten Etelä-Suomen kasvukeskuksissa kuten Helsingissä, Espoossa, Vantaalla, Tampereella ja Oulussa.


Kuvaus koodista on nähtävissä github-profiilissani: https://github.com/markok20/Traficom-e-cars-EDA-analysis

Traficomin avoin data: Näitä autoja Suomi rekisteröi 2021-2022!

Featured

Mitkä ovat olleet suosituimmat mallit ja merkit ensirekisteröinneissä Suomessa vuodesta 2021 alkaen? Mitkä ovat suosituimmat värit suosituimmilla merkeillä? Mitkä olivat suosituimmat käyttövoimat ja vaihteistot? Minkä merkin mallistossa on eniten sähköhybridejä? Mitkä ovat keskimääräiset päästöt sähköhybrideillä? Ja miten paljon päästöt ovat keskimäärin vähentyneet 1990-luvun puolivälistä alkaen?

Näihin kysymyksiin hain vastauksia, kun kävin läpi ajoneuvojen avointa datan aineistoa Traficomin sivuilta. Ajoneuvojen avoin data sisältää kaikkien liikennekäytössä olevien ajoneuvojen rekisteröinti-, hyväksyntä- ja teknisiä tietoja Traficomin ylläpitämästä liikenneasioiden rekisteristä.

Aineisto löytyy osoitteesta: Avoin data | Tieto Traficom

Aineistossa oli rivejä yhteensä  5 163 487 kpl ja se oli julkaistu 24.2.2023. Aineistosta poimin datan vain henkilöautoista (ajoneuvoluokat M1 ja M1G) ja rajasin sitä vielä vuoden 2021 alusta lähtien ensirekisteröityihin. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.

Mitkä ovat suosituimmat merkit? Kärjessä keikkuvat Toyota, Volvo ja Mercedez-Benz.

SUOSITUIMMAT MERKIT

Toyota 34355
Volvo 26251
Mercedes-Benz 23918
Volkswagen, VW 23043
BMW 18333
Skoda 17922
Kia 16654
Audi 10560
Ford 10131
Tesla 7584
Nissan 6978
Hyundai 6960
Opel 5571
Mitsubishi 5530
Peugeot 5229
Renault 3765
Citroen 3462
Seat 2571
Suzuki 2013
Dacia 1997

Mitkä ovat taas suosituimmat mallit? Kärkikolmikon muodostavat Toyotan, Teslan ja Volvon mallit. Suomalaiset suosivat käytännönläheisyyttä, kun ne nostavat farmarit ja monikäyttöajoneuvot ostoslistan kärkeen.

SUOSITUIMMAT MALLIT
TOYOTA YARIS Viistoperä (AB) 4ov 1490cm3 6681
TOYOTA COROLLA Farmari (AC) 4ov 1798cm3 6421
TOYOTA RAV4 Farmari (AC) 4ov 2487cm3 5068
Model 3 Sedan (AA) 4ov 4784
XC60 Farmari (AC) 5ov 1969cm3 A 4699
TOYOTA C-HR Viistoperä (AB) 4ov 1798cm3 3548
V60 Farmari (AC) 5ov 1969cm3 A 3145
PASSAT Farmari (AC) 5ov 1395cm3 A 2632
Nissan Qashqai Monikäyttöajoneuvo (AF) 4ov 1332cm3 2279
Kuga Monikäyttöajoneuvo (AF) 4ov 2488cm3 2074
XC40 Farmari (AC) 5ov 1477cm3 A 2073
Model Y Monikäyttöajoneuvo (AF) 5ov 2053
Mitsubishi Outlander Farmari (AC) 4ov 2360cm3 1950
V90 Farmari (AC) 5ov 1969cm3 A 1917
TOYOTA YARIS CROSS Viistoperä (AB) 4ov 1490cm3 1900
ID.4 PRO 150 KW Farmari (AC) 5ov A 1733
Nissan Leaf 40kWh Monikäyttöajoneuvo (AF) 4ov 1606
NIRO Farmari (AC) 5ov 1580cm3 A 1539
Nissan Qashqai Monikäyttöajoneuvo (AF) 4ov 1332cm3 A 1458
X3 xDrive30e Farmari (AC) 4ov 1998cm3 A 1427

Mitkä ovat suosituimmat värit ensirekisteröinnissä? Kolmen kärki oli valkoinen, harmaa ja musta.

SUOSITUIMMAT VÄRIT
White 67128
Grey 52559
Black 51030
Blue 28404
Red 21635
Silver 13180
Brown 8116
Green 3469
Orange 2465
Yellow 2108
Multicolor 383
Purple 320
Turquoise 273

Suosituimmat värit suosituimmilla merkeillä vaihtelivat. Harmaa oli suosituin väri Dacialla. Mustaa suosivat eniten premium-merkit kuten Audi-, BMW-, Mercedes-Benz- ja Volvo-kuskit. Valkoinen oli suosituin usealla merkillä.


Mitkä ovat suosituimmat käyttövoimat? Huhut polttomoottorin kuolemasta näyttävät olevan vahvasti liioiteltuja. Bensiini on vahvasti paalupaikalla ja diesel jyrää kakkosena. Yli 14 prosenttia valitsi autoonsa sähköteknologian.

SUOSITUIMMAT KÄYTTÖVOIMAT
Petrol 68
Diesel fuel 16,4
Electricity 14,1
CNG 0,8
Petrol/CNG 0,6
Petrol/Electricity 0,1
Petrol/Ethanol 0,1

Mitkä ovat suosituimmat vaihteistot? Automaatti on syrjäyttänyt perinteisen vaihteiston. Kaksi kolmesta valitsi automaatin.

SUOSITUIMMAT VAIHTEISTOT
Automatic 61,7
Stepless 16,1
Manual 11,7

Kiinnostavaa oli tietää myös, minkä merkkien mallistoissa on eniten sähköhybridejä? Kärjessä ovat Suzuki, Mitsubishi ja Toyota. Ensirekisteröityjen sähköhybridien hiilidioksidipäästöt ovat keskimäärin noin 102 grammaa.

MERKIT, JOISSA ENITEN SÄHKÖHYBRIDEJÄ
Suzuki 88,7
Mitsubishi 87,6
Toyota 87,3
BMW 61,0
Volvo 58,7
Audi 53,7
Ford 47,1
Renault 45,0
Seat 45,0
Mercedes-Benz 44,1
Kia 39,8
Hyundai 39,5
Nissan 29,6
Volkswagen, 26,5
Skoda 24,1
Peugeot 15,3
Citroen 13,3
Opel 7,7

Autojen polttomoottoriteknologian kehittyminen näkyy vahvasti hiilidioksidipäästöjen kehityksessä. Päästöt ovat vähentyneet rajusti 1990-luvun puolivälistä alkaen. Vielä 1990-luvun puolivälissä päästöt olivat keskimäärin yli 220, kun nyt ne ovat keskimäärin noin 130.


Kuvaus koodista on nähtävissä github-profiilissani: https://github.com/markok20/Traficom

Mitä tietoa Suomi hakee Googlesta juuri nyt?

Featured

Mitä tietoa suomalaiset hakevat Googlen kautta? Mitkä ovat TOP 10 -teemat? Ja missä maassa haetaan eniten tietoa Teslasta? Ja kumpi, Espoo tai Vantaa, kumpi on haluttavampi ja kiinnostuksen paalupaikalla hakukoneessa?

Näihin kysymyksiin etsin vastauksia. Käytettävissä oli 10.10.2022 haettu Googlen Trends data. Google Trends on Googlen verkkosivusto, joka analysoi Google-haun hakukyselyiden suosiota lähes kaikilla alueilla, kielillä ja luokissa. Pureuduin dataan kiinni Pythonin Pytrendsin kirjastolla, josta poimin melkein kaiken, mitä Google Trends -verkkosivustolla on saatavilla.

Tarkastellaan ensin viimeisen kymmenen vuoden ajalta, miten hakusanojen Elisa Viihteen ja Telia TV:n hakukiinnostus on kehittynyt. Telia TV on ollut hieman takamatkalla, mutta on kuronut eron kiinni ja noussut Elisa TV:n ohi hakukiinnostuksessa viimeisten vuosien aikana.

Seuraavaksi katsotaan maailmanlaajuisesti, missä maissa Teslan hakukiinnostus on korkein. Kärjessä ovat seuraavat maat:

  • Serbia                                     100
  • Norja                                       86
  • Liechtenstein                         61
  • Huippuvuoret                      56
  • Montenegro                           53

Kiinnostavaa on tietää, millä hakusanoilla Teslaa haetaan eniten. Kärjessä ovat seuraavat hakusanat:

  • 0                         tesla model      100
  • 1                         stock tesla        86
  • 2                         tesla price        52
  • 3                         model 3            47
  • 4                         tesla model 3  46
  • 5                         nikola tesla      34
  • 6                         tesla model s   32
  • 7                         tesla car           26
  • 8                         tesla stock price 20
  • 9                         tesla model x  19
  • 10                       tesla share       14
  • 11                       aktie tesla        14
  • 12                       tesla share price 14
  • 13                       tesla model y  11
  • 14                       tesla roadster  11
  • 15                       model y            10
  • 16                       tesla cars          10
  • 17                       tesla truck        10
  • 18                       tesla news        9
  • 19                       elon musk        9
  • 20                       tesla elon musk 9

Kiinnostavaa on myös tietää, mitkä ovat olleet viimeisen vuorokauden aikana Suomessa kiinnostavimmat hakusanat?

  • 0                         Katie Piper
  • 1                         Bornholm
  • 2                         Madonna
  • 3                         Moldova
  • 4                         Ian Cole
  • 5                         Manu
  • 6                         Air Force one
  • 7                         Harriet Tubman
  • 8                         Ozzy Osbourne
  • 9                         San Marino
  • 10                       Air force 1
  • 11                       Arsenal – Liverpool
  • 12                       Everton – manu
  • 13                       Christopher Lloyd
  • 14                       Iker Casillas
  • 15                       Jordan Peterson
  • 16                       Abyss
  • 17                       Jules Bianchi
  • 18                       Barcelona – Celta Vigo
  • 19                       Max Verstappen

Katsotaan seuraavaksi, mikä on ollut kiinnostusaste hakea Espoota ja Vantaata viimeisen vuoden ajalta. Näyttää siltä, että Espoo on hieman edellä ja on ollut hieman kiinnostavampi kaupunki hakea kuin Vantaa.

Yhteenvedonomaisesti: Google Trends -dataa ja pytrends-kirjastoa voi hyödyntää tiedonkeruudatana ja tutkimusaineistona muun muassa oman yrityksen markkinointiviestinnän ja hakukoneoptimoinnin suunnittelussa. Sen päämääränä on tuoda verkkosivustolle lisää kävijöitä hakukoneista ja konvertoida heidät ostaviksi asiakkaiksi ilman, että joudut maksamaan niiden hankkimisesta.

Kuvaus koodista on nähtävissä github-profiilissani:

Koneoppimismalli ennustaa: kuinka sähkön pörssihinta kehittyy lähikuukausina?

Featured

Mikä sähköön liittyvä asia kiinnostaa jokaista kotitaloutta, joka asuu suorasähkölämmitteisessä talossa? No, tietenkin miten sähköpörssissä muodostuva sähkön hinta kehittyy seuraavien viikkojen tai kuukausien aikana? Onko hinnassa selvä trendi tai kausittaisuus? Minä kuukausina hinta nousee selkeästi keskimääräistä korkeammaksi ja milloin laskee?

Näihin kysymyksiin etsin vastauksia. Käytettävissä oli tammikuusta 2013 alkaen data, joka sisälsi 3 296 riviä spot-hintatietoa. Data ulottui aina 9. tammikuuhun 2022 saakka. Spot-hinta määräytyy Pohjoismaisessa Nord Pool-sähköpörssissä, jossa muodostetaan sähkön hinta jokaiselle vuorokauden tunnille. Suomen alueelle muodostuu oma Spot-hinta. Kuvaan aluksi hinnan kehitystä tammikuusta 2013 alkaen laskettuna siten, että kullekin kuukaudelle on määritelty keskiarvo. Niin kuin kuviosta näkyy, niin marras-joulukuussa 2021 hintakäyrä lähti jyrkkään nousuun, mutta tasoittui joulu-tammikuun vaihteessa.

Miten voidaan luoda täydellinen ennuste koneoppimismallilla sähkön pörssihinnan kehityksestä? Perinteisesti ennustemallina on käytetty liukuvaa keskiarvoa, joka on yksinkertaisin malli ennustaa kehitystä. Liukuvan keskiarvon menetelmässä tulevan ajanhetken kysynnän ennuste on keskiarvo menneiden ajanhetkien kysynnästä. Kuvaan alla liukuvan keskiarvohinnan (rolling mean) kehitystä, jossa näkyy myös joulukuun 2021 hintapiikki.

Eksponentiaalisen tasoituksen malli

Itse käytän ratkaisuna eksponentiaalisen tasoituksen (liukuva keskiarvo painotettuna tuoreimpiin ajankohtiin) mallia, joka reagoi herkästi muutoksiin ja on helposti päivitettävissä. Kyseessä on yksi suosituimmista kysynnän ennustamisen malleista.

Malliin voidaan lisätä komponentteja, jotka huomioivat trendin ja kausivaihtelun. Kysyntään vaikuttavia tekijöitä ovat kysynnän perustason lisäksi trendi-, kausi-, sykli- ja markkinointitekijät sekä ennustamaton vaihtelu.

Tarkastellaan seuraavaksi trendin ja kausittaisuuden kehitystä. Tuloksena saan neljä kuviota:

alkuperäinen aikasarja ylimmäisenä

aikasarjasta erotettu trendi toiseksi ylimmäisenä

aikasarjan kausivaihtelu toiseksi alimmaisena

aikasarjan jäljelle jäänyt osa trendin ja kausivaihtelun poistamisen jälkeen alimmaisena.

Yllä olevassa kuvassa nähdään, että trendi on aluksi hieman laskeva, mutta nouseva vuodesta 2016 – 2019, kunnes siirtyy uudestaan laskevaksi, mutta taas 2021 vuoden toisella puoliskolla trendi kääntyy jyrkkään nousuun. Datassa on nähtävissä selkeä kausittaisuus. Kausittaisuudesta nähdään se, että hinta nousee vuodenvaihteessa, mutta kääntyy kesää kohti laskevaksi. Kesän jälkeen hintakäyrä on nouseva vuodenvaihteeseen saakka.

Sovitetaan eksponentiaalista mallia historiadataan ja simuloidaan toteutunutta kehitystä ennusteella. Alla olevassa kuvassa nähdään ennusteen sovittuvan hienosti toteutuneeseen kehitykseen.

Tehdään historiadatan perusteella koneoppimismallilla ennustus, miten hinta kehittyy seuraavien 24 viikon aikana eli tammi-kesäkuussa 2022.

On hyvä muistaa, että Suomen alueen spot-hinta määräytyy sähköpörssissä seuraavan vuorokauden jokaiselle tunnille vuorokautta edeltävänä päivänä viimeistään kello 12:30 (CET). Hinta muodostuu sähköpörssiin syötettyjen osto- ja myyntitarjousten leikkauspisteessä.

Datassa oleva spot-hinta on raaka markkinahinta sähköenergialle kullekin alueelle, eikä se ota huomioon sähkönmyyjän toimintakustannuksia, kuten alkuperäsertifikaatteja, toimitusmaksua, profiilikustannuksia tai esimerkiksi sähkönmyyjän laskutusta tai asiakaspalvelua. Nord Poolissa sähkön hintojen yksikkönä käytetään euroa per megawattitunti, eivätkä pörssin listalla näkyvät hinnat sisällä arvonlisäveroa.

Data on saatavilla:

https://www.nordpoolgroup.com/historical-market-data/

Kuvaus koodista on nähtävissä github-profiilissani:

https://github.com/markok20/Forecasting-models-using-exponential-smoothing

Näitä haasteita Suomi pohtii viestinnän mittaamisessa

Featured

Haastattelin viime keväänä koulutuksen yhteydessä viestinnän päättäjiä. Kysyin heiltä yksiselitteisen kysymyksen:

Mitkä ovat työyhteisösi keskeisimmät viestinnän mittaamisen haasteet.

Nämä nousivat vastauksissa TOP-listan kärkeen.

Mitkä ovat selkeät mittauskohteet ja miten analysoidaan tuloksia?
Mitkä ovat viestinnän laadulliset mittarit määrällisten sijaan?
Mikä on viestintämme vaikuttavuus eri kohderyhmissä?
Mittareita ei ole, mittareita on liikaa ja mittaamista ei tehdä.
Mikä on tyytyväisyys ja fiilis?
Viestinnän mittaamista ei nähdä tarpeelisena, eikä sitä ole totuttu mittaamaan.
Mittaamisen osaamisen puute.
Tavoitteiden asettaminen mitattavaan muotoon.
Vuorovaikutuksen ja vaikuttavuuden mittaaminen.
Mikä on viestinnän ansiota mittaamisessa?
Mediaviestinnän, mielikuvamuutosten ja tapahtumien mittaaminen.

Mitä suurempi fontti, sitä useammin kyseinen avainsana nousi esiin laadullisissa haastatteluvastauksissa. Näyttää siltä, että tavoitteiden ja mittareiden asettaminen ja tulosten sekä vaikuttavuuden analysointi sekä niiden hyödyntäminen viestinnän kehittämiseen ovat viestinnän mittaamisen haasteiden paalupaikalla.

Lisäksi kysyin:

Mihin teemoihin pitäisi mittaamisessa pureutua tällä hetkellä?

Seuraavat teemat kipusivat listan kärkeen.

Miten saada viestinnän mittaaminen osaksi arkista työtä?
Mitkä ovat konkreettiset esimerkit onnistuneista viestinnän mittareista, joita voisi hyödyntää?
Miten mitata ulkoista ja sisäistä viestintää?
Mitä kannattaa mitata?
Miten asettaa tavoitteet mitattavaan muotoon?
Miten mitata vaikuttavuutta, analysoida tuloksia sekä miettiä jatkoaskeleet?
Mitkä ovat hyvät käytännöt?
Miten viestinnän osuutta strategiseen tavoitteeseen pääsyssä voidaan arvioida?
Miten arvioidaan eri kanavien toimivuus?
Miten arvioidaan ei kaupallista viestintää, laatua, brändikampanjoita ja mitataan mediaviestintää?
Miten mitataan muutos yleisön asenteissa, käsityksissä ja toiminnassa?

Mitä suurempi fontti, sitä useammin kyseinen avainsana nousi esiin laadullisissa haastatteluvastauksissa. Näyttää siltä, että kanavien vaikuttavuuden mittaaminen ja mittareiden asettaminen ovat viestintäpäättäjien mukaan keskeisiä viestinnän mittaamisen teemoja.

Syväsukellus data-analytiikkaan

Featured

Mitä kuuluu datatieteeseen ja analytiikka-alalle? Mitkä ovat tuoreimmat ajankohtaiset uutiset ja kiinnostavimmat aitoa lisäarvoa tuovat AI-asiakaskeissit? Mitkä ovat analytiikan itsetuhonapit ja alan kuumimmat linkkivinkit? Päätin ottaa asiasta selvää ja lukaisin, mitä tarjoilee tuore Analyytikko-lehti. 50-sivuista lehteä julkaisee ja kustantaa Grohner Records.

Lehdelle on tilausta. Miksi? Tekoäly ja koneoppiminen mullistavat ihmisten elämän, bisneksen ja viestinnän seuraavan vuosikymmenen aikana. Muutosaalto on väistämätön eli nyt on jokaisen ryhdyttävä miettimään vakavasti, miten jokainen voisi hyödyntää tekoälyä bisneksessään. Ensimmäinen askel on päättää siitä, mitä dataa kukin tarvitsee, jotta se voi kilpailijoita paremmin hyödyntää tekoälyä ja siihen liittyvää koneoppimista. Tähän lehti tarjoaa hyvät eväät.

Suomalaiset yritykset ovat hyvissä asemissa, vaikkakin tekoälyn hyödyntämisaste on keskimäärin suhteellisen matala. Keväällä 2021 julkaistun Eurostatin tilaston mukaan suomalaiset yritykset hyödyntävät kolmanneksi eniten tekoälysovelluksia EU-jäsenmaiden alueella. Paalupaikalla on Irlanti (23%), toisena Malta (19%), kolmantena Suomi (12%) ja neljäntenä Tanska (11%). Hälyttävää on se, että keskimäärin vain seitsemän prosenttia EU-jäsenmaiden yrityksistä eli noin joka kymmenes hyödyntää tällä hetkellä tekoälyä bisneksessään.

Kirjoittajina alan johtavat asiantuntijat

Kirjoittajiksi lehden ensimmäiseen numeroon on kutsuttu alan johtavat asiantuntijat, jotka valottavat kokonaisuutta lähinnä asiakaskeissien ja ohjeistavien artikkeleiden avulla. Artikkeleita on höystetty koodeilla. Olisiko fiksua, että lukijaa voisi ohjata jatkossa lukemaan ja noutamaan koodit muun muassa githubista, josta ne voi kloonata omaan virtuaalikoneeseen.

Kokonaisuutta tukevat ajankohtaiset uutiset, vuorovaikutteisuuteen pyrkivät datapähkinät, tilastomatematiikkaa pohtivat kolumnit sekä linkkivinkit. Kirjoittajiksi on kutsuttu tällä kertaa pelkästään asiantuntijoita Suomesta. Olisiko hyvä jatkossa laajentaa näkökulmia etsimällä kirjoittajia myös kansainvälisiltä data-areenoilta?

Mielestäni lehden parasta antia on avausjuttu optimoidusta lentokentästä, jossa tekoälyn hyödyt oli havainnollistettu osuvasti. Kiintoisaa oli myös lukea juttu kolmesta tavasta hyötyä AI-teknologioiden valtavirtaistumisesta. Käytäntö on opettanut, että räätälöidyistä AI-projekteista on päästävä eroon ja ryhdyttävä tuotteistamaan AI-palveluja helposti ostettavaksi.    

Teksti on osittain hieman haastavaa lukea pitkine kappaleineen ja teksti olisi vaatinut oikolukua. Tekstin omaksumista voisivat lisätä muun muassa myyvät otsikoinnit, ingressit ja kuvatekstit sekä iskevät tietolaatikot ja artikkeleiden lopussa olevat yhteenvetoteesit. Kuvituksena on hyödynnetty valtaosin kuvapankkien kuvia.

Kehitysideoita

Jatkossa luettavuutta voisi parantaa autenttisilla kuvilla, jotka liittyvät juttujen teemoihin tai henkilöihin. Printtilehteä voisi jatkossa tukea monimediakonsepti: responsiivinen verkkojulkaisu, uutiskirje ja github-ohjelmavarasto. Yhteenvetona: lehti on kattavuutensa takia hyödyllinen muun muassa kaikille tulevaisuuteen katsoville päättäjille, jotka haluavat selvittää mahdollisuudet hyödyntää tekoälyä bisnespäätöksissään.

Artikkelin lähteenä käytetty: Artificial intelligence in EU enterprises

https://ec.europa.eu/eurostat/web/products-eurostat-news/-/ddn-20210413-1

Miten Suomi keskusteli kotiruoasta koronapandemian aikana?

Featured

Mitä suomalaiset keskustelivat sosiaalisessa mediassa nopeasti liikkuvista kulutustavaroista koronapandemian aikana? Liittyikö kotiruokaan myönteisiä, kielteisiä ja neutraaleja tunteita? Mitkä nousivat yleisimmiksi teemoiksi ja oliko ajalla merkitystä keskusteluun?

Näihin kysymyksiin hain vastauksia. Käytettävissä oli tammikuulta 2020–huhtikuuhun 2021 saakka ulottuva sosiaalisen median data, joka sisälsi yhteensä noin 36 000 riviä tietoa. Viestit oli poimittu Meltwaterin tietokannasta, jossa hakujen teemat liittyivät ruoanlaittoon, kotiruokaan tai arkiruokaan. Datassa keskustelujen yleisimmät avainsanat liittyivät kotiruokaan, ruoanlaittoon, arkiruokaan ja kotiruokalounaaseen.

Laajaa datajoukkoa analysoin Pythonilla, jossa hyödynsin eri luonnollisen kielen ymmärtämisen kirjastoja. Tavoitteena oli eritellä viesteistä eniten esiin nousevat teemat eli keskusteludatassa tiheimmin esiintyvät termit ja aiheet. Laskin muun muassa eniten esiintyvät adjektiivit, substantiivit, nimet sekä käsitteet keskusteluista.

Kävin läpi dataa sentimenttianalyysillä, joka kategorisoi tekstipohjaiset viestit eli tviitit sävyn mukaan. Sävy voi olla joko myönteinen, neutraali tai kielteinen.

Suosituimmat kotiruoat pasta, currykana ja pizza
Ensimmäiseksi, tulosten mukaan suomalaiset arvostavat kotiruoassa hyvää laatua, helppoutta, maukkautta ja herkullisuutta. Eniten esiintyvät kotiruoka-ainekset liittyivät pastaan, currykanaan, pizzaan, pihviin ja broileriin.

Toiseksi, keskustelun sävy kotiruoassa yleisesti ottaen oli melko neutraalia. Neljä viidestä (77%) viesteistä oli sävyltään neutraali, joka kymmenes (13%) myönteinen ja kuusi sadasta kielteinen.

Tarkastelin lähemmin kielteisiä sentimenttejä, josta on tehty sanapilvianalyysi. Mitä suurempi sanafontti, sitä suurempi frekvenssi on tekstidatassa.

Kielteisessä sävyssä kotiruoanlaittoon liittyi muun muassa hamstraus, uupumus, neljän seinän sisällä tehtävä ruoanlaitto, tölkkihernekeitto ja lihapullat. Myönteisessä mielessä kotiruokaan liittyi terveellisyys, helppous ja herkullisuus sekä ympäristövastuullisuus. Muun muassa aurinkosähköllä valmistettu ruoka nousi keskustelussa yhdeksi myönteiseksi teemaksi.

Suosituimmat kanavat Facebook ja Twitter
Kolmanneksi, ajalla oli yhteys keskustelureaktioiden määrään tammikuusta 2020 alkaen. Engagement eli keskustelureaktiot kotiruokaan lähtivät jyrkkään nousuun sosiaalisessa mediassa koronarajoitusten linjausten myötä maaliskuussa 2020 ja säilyivät korkealla tasolla kesään 2020 saakka.

Toinen reaktioaalto käynnistyi marraskuun lopussa 2020 koronarajoitusten uudelleen kiristyttyä. Keskustelureaktiot säilyivät korkealla tasolla maaliskuuhun 2021 saakka.

Neljänneksi, tässä 36 000 datarivin keskustelu-otoksessa viisi suosituinta keskustelukanavaa oli Facebook, Twitter, keskustelufoorumit, blogit ja Youtube.

Suurin osa viesteistä lähetettiin Suomen kasvukeskuksista. TOP 5 -kaupungit olivat Helsinki, Tampere, Turku, Vantaa ja Oulu. Yleisin keskustelukieli oli suomi (94%).

Yhteenvedonomaisesti suomalaisten yleisimmät myönteiset teemat kotiruoasta liittyivät helppouteen, hyvään laatuun ja terveellisyyteen. Suomalaiset suosivat edullisia raaka-aineita arjen ruokahetkiin ja monipuolista arkiruokaa sekä ovat valmiita hyödyntämään arkiruokareseptejä ja tarvittaessa uusia ideoita.

Kuvaus koodista on nähtävissä github-profiilissani:

https://github.com/markok20/NLP-analytiikka

A simple, quick update on Covid pandemic in Nordic countries

Featured

How to make a simple, quick update on Covid situation in the Nordic countries using Python. First of all, the objective was to get a quick update on pandemic situation in Finland, Sweden and Norway from the beginning of year 2020.

As an analytic tool, I used Python to pre-process and analyse the data which was collected during 1.1.2020 – 2.6.2021. The aim was to analyse confirmed, recovered and death cases. The dataset is called JHU CSSE COVID-19 Dataset 2021-06-03 and it was downloaded on June, 4th, 2021. Analysis was done right away on June, 4th, 2021.

Data can be found here:

https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data

First of all, death cases have been relatively stable in Finland and Norway compared to Sweden.

Secondly, the development of confirmed cases have been at a stable level compared to Sweden from the beginning of year 2020, although the number of cases slightly increased during the first half of year 2021.

Looking at the cases of confirmed, recovered and deaths, the death rate in Finland has been at a stable level, although the number of confirmed cases have nearly reached the level of 100 000.

On the other hand, the number of confirmed cases in Sweden has reached the level of one million, ten times more than in Finland.

Lastly, the number of confirmed cases in Norway is roughly 120 000, but the development of death rate has been stable. The number of confirmed cases has been at the same level than in Finland.

The code is available in my github account:

https://github.com/markok20/Code-in-Place-2021

Nokian osakkeen tuleva kurssikehitys: kuinka tehdä täydellinen ennustusmalli Facebook Prophetilla?

Featured

Miten osakekurssi kehittyy seuraavien viikkojen tai kuukausien aikana? Voidaanko osakkeen kurssikehityksestä nähdä kausittaista vaihtelua? Milloin päätöskurssi on ollut historiadatan perusteella maksi- ja minimitasolla? Voidaanko sanoa jotain keskiarvosta? Mikä osakkeen päätöskurssi on 100 päivän päästä?

Näihin kysymyksiin hain vastauksia, kun ennustin Nokian osakekurssikehitystä historiadatan pohjalta. Menetelmänä on Facebook Prophet, joka soveltuu eri tyyppisten aikasarjadatojen ennustamiseen, mihin liittyy kausittaista vaihtelua. Datana voi olla osakkeen päätöskurssin lisäksi esimerkiksi liikevaihto tai lämpötila. Ennustusmenetelmän on kehittänyt nimenmukaisesti Facebookin Data Science -tiimi.

Aineistona oli Nokian päätöskurssi (USD) 1.1.2015-31.3.2021. Kyseiseen historiadataan pääsee muun muassa osoitteesta:

https://finance.yahoo.com/quote/NOK/history?p=NOK

Aineistoa käsittelin Pythonilla, jonne toin asianmukaiset kirjastot muun muassa Pandaksen, Matplotlibin ja tietenkin Prophetin. Artikkelin lopussa on linkki Python-koodiin.

DISCLAIMER: Tärkeää on se, että tämän kirjoituksen tehtävänä on olla opetusluonteinen, tarkoituksena ei ole antaa sijoitusneuvoja eikä kannustaa ostamaan osakkeita.

Yksi Facebook Prophetin eduista on se, että se visualisoi tehokkaasti päivittäiset, viikoittaiset ja vuosittaiset vaihtelut sekä tarvittaessa eliminoi lomavaikutukset. Lomapäivät kuten esimerkiksi joulu- tai itsenäisyyspäivä vaikuttaa muun muassa kaupalliseen myyntiin, kun kaupat ovat suljettuina. Lyhyesti Prophetin matemaattinen kaava on seuraavanlainen:

y(t) = g(t) + s(t) + h(t) + e(t)
g(t) = trendi
s(t) = kausittaiset vaihtelut (viikko, kuukausi, vuosi)
h(t) = lomavaikutukset
e(t) = virhe/error/noise

Prophet-malli on sovitettavissa dataan nopeasti huolimatta havaintojen määrästä, eikä se vaadi suuressa määrin datan esikäsittelyä. Malli huomioi myös puuttuvat havainnot ja luotettavuusrajat. Tässä kirjoituksessa näytän, miten hyödynnän mallia Nokian osakekurssihinnan ennustamisessa.

Kuvataan aluksi tilastolliset perustunnusarvot ajanjaksolta 1.1.2015-31.3.2021 eli keskiarvo, mediaani, minimi, maksimi ja keskihajonta. Näyttää siltä, että tammikuussa 2015-maaliskuussa 2021 Nokia-osakkeen päätöskurssin keskiarvo on ollut noin 5,47 USD, maksimi 8,3 USD ja minimi 2,42 USD.

Visualisoidaan seuraavaksi päätöskurssikehitys. Viimeisen vuoden kehityksen osalta huomaan, että kurssikehitys kääntyi jyrkkään laskuun koronapandemian puhkeamisen takia maaliskuussa 2020 ja kääntyi jyrkkään nousuun sosiaalisen median keskustelujen myötä tammikuussa 2021.

Rakennetaan seuraavaksi ennustusmalli. Käytämme mallissa ainoastaan päivämäärää ja päätöskurssia eli ds = päivämäärä ja y = päätöskurssi kunakin päivänä. En jaa dataa opetus- ja testidataan, vaan sovitan mallia koko dataan ja käsken ennustamaan tulevan kehityksen tämän historiakehityksen pohjalta.

Malli käyttää sovittamiseen toteutunutta kehitystä (mustat pisteet) ja ennustaa kehitystä luotettavuusrajoineen. Luotettavuusrajat on varjostettu ennustekäyrän molemmin puolin. Sadan päivän ennustuksen mukaan Nokian päätöskurssi on noin 4,3 USD heinäkuun alussa 2021 eli pientä nousua on odotettavissa mallin pohjalta.

Kuvataan seuraavaksi trendi eli viikottainen, kausittainen, vuosittainen ja päivittäinen vaihtelu. Trendikuvien perusteella nähdään, että alimmaisessa kuvassa osakekurssi yleensä nousee maksimitasolleen elokuun alussa. Keskimmäinen kuva osoittaa, että kurssi nousee maksimitasolleen keskiviikkoisin. Lisäksi ensimmäisessä kuvassa nähdään kurssitrendi ja -kehitys tulevaisuudessa luotettavuusrajoineen.

Kuvaus koodista on nähtävissä github-profiilissani:
https://github.com/markok20/FacebookProphet

Facebook Prophetin github-sivut löydät täältä:
https://github.com/facebook/prophet

Kiitos kun luit tämän kirjoituksen! Anna palautetta!

Kuinka tehdä täydellinen ennustemalli sähkön pörssihinnan kehityksestä?

Featured

Mikä sähköön liittyvä asia kiinnostaa jokaista kotitaloutta, joka asuu suorasähkölämmitteisessä talossa? No, tietenkin miten sähköpörssissä muodostuva sähkön hinta kehittyy seuraavien viikkojen tai kuukausien aikana? Onko hinnassa selvä trendi tai kausittaisuus? Minä kuukausina hinta nousee selkeästi keskimääräistä korkeammaksi ja milloin laskee?

Näihin kysymyksiin etsin vastauksia. Käytettävissä oli tammikuusta 2013 alkaen data, joka sisälsi noin 3 000 riviä spot-hintatietoa. Data ulottui aina 21. maaliskuuhun 2021 saakka. Spot-hinta määräytyy Pohjoismaisessa Nord Pool-sähköpörssissä, jossa muodostetaan sähkön hinta jokaiselle vuorokauden tunnille. Suomen alueelle muodostuu oma Spot-hinta. Kuvaan aluksi hinnan kehitystä tammikuusta 2013 alkaen laskettuna siten, että kullekin kuukaudelle on määritelty keskiarvo.

Miten voidaan luoda täydellinen ennustemalli sähkön pörssihinnan kehityksestä? Perinteisesti ennustemallina on käytetty liukuvaa keskiarvoa, joka on yksinkertaisin malli ennustaa kehitystä. Liukuvan keskiarvon menetelmässä tulevan ajanhetken kysynnän ennuste on keskiarvo menneiden ajanhetkien kysynnästä. Kuvaan alla liukuvan keskiarvohinnan (rolling mean) kehitystä.

Itse käytän ratkaisuna eksponentiaalisen tasoituksen (liukuva keskiarvo painotettuna tuoreimpiin ajankohtiin) mallia, joka reagoi herkästi muutoksiin ja on helposti päivitettävissä. Kyseessä on yksi suosituimmista kysynnän ennustamisen malleista.

Malliin voidaan lisätä komponentteja, jotka huomioivat trendin ja kausivaihtelun. Kysyntään vaikuttavia tekijöitä ovat kysynnän perustason lisäksi trendi-, kausi-, sykli- ja markkinointitekijät sekä ennustamaton vaihtelu.

Tarkastellaan seuraavaksi trendin ja kausittaisuuden kehitystä. Tuloksena saan neljä kuviota:

alkuperäinen aikasarja ylimmäisenä

aikasarjasta erotettu trendi toiseksi ylimmäisenä

aikasarjan kausivaihtelu toiseksi alimmaisena

aikasarjan jäljelle jäänyt osa trendin ja kausivaihtelun poistamisen jälkeen alimmaisena.

Yllä olevassa kuvassa nähdään, että trendi on aluksi hieman laskeva, mutta nouseva vuodesta 2016 – 2019, kunnes siirtyy uudestaan laskevaksi. Datassa on nähtävissä selkeä kausittaisuus. Kausittaisuudesta nähdään se, että hinta nousee vuodenvaihteessa, mutta kääntyy kesää kohti laskevaksi. Kesän jälkeen hintakäyrä on nouseva vuodenvaihteeseen saakka.

Sovitetaan eksponentiaalista mallia historiadataan ja simuloidaan toteutunutta kehitystä ennusteella. Alla olevassa kuvassa nähdään ennusteen sovittuvan hienosti toteutuneeseen kehitykseen.

Tehdään historiadatan perusteella ennustus, miten hinta kehittyy seuraavien 24 viikon aikana eli maalis-syyskuussa 2021.

On hyvä muistaa, että Suomen alueen spot-hinta määräytyy sähköpörssissä seuraavan vuorokauden jokaiselle tunnille vuorokautta edeltävänä päivänä viimeistään kello 12:30 (CET). Hinta muodostuu sähköpörssiin syötettyjen osto- ja myyntitarjousten leikkauspisteessä.

Datassa oleva spot-hinta on raaka markkinahinta sähköenergialle kullekin alueelle, eikä se ota huomioon sähkönmyyjän toimintakustannuksia, kuten alkuperäsertifikaatteja, toimitusmaksua, profiilikustannuksia tai esimerkiksi sähkönmyyjän laskutusta tai asiakaspalvelua. Nord Poolissa sähkön hintojen yksikkönä käytetään euroa per megawattitunti, eivätkä pörssin listalla näkyvät hinnat sisällä arvonlisäveroa.

Data on saatavilla:

https://www.nordpoolgroup.com/historical-market-data/

Kuvaus koodista on nähtävissä github-profiilissani:

https://github.com/markok20/forecasting-electricity-price

Kuinka tehdä täydellinen Twitter-analyysi asiakaskokemuksesta?

Featured

Miten ja kuinka voidaan tutkia asiakaskokemusta asiakkaiden Twitter-viesteistä? Miten asiakkaat olivat reagoineet, tunteneet ja ajatelleet Twitter-viesteissä heti asiakaskokemuksen tai palvelukohtaamisen jälkeen? Saatiinko yhtä paljon myönteisiä, kielteisiä ja neutraaleja tunteita? Mitä tekstuaalinen data Twitter-viesteistä voi kertoa kielteisistä ja myönteisistä tunteista? Mitkä olivat yleisimmät syyt, kun asiakkaat kertoivat kielteisistä tunteista. Onko ajalla esimerkiksi yhteyttä kielteisiin tunteisiin?

Näihin kysymyksiin hain vastauksia. Käytettävissä oli helmikuulta 2015 Twitter-viestien data, joka sisälsi noin 15 000 riviä tietoa. Twitter-viestien lähettäjinä olivat yhdysvaltalaisten lentoyhtiöiden asiakkaat heti asiakaskohtaamisen jälkeen.

Laajaa datajoukkoa kävin läpi sentimenttianalyysillä, joka kategorisoi tekstipohjaiset viestit eli tviitit sävyn mukaan. Sävy voi olla joko myönteinen, neutraali tai kielteinen. Samalla viesteistä eritellään esiin nousevat teemat eli usein esiintyvät termit ja aiheet.

Tarkoituksena oli tarkastella myönteisiä ja kielteisiä kokemuksia sekä vertailla näitä tuloksia lentoyhtiöiden välillä. Kuinka asiakkaat olivat reagoineet, tunteneet ja ajatelleet asiakaskokemuksesta Twitterissä kohtaamisen jälkeen? Siksi viesteistä oli nostettu esiin syyt muun muassa kielteiselle asiakaskokemukselle.

Datassa oli edustettuna kuusi suurta yhdysvaltalaista lentoyhtiötä. Kaikki lentoyhtiöt saivat kielteisiä reaktioita enemmän kuin neutraaleja tai myönteisiä.

Virgin America sai lähes yhtä paljon kielteisiä, myönteisiä ja neutraaleja. Virgin Americalla tviittien kokonaismäärä oli kuitenkin merkittävästi pienempi kuin muilla lentoyhtiöillä.

Tehdään seuraavaksi sanapilvianalyysi kielteisistä sentimenteistä. Mitä suurempi sanafontti, sitä suurempi frekvenssi on tekstidatassa. Sanat kuten cancelled, bag, delay, plane, hold, time ovat yleisimpien sanojen joukossa. Mutta joukossa on myös sanoja, jotka eivät välttämättä tarkoita mitään.

Tehdään seuraavaksi sanapilvianalyysi myönteisistä sentimenteistä. Mitä suurempi sanafontti, sitä suurempi frekvenssi on tekstidatassa. Sanat kuten thank, best, customer, love, flying, good ovat yleisimpien sanojen joukossa. Mutta joukossa on myös sanoja, jotka eivät välttämättä tarkoita mitään.

Tehdään seuraavaksi sanapilvianalyysi neutraaleista sentimenteistä. Mitä suurempi sanafontti, sitä suurempi frekvenssi on tekstidatassa. Sanat kuten thank, flight, ticket, change ovat yleisimpien sanojen joukossa. Mutta joukossa on myös sanoja, jotka eivät välttämättä tarkoita mitään.

Seuraavaksi lasketaan frekvenssit. Sanat kuten flight, cancelled, change ovat yleisimpien joukossa. Mutta joukossa on myös sanoja, jotka eivät välttämättä tarkoita mitään. Suurin osa on niin sanottuja stop-sanoja, jotka pitää filtteröidä pois, jos analyysi halutaan viedä vielä pidemmälle. Lista frekvensseistä on Python-koodissani.

Lasketaan seuraavaksi yleisimmät syyt kielteisistä sentimenteistä. Suurin selittävä syy kielteiselle asiakaskokemukselle oli tietty asiakaspalveluun liittynyt tilanne. Toiseksi yleisin syy oli lennon myöhästyminen. Kolmanneksi yleisin syy oli se, että vastaaja ei kyennyt kertomaan tarkkaa syytä kielteiselle asiakaskokemukselle. Neljänneksi yleisin syy oli peruuntunut lento ja viidenneksi kadonneet matkatavarat lennon aikana.

Yksittäinen asiakaspalvelun aihe oli yleisin kielteinen syy US Airways-, United-, American-, Southwest- ja Virgin America-aineistoissa. Lentojen myöhästyminen eli Late Flight oli yleisin kielteinen syy Deltalle. Virgin America sai vähiten kielteisiä syitä. Toisaalta US Airways, United, American saivat yli 500 kielteistä syytä, selittävänä tekijä muun muassa yksittäinen asiakaspalvelun tilanne (Customer Service Issue).

Seuraavaksi katsotaan, onko päivämäärällä yhteyttä kielteisiin sentimentteihin. Miltä sentimentit näyttävät ajanjaksolle maanantaista 16.2.2015 seuraavan viikon tiistaihin 24.2.2015 kullekin lentoyhtiölle? Sunnuntai oli 22.2.2015. Plotataan alle seuraavaksi sentimentit ajanjaksoille.

Kiinnostavaa on se, että American-yhtiöllä kielteinen sentimentti nousi jyrkästi 23.2.2015, joka puolittui 24.2.2015. Virgin America -yhtiöllä on vähiten kielteisiä tviittejä, pitää kuitenkin muistaa, että Virgin Americalla on tviittejä vähiten kokonaismäärältään suhteessa muihin. Kielteisten tviittien määrä on vinoutunut loppuviikosta suhteessa muuhun viikkoon.

Asiakaskokemuksen mittaaminen on noussut keskeiseen asemaan monessa työyhteisössä. Miksi sen mittaaminen on tärkeää? Erinomainen asiakaskokemus vetää myynnin ja kasvun mittareita ylöspäin. Asiakaskokemuksen ydin on työyhteisön ja asiakkaan vuorovaikutuksessa.

Asiakaskokemus käsittää mielikuvia ja tunteita, jotka syntyvät asiakkaalle kohtaamisista yhteisön edustajien, kanavien ja palveluiden kanssa. Hyvä asiakaskokemus tarkoittaa, että asiakaskokemus vastaa hänen odotuksiaan. Myönteinen asiakaskokemus pitää yllä asiakasuskollisuutta ja houkuttelee uusia asiakkaita.

Tämän analyysin tuloksena voidaan suositella, että lentoyhtiöt parantaisivat asiakaskokemustaan, jos ne panostaisivat lentojen täsmällisyyteen ja asiakasvuoropuheluun kadonneitten tavaroiden tapauksessa.

Kuvaus koodista on nähtävissä github-profiilissani:

https://github.com/markok20/Sosiaalisen-median-analytiikka

Tilastokeskuksen avoin data: Vanhojen osakeasuntojen hinnat eriytyvät Suomessa

Featured

Miten vanhojen osakehuoneistojen hinnat ovat kehittyneet viimeisen kuuden vuoden aikana pääkaupunkiseudulla ja muualla Suomessa? Onko hinnat kehittyneet samaan suuntaan vai eri suuntaan? Kysymys on olennainen, koska suomalaisten omaisuudesta suurin osa on sijoitettu lattioihin, seiniin ja kattoihin.

Näihin kysymyksiin hain vastauksia, kun kävin läpi Tilastokeskuksen tietokantoja ja tein poiminnan osakehuoneistojen hintoihin viimeisen kuuden vuoden aikana eli vuosilta 2015-2021 (Vanhojen osakeasuntojen hintaindeksi (2015=100)). Poimintana olivat kauppojen lukumäärät kuukausittain.

Kyseiseen tietokantaan pääsee osoitteesta http://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__asu__ashi__kk/?tablelist=true

Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.

Miten vanhojen osakehuoneistojen hinnat ovat kehittyneet viimeisen vuoden aikana pääkaupunkiseudulla ja muualla Suomessa? Alla olevassa kuvassa näkyy kehitys, jossa hinnat ovat eriytyneet jyrkästi vuodesta 2015 alkaen pääkaupunkiseudulla ja muualla Suomessa.

Alla oleva kuva näyttää, että vuonna 2021 pääkaupunkiseudulla neliöhinta on noussut noin 22 prosenttia 4 300 euroon. Vuonna 2015 neliö maksoi Suur-Helsingin alueella noin 3 500 euroa.

Muualla Suomessa neliöhinta on vaihdellut ikään kuin kausiluonteisesti vuosina 2015–2021. Vuonna 2015 neliö maksoi noin 1 610 euroa, kun vuonna 2021 neliö maksaa noin 1 650 euroa. Hintataso on siis pysynyt siis suht koht vakaana muualla Suomessa.

Vuonna 2021 koko maassa neliöhinta on noussut noin kymmenen prosenttia 2 300 euroon. Vuonna 2015 neliö maksoi koko maassa noin 2 100 euroa.

Vanhojen osakeasuntojen tiedot perustuvat Verohallinnon varainsiirtoveroaineistoon. Tilastokeskuksen tietokantataulukoissa julkaistavat uusien osakeasuntojen tiedot perustuvat suurimpien rakennuttajien ja kiinteistönvälittäjien kauppahintatietoihin.

Kuvaus koodista on nähtävissä github-profiilissani:

https://github.com/markok20/Tilastokeskuksen-asuntoanalytiikkaa

Traficomin avoin data: Näitä täyssähköautoja Suomi rekisteröi 2019-2020!

Featured

Mitkä ovat suosituimmat täyssähkömallit ja suosituimmat täyssähkömerkit ensirekisteröinneissä vuodesta 2019 alkaen? Mitkä ovat suosituimmat autojen värit? Missä Suomessa maantieteellisesti ensirekisteröitiin täyssähköautoja eniten?

Näihin kysymyksiin hain vastauksia, kun kävin läpi ajoneuvojen avointa datan 5.13 aineistoa Traficomin sivuilta. Ajoneuvojen avoin data sisältää kaikkien liikennekäytössä olevien ajoneuvojen rekisteröinti-, hyväksyntä- ja teknisiä tietoja Traficomin ylläpitämästä liikenneasioiden rekisteristä.

Aineisto löytyy osoitteesta: https://www.traficom.fi/fi/ajankohtaista/avoin-data

Aineistossa oli rivejä yhteensä 5 121 148 kpl ja se oli julkaistu 3.2.2021. Aineistosta poimin datan vain henkilöautoista (ajoneuvoluokat M1 ja M1G) ja rajasin sitä vielä vuoden 2019 alusta lähtien ensirekisteröityihin. Täyssähköautoja rekisteröitiin ajanjaksolla 7 359 eli täyssähkö käyttövoimana kattoi noin kolme prosenttia koko ensirekisteröintikannasta. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.

Mitkä ovat suosituimmat täyssähköautomerkit? Paalupaikalla on Tesla. Kakkosena on Volkswagen ja kolmantena Hyundai. Neljäntenä on Nissan ja viidentenä on Audi.

Mitkä ovat taas suosituimmat täyssähköautomallit? Kärkiviisikon muodostavat Teslan, Hyundain, Volkswagenin ja Nissanin mallit. Teslalla on TOP 20 joukossa neljä eri mallia. Suosituimmissa täyssähköautoissa on paljon sedan-tyyppisiä malleja, kun perinteisissä käyttövoimissa suomalaiset suosivat käytännönläheisyyttä, kun he nostavat farmarit ja monikäyttöajoneuvot ostoslistan kärkeen.

Mitkä ovat suosituimmat värit täyssähköautojen ensirekisteröinnissä? Viiden kärki erottui selkeästi. Suosituimmat värit ovat valkoinen, harmaa, musta, sininen ja punainen.

Missä Suomessa maantieteellisesti ensirekisteröitiin täyssähköautoja eniten? Alueittain ensirekisteröintejä tehtiin eniten Etelä-Suomen kasvukeskuksissa kuten Helsingissä, Espoossa ja Vantaalla. Seuraavaksi eniten täyssähköautoja rekisteröitiin Tampereella, Turussa, Oulussa, Porvoossa ja Kirkkonummella.

Kuvaus koodista on nähtävissä github-profiilissani: https://github.com/markok20/Ajoneuvodata

Traficomin avoin data: Näitä autoja Suomi rekisteröi 2019-2020!

Featured

Mitkä ovat suosituimmat mallit ja merkit ensirekisteröinneissä vuodesta 2019 alkaen? Mitkä ovat suosituimmat värit suosituimmilla merkeillä? Mitkä olivat suosituimmat käyttövoimat ja vaihteistot? Minkä merkin mallistossa on eniten sähköhybridejä? Mitkä ovat keskimääräiset päästöt sähköhybrideillä? Ja miten paljon päästöt ovat keskimäärin vähentyneet 1990-luvun puolivälistä alkaen?

Näihin kysymyksiin hain vastauksia, kun kävin läpi ajoneuvojen avointa datan 5.13 aineistoa Traficomin sivuilta. Ajoneuvojen avoin data sisältää kaikkien liikennekäytössä olevien ajoneuvojen rekisteröinti-, hyväksyntä- ja teknisiä tietoja Traficomin ylläpitämästä liikenneasioiden rekisteristä.

Aineisto löytyy osoitteesta: https://www.traficom.fi/fi/ajankohtaista/avoin-data

Aineistossa oli rivejä yhteensä 5 121 148 kpl ja se oli julkaistu 3.2.2021. Aineistosta poimin datan vain henkilöautoista (ajoneuvoluokat M1 ja M1G) ja rajasin sitä vielä vuoden 2019 alusta lähtien ensirekisteröityihin. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.

Mitkä ovat suosituimmat merkit? Kärjessä keikkuvat Toyota, Volvo ja Mercedez-Benz.

Mitkä ovat taas suosituimmat mallit? Kärkikolmikon muodostavat Nissanin, Toyotan ja Skodan mallit. Suomalaiset suosivat käytännönläheisyyttä, kun ne nostavat farmarit ja monikäyttöajoneuvot ostoslistan kärkeen.

Mitkä ovat suosituimmat värit ensirekisteröinnissä? Kolmen kärki oli valkoinen, harmaa ja musta. Suosituimmat värit suosituimmilla merkeillä vaihtelivat. Harmaa oli suosituin väri Skodalla ja Suzukilla. Mustaa suosivat eniten premium-merkit kuten Audi-, BMW-, Mercedes-Benz- ja Volvo-kuskit. Punaisesta tykkäsivät eniten Mazdalla ajavat. Valkoinen oli suosituin usealla merkillä.

Mitkä ovat suosituimmat käyttövoimat? Huhut polttomoottorin kuolemasta näyttävät olevan vahvasti liioiteltuja. Bensiini on vahvasti paalupaikalla ja diesel jyrää kakkosena. Kolme sadasta valitsi autoonsa sähköteknologian.

Mitkä ovat suosituimmat vaihteistot? Automaatti on syrjäyttänyt perinteisen vaihteiston. Kaksi kolmesta valitsi automaatin.

Kiinnostavaa oli tietää myös, minkä merkkien mallistoissa on eniten sähköhybridejä? Kärjessä ovat Toyota, Mitsubishi ja Volvo. Ensirekisteröityjen sähköhybridien hiilidioksidipäästöt ovat keskimäärin noin 98 grammaa.

Autojen polttomoottoriteknologian kehittyminen näkyy vahvasti hiilidioksidipäästöjen kehityksessä. Päästöt ovat vähentyneet rajusti 1990-luvun puolivälistä alkaen. Vielä 1990-luvun puolivälissä päästöt olivat keskimäärin yli 220, kun nyt ne ovat keskimäärin noin 130.

Kuvaus koodista on nähtävissä github-profiilissani: https://github.com/markok20/Ajoneuvodata

Kuinka mitata markkinointikampanjan onnistumista?

Featured

Yksi perinteisistä kampanjoiden mittaamiskeinoista on RFM-menetelmä, jonka avulla analysoidaan kerätty kuluttajakäyttäytymisen data. Se mittaa oston viimeaikaisuutta (Recency), oston tiheyttä (Frequency) ja ostojen rahallista arvoa (Monetary value).

RFM-menetelmää käytetään markkinointikampanjoiden ja suorakirjeiden kohdentamisessa. Se hyödyntää historiatietoa kulutuskäyttäytymisestä segmentoinnin perustana, kun aiemmin segmentoinnin perusteena käytettiin demografisia tekijöitä. Jokainen asiakas pisteytetään yhdestä viiteen jokaisen muuttujan mukaan. Lopuksi muuttujien arvot lasketaan yhteen ja saadaan RFM-tulos. Menetelmän muuttujia voidaan myös hyödyntää asiakkaan elinkaaren arvon arvioimisessa.

Hyödynnetään seuraavaksi menetelmää esimerkkidatassa, jota ristiintaulukoidaan muun muassa sukupuolen, siviilisäädyn ja tulojen mukaan. Kuvataan ensiksi avainmuuttuja eli ostopäätös. Huomataan, että “no response” on 85.5%.

Alla huomataan, että sukupuolten välillä ei ole suuria eroja ostopäätöksessä.

Kuvataan seuraavaksi avainmuuttujaa eli ostopäätöstä tulojen mukaan. Näin huomataan, että kampanja puree erittäin hyvin asiakkaisiin, joiden tulot ovat yli 55 000. Vastaavasti sukupuolten välillä ei ole eroja, kun tulot ovat alle 55 000.

Alla huomataan, että siviilisäätyjen välillä ei ole suuria eroja ostopäätöksessä.

Kuvataan lopuksi RFM-tulos. Siinä nähdään, että korkea RFM-tulos on linjassa kampanjan onnistumisen kanssa.

RFM-menetelmä on suosittu, koska se on yksinkertainen, helppo ja nopea. Menetelmä on kustannustehokas tapa hallinnoida ja segmentoida suuria asiakaskantoja. Tarvittava data saadaan helposti sisäisistä laskenta- ja toiminnanohjausjärjestelmistä. Menetelmä tunnistaa mahdollisia poistuvia asiakkaita. RFM-muuttujien on todettu myös toimivan erinomaisesti uskollisten asiakkaiden tunnistamisessa.

Toisaalta muuttujien vähyys on tuonut mukanaan kritiikkiä. Se toimii hyvin vain arvokkaimpien asiakkaiden tunnistamisessa ja lyhyen aikavälin kannattavuuden parantamisessa. Menetelmä ei huomioi myöskään matalan RFM-arvon saaneiden asiakkaiden potentiaalia. Suurin osa asiakkaista kuitenkin ostaa harvoin ja käyttää pieniä summia rahaa. RFM ei sovellu uusille yrityksille, koska uusilla yrityksillä ei vielä ole tarvittavaa määrää asiakastietoa luotettavaan analysointiin.

Menetelmää voi hyödyntää vain nykyisen asiakaskantaan. Sitä ei voi hyödyntää tulevien asiakkaiden kannattavuuden arvioimiseen, koska mahdollisista uusista asiakkaista ei ole saatavilla kulutusdataa. Yhtenä keinona RFM-mittarin tehon parantamiseen on ehdotettu painotettua laskemistapaa, mutta se vaatii syvällistä toimialan ja liiketoiminnan tuntemista.

Kuvaus Python-koodista on nähtävissä github-profiilissani: https://github.com/markok20/Markkinointipanostukset

Case-esimerkki aikasarja-analyysistä: osakekurssien historiavertailu

Featured

Osakekurssit tarjoavat hyvän aineiston aikasarja-analyysille, jonka avulla voidaan tehdä päätelmiä aikasarjan taustalla olevista mahdollisista satunnaisprosesseista. Mallin perusteella voidaan tehdä menneiden havaintojen avulla ennusteita jopa tulevista arvoista. Tyypillinen sovellus aikasarja-analyysista on osakkeen avauskurssin ennustaminen kurssin historialla.

Miten ja kuinka aikasarjoja voidaan kuvailla analytiikalla? Käytettävissäni oli data, joka alkoi tammikuun 2015 alusta joulukuuhun 2020 saakka. Aineisto sisälsi 1506 pörssipäivän tiedot. Keskityin kahteen teleoperaattoriin Teliaan ja Elisaan.

Kummankin yhtiön päätöskurssit näkyvät alla kahden arvoakselin viiva-asteikossa viimeisen viiden vuoden ajalta.

Seuraavaksi tarkastelin liukuvia keskiarvoja, joilla tasoitetaan yksittäisiin ajankohtiin liittyviä satunnaisia piikkejä. Teknisessä analyysissä aikasarjan ja liukuvien keskiarvojen leikkauskohtia käytetään osto- ja myyntisignaaleina. Katsotaan esimerkiksi Elisan päätöskurssin kehitystä vuosina 2015-2020 ja lisätään kuvioon 200 päivän liukuva keskiarvo.

Seuraavaksi tarkastelin miten osakkeiden muutosprosentit edellispäivästä ovat seuranneet toisiaan vuoden 2020 aikana.

Korreloivatko Telian ja Elisan kurssikäyrät toisiaan? Teleoperaattoreiden muutosprosentit korreloivat positiivisesti. Muutosprosenttien positiivinen korrelaatio näkyy hyvin hajontakaaviossa.

Liukuva korrelaatio kertoo miten muutosprosentit korreloivat eri aikoina.

Seuraavaksi tarkastelin volaliteettia, joka kuvaa osakkeeseen liittyvää riskiä. Tavallisimmin luku lasketaan päivätuottojen keskihajonnasta ja ilmoitetaan prosentteina vuodessa. Laskin volatiliteetin päivittäisten muutosprosenttien keskihajontana ja skaalasin sen vuositasolle kertomalla vuoden kaupantekopäivien lukumäärän neliöjuurella. Liukuva volatiliteetti kuvaa, miten se on muuttunut ajan kuluessa.

Lyhyesti kiteytettynä: aikasarja on havaintoyksiköstä tehtyjen mittausten muodostama aineisto. Havainnot ovat tavallisesti peräkkäisiä, ja mittaukset on tehty tasaisin aikavälein. Moniulotteinen aikasarja-aineisto koostuu usean havaintoyksikön mittauksista, jotka on yleensä tehty samoina ajankohtina. Aikasarja-aineiston edellytys on se, että se voi olla jatkuvaa tai diskreettiä.

Aikasarjojen perusteella voidaan tehdä menneiden havaintojen avulla ennusteita tulevista arvoista.

Kuinka tutkia asiakaskokemusta Twitter-viesteistä?

Featured

Asiakaskokemuksen mittaaminen on noussut keskeiseen asemaan monessa työyhteisössä. Miksi sen mittaaminen on sitten tärkeää? Erinomaisen asiakaskokemuksen nähdään vetävän myynnin ja kasvun mittareita ylöspäin. Ne kulkevat käsi kädessä.

Asiakaskokemuksen ydin on työyhteisön ja asiakkaan vuorovaikutuksessa. Asiakaskokemus käsittää mielikuvia ja tunteita, jotka syntyvät asiakkaalle kohtaamisista yhteisön edustajien, kanavien ja palveluiden kanssa. Hyvä asiakaskokemus tarkoittaa, että asiakaskokemus vastaa asiakkaan odotuksia tai jopa ylittää odotukset. Myönteinen asiakaskokemus pitää yllä asiakasuskollisuutta ja houkuttelee uusia asiakkaita.

Miten ja kuinka voidaan tutkia asiakaskokemusta asiakkaiden Twitter-viesteistä? Otin case-aineistoksi datan helmikuulta 2015. Data-aineisto sisälsi noin 15 000 tietoriviä. Aineistossa Twitter-viestien lähettäjinä olivat yhdysvaltalaisten lentoyhtiöiden asiakkaat, jotka päivittivät Twitteriin asiakaskokemustaan heti asiakaskohtaamisen jälkeen. Alla kuvassa on ryhmitelty vastaajaryhmät prosenttiosuuksin. Eniten aineistossa vastauksia oli siis United Airlinesilta ja vähiten Virgit Americalta.

Laajaa datajoukkoa kävin läpi sentimenttianalyysillä, joka kategorisoi tekstipohjaiset viestit eli tviitit sävyn mukaan. Sävy voi olla joko positiivinen, neutraali tai negatiivinen. Samalla viesteistä eriteltiin esiin nousevat teemat eli usein esiintyvät termit ja aiheet.

Tarkoituksena oli tarkastella myönteisiä ja kielteisiä kokemuksia sekä vertailla näitä tuloksia lentoyhtiöiden välillä. Tavoitteena oli selvittää, kuinka asiakkaat olivat reagoineet, tunteneet ja ajatelleet asiakaskokemuksesta Twitterissä heti kohtaamisen jälkeen? Siksi viesteistä oli nostettu esiin syyt muun muassa kielteiselle asiakaskokemukselle.

Datassa oli edustettuna kuusi suurta yhdysvaltalaista lentoyhtiötä. Sentimenttianalyysin tulosten mukaan kaksi kolmesta tviitistä oli sävyltään kielteinen ja joka viides neutraali. Vain 15 prosenttia tviiteistä oli myönteisiä. Nämä vastausryhmät on eritelty alla olevassa kuvassa prosenttiosuuksin.

Suurin selittävä syy kielteiselle asiakaskokemukselle oli tietty asiakaspalveluun liittynyt tilanne. Toiseksi yleisin syy oli lennon myöhästyminen. Kolmanneksi yleisin syy oli se, että vastaaja ei kyennyt kertomaan tarkkaa syytä kielteiselle asiakaskokemukselle. Neljänneksi yleisin syy oli peruuntunut lento ja viidenneksi kadonneet matkatavarat lennon aikana. Nämä kielteiset syyt on ryhmitelty alla prosenttiosuuksin.

Twitter-aineiston data-analytiikka tarjoaa mahdollisuudet tarkemmallekin ristiintaulukoinnille. Eli datan pohjalta voidaan rankata lentoyhtiöt paremmuusjärjestykseen ja tarkastella aiheittain lentoyhtiöiden paremmuutta.

Tämän sentimenttianalyysin tuloksena voidaan muun muassa perustella sitä, että lentoyhtiöt parantaisivat asiakaskokemustaan, jos ne panostaisivat lentojen täsmällisyyteen ja nopeaan asiakasvuoropuheluun, kun asiakkaiden matkatavarat katoavat. Erinomainen asiakaskokemus palvelualalla vaatii saumattomuutta: hyvää asiakaspalvelua aina tiedon etsimisestä ja lippujen ostamisesta alkaen, matkan aikana ja aina siihen saakka, kun saavutaan lennolla määränpäähän.