Palautedata kertoo: missä hotellissa Lontoossa on paras asiakaskokemus?

Featured

Suunnitteletko matkaa kesällä Lontooseen? Haluatko tietää, missä hotellissa on paras asiakaskokemus otannan perusteella? Mitkä hotellit asiakkaat rankkaavat kärkeen? Mitä tekijöitä asiakkaat arvostavat eniten hotellissa: sijaintia tai palvelua? Kumpi merkitsee enemmän?

Näihin kysymyksiin hain vastauksia, kun kävin läpi Lontoon hotellien avointa dataa, jossa oli mukana kymmenkunta hotellia sekä kalleimmasta että edullisimmista päästä.  Hain datan data.world-tietokannasta, jonne tiedot oli kerätty matkailuportaalin sivuilta vuosien 2012-2018 aikana.  

Aineisto löytyy osoitteesta:

https://data.world/promptcloud/customer-of-reviews-of-london-based-hotels

Koko aineistossa oli rivejä yhteensä 27 330 kpl. Aineistoja rajasin sillä, että poistin mielipiteistä ei englantia sisältävän palautteen. Rajausten jälkeen palauterivien määrä laski 23 578 kpl:een. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.

Otannassa oli mukana seuraavat hotellit, vastausten määräjärjestyksessä
The Savoy 5073
Mondrian London at Sea Containers 3937
The Rembrandt 2524
Corinthia Hotel London 2519
Apex London Wall Hotel 1977
The Dorchester 1560
Hotel Xenia, Autograph Collection 1230
Ridgemount Hotel 1026
Mandarin Oriental Hyde Park, London 1024
Rhodes Hotel 988

Missä hotellissa on sitten paras asiakaskokemus? Datassa hotellikävijät arvioivat asiakaskokemusta arvosanaskaalalla (1=huono – 5=erittäin hyvä. Tulosten perusteella asiakaskokemus on hyvällä tasolla, koska valtaosa oli rankannut kokemuksen joko arvosanaksi 4 tai 5.

Kun vastauksiin otin mukaan vain arvosanan 5, niin kärkeen nousivat Corinthia Hotel London, The Savoy and The Dorchester.


Paras asiakaskokemus, % vastausmäärästä, arvosana 5 vain mukana
Corinthia Hotel London 86,78
The Savoy 78,85
The Dorchester 77,05
Apex London Wall Hotel 75,82
Mondrian London at Sea Containers 74,14
Hotel Xenia, Autograph Collection 64,96
Mandarin Oriental Hyde Park, London 61,82
Ridgemount Hotel 54,19
The Rembrandt 45,13
Rhodes Hotel 38,06

Mitkä sanat sitten toistuivat palautteissa eniten? Yhtenä visualisointitapana on sanapilvi. Mitä suuremmalla fontti on, sitä tiheämmin sana esiintyy vastausdatassa. Sanapilvestä näkee, että muun muassa palvelukyky, sijainti, henkilökunta, palvelualttius, ravintola, baari, hyvä ja ihastuttava nousevat tiheyskärkeen. Sanapilven heikkoutena on se, että siitä on vaikea määrittää tiheysarvoja eksaktisti.

Toisena tapana on lemmatisoida eli perusmuotoistaa sanat perusmuotoon ja nostaa esiin tiheimmin esiintyvät sanat. Alta kuviosta selviää, että palvelukyky esiintyy useammin datassa kuin sijainti. Toisin sanoen kävijät arvostavat enemmän hotellin kykyä palvella asiakkaita kuin sen sijaintia.

Toisena tapana on käyttää n-gram-algoritmiä, joka laskee datasta eniten toistensa kanssa esiintyvät sanat. Alta selviää, että ystävällinen henkilökunta mainitaan useammin vastauksissa kuin esimerkiksi hyvä sijainti.

Mitkä kaksi sanaa esiintyivät palautteissa eniten yhdessä?
(afternoon, tea) 1720
(staff, friendly) 1638
(stay, hotel) 1576
(room, service) 1497
(tube, station) 1476
(highly, recommend) 1395
(great, location) 1344
(one, night) 1326
(hyde, park) 1283
(walk, distance) 1230
(friendly, helpful) 1205
(american, bar) 1128
(5, star) 1123
(recommend, hotel) 1115
(would, definitely) 1112
(come, back) 1059
(go, back) 1010
(room, clean) 994
(stay, savoy) 989
(room, small) 978

Lisäksi alta selviää, että ystävällinen, palvelualtis henkilökunta mainitaan useammin vastauksissa kuin esimerkiksi kävelymatkan päässä oleva sijainti tai hotellin hyvä sijainti.

Mitkä kolme sanaa esiintyivät palautteissa eniten yhdessä?
(stay, one, night) 548
(staff, friendly, helpful) 536
(nothing, much, trouble) 481
(within, walk, distance) 460
(would, highly, recommend) 444
(would, definitely, stay) 440
(make, us, feel) 436
(hotel, great, location) 339
(apex, london, wall) 332
(5, star, hotel) 313
(would, definitely, recommend) 311
(highly, recommend, hotel) 301
(south, kensington, tube) 291
(would, recommend, hotel) 244
(worth, every, penny) 241
(full, english, breakfast) 229
(victoria, albert, museum) 227
(5, minute, walk) 224
(kensington, tube, station) 210
(royal, albert, hall) 197

Johtopäätökset:

  • Hotellikävijät arvostavat ystävällistä, palvelualtista asiakaskokemusta enemmän kuin hotellin erinomaista sijaintia.
  • Sijainnilla on kuitenkin väliä. Kävijät arvostavat sijaintia metroaseman juuressa.
  • Aamiaisella on merkitystä. Kävijät haluavat nauttia englantilaisesta aamiaisesta.
  • Asiakkaille merkitsee hotellin läheisyydessä olevat maamerkit muun muassa Kensington, Hyde Park ja Royal Albert Hall.

Eksploratiivinen data-analyysi on nähtävissä github-kansiossani kahdessa osassa:

https://github.com/markok20/London-Hotels-exploratory-data-analysis

Traficomin avoin data: Näitä täyssähköautoja Suomi rekisteröi 2021-2022!

Featured

Mitkä ovat suosituimmat täyssähkömallit ja suosituimmat täyssähkömerkit ensirekisteröinneissä vuodesta 2021 alkaen? Missä Suomessa maantieteellisesti ensirekisteröitiin täyssähköautoja eniten?


Näihin kysymyksiin hain vastauksia, kun kävin läpi ajoneuvojen avointa datan aineistoa Traficomin sivuilta. Ajoneuvojen avoin data sisältää kaikkien liikennekäytössä olevien ajoneuvojen rekisteröinti-, hyväksyntä- ja teknisiä tietoja Traficomin ylläpitämästä liikenneasioiden rekisteristä.


Aineisto löytyy osoitteesta: https://tieto.traficom.fi/fi/tietotraficom/avoin-data?toggle=Ajoneuvojen%20avoin%20data


Aineistossa oli rivejä yhteensä 5 163 487 kpl ja se oli julkaistu 12.2.2023. Aineistosta poimin datan vain henkilöautoista (ajoneuvoluokat M1 ja M1G) ja rajasin sitä vielä vuoden 2021 alusta lähtien ensirekisteröityihin. Täyssähköautoja rekisteröitiin ajanjaksolla 35 494. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.


Mitkä ovat suosituimmat täyssähköautomerkit? Paalupaikalla on Tesla. Kakkosena on Volkswagen ja kolmantena Hyundai. Neljäntenä on Skoda ja viidentenä on Nissan.

SUOSITUIMMAT TÄYSSÄHKÖAUTOMERKIT
Tesla 7584
Volkswagen 5088
Hyundai 2308
Skoda 2125
Nissan 2091
Volvo 1883
Mercedes-Benz 1798
Kia 1646
Audi 1553
Polestar 1363
BMW 1337
Peugeot 856
Ford 757
Renault 725
Opel 588
Porsche 536
Tesla Motors 475
Seat 402
BMW i 339
Fiat 273

Mitkä ovat taas suosituimmat täyssähköautomallit? Kärkiviisikon muodostavat Teslan, Volkswagenin ja Nissanin mallit. Suosituimmissa täyssähköautoissa on paljon sedan-tyyppisiä malleja, kun perinteisissä käyttövoimissa suomalaiset suosivat käytännönläheisyyttä, kun he nostavat farmarit ja monikäyttöajoneuvot ostoslistan kärkeen.

SUOSITUIMMAT TÄYSSÄHKÖAUTOMALLIT
Model 3 Sedan (AA) 4ov 4784
Model Y Monikäyttöajoneuvo (AF) 5ov 2053
ID.4 PRO 150 KW Farmari (AC) 5ov A 1733
Nissan Leaf 40kWh Monikäyttöajoneuvo (AF) 4ov 1606
Polestar 2 Sedan (AA) 5ov 1339
XC40 Farmari (AC) 5ov 1255
Kona Monikäyttöajoneuvo (AF) 5ov 1067
ENYAQ 80 Farmari (AC) 5ov A 935
NIRO Farmari (AC) 5ov 779
Model S Viistoperä (AB) 5ov 761
Mustang Mach-E Viistoperä (AB) 4ov A 756
IONIQ5 Monikäyttöajoneuvo (AF) 5ov A 712
C40 Farmari (AC) 5ov 626
EV6 Monikäyttöajoneuvo (AF) 5ov A 598
EQC 400 4MATIC Farmari (AC) 5ov 583
ENYAQ 60 Farmari (AC) 5ov A 580
ENYAQ 80X Farmari (AC) 5ov A 534
IONIQ Viistoperä (AB) 5ov 495
ID.3 PRO 150 KW Farmari (AC) 5ov 491
UP! Viistoperä (AB) 5ov A 439

Mitkä ovat taas suosituimmat täyssähköautojen kaupalliset nimet? Teslan kaupallisten mallien nimet ovat ensimmäisellä ja toisella sijalla.

SUOSITUIMMAT TÄYSSÄHKÖAUTOJEN KAUPALLISET NIMET
Model 3 4794
Model Y 2053
ID.4 PRO 150 KW 1736
Nissan Leaf 40kWh 1607
Polestar 2 1348
XC40 1255
Kona 1067
ENYAQ 80 938
NIRO 898
Model S 803
Mustang Mach-E 756
IONIQ5 714
ID.3 PRO 150 KW 679
C40 626
EV6 598
EQC 400 4MATIC 586
ENYAQ 60 580
ENYAQ 80X 534
ZOE 524
IONIQ 497

Missä Suomessa maantieteellisesti ensirekisteröitiin täyssähköautoja eniten? Alueittain ensirekisteröintejä tehtiin eniten Etelä-Suomen kasvukeskuksissa kuten Helsingissä, Espoossa, Vantaalla, Tampereella ja Oulussa.


Kuvaus koodista on nähtävissä github-profiilissani: https://github.com/markok20/Traficom-e-cars-EDA-analysis

Traficomin avoin data: Näitä autoja Suomi rekisteröi 2021-2022!

Featured

Mitkä ovat olleet suosituimmat mallit ja merkit ensirekisteröinneissä Suomessa vuodesta 2021 alkaen? Mitkä ovat suosituimmat värit suosituimmilla merkeillä? Mitkä olivat suosituimmat käyttövoimat ja vaihteistot? Minkä merkin mallistossa on eniten sähköhybridejä? Mitkä ovat keskimääräiset päästöt sähköhybrideillä? Ja miten paljon päästöt ovat keskimäärin vähentyneet 1990-luvun puolivälistä alkaen?

Näihin kysymyksiin hain vastauksia, kun kävin läpi ajoneuvojen avointa datan aineistoa Traficomin sivuilta. Ajoneuvojen avoin data sisältää kaikkien liikennekäytössä olevien ajoneuvojen rekisteröinti-, hyväksyntä- ja teknisiä tietoja Traficomin ylläpitämästä liikenneasioiden rekisteristä.

Aineisto löytyy osoitteesta: Avoin data | Tieto Traficom

Aineistossa oli rivejä yhteensä  5 163 487 kpl ja se oli julkaistu 24.2.2023. Aineistosta poimin datan vain henkilöautoista (ajoneuvoluokat M1 ja M1G) ja rajasin sitä vielä vuoden 2021 alusta lähtien ensirekisteröityihin. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.

Mitkä ovat suosituimmat merkit? Kärjessä keikkuvat Toyota, Volvo ja Mercedez-Benz.

SUOSITUIMMAT MERKIT

Toyota 34355
Volvo 26251
Mercedes-Benz 23918
Volkswagen, VW 23043
BMW 18333
Skoda 17922
Kia 16654
Audi 10560
Ford 10131
Tesla 7584
Nissan 6978
Hyundai 6960
Opel 5571
Mitsubishi 5530
Peugeot 5229
Renault 3765
Citroen 3462
Seat 2571
Suzuki 2013
Dacia 1997

Mitkä ovat taas suosituimmat mallit? Kärkikolmikon muodostavat Toyotan, Teslan ja Volvon mallit. Suomalaiset suosivat käytännönläheisyyttä, kun ne nostavat farmarit ja monikäyttöajoneuvot ostoslistan kärkeen.

SUOSITUIMMAT MALLIT
TOYOTA YARIS Viistoperä (AB) 4ov 1490cm3 6681
TOYOTA COROLLA Farmari (AC) 4ov 1798cm3 6421
TOYOTA RAV4 Farmari (AC) 4ov 2487cm3 5068
Model 3 Sedan (AA) 4ov 4784
XC60 Farmari (AC) 5ov 1969cm3 A 4699
TOYOTA C-HR Viistoperä (AB) 4ov 1798cm3 3548
V60 Farmari (AC) 5ov 1969cm3 A 3145
PASSAT Farmari (AC) 5ov 1395cm3 A 2632
Nissan Qashqai Monikäyttöajoneuvo (AF) 4ov 1332cm3 2279
Kuga Monikäyttöajoneuvo (AF) 4ov 2488cm3 2074
XC40 Farmari (AC) 5ov 1477cm3 A 2073
Model Y Monikäyttöajoneuvo (AF) 5ov 2053
Mitsubishi Outlander Farmari (AC) 4ov 2360cm3 1950
V90 Farmari (AC) 5ov 1969cm3 A 1917
TOYOTA YARIS CROSS Viistoperä (AB) 4ov 1490cm3 1900
ID.4 PRO 150 KW Farmari (AC) 5ov A 1733
Nissan Leaf 40kWh Monikäyttöajoneuvo (AF) 4ov 1606
NIRO Farmari (AC) 5ov 1580cm3 A 1539
Nissan Qashqai Monikäyttöajoneuvo (AF) 4ov 1332cm3 A 1458
X3 xDrive30e Farmari (AC) 4ov 1998cm3 A 1427

Mitkä ovat suosituimmat värit ensirekisteröinnissä? Kolmen kärki oli valkoinen, harmaa ja musta.

SUOSITUIMMAT VÄRIT
White 67128
Grey 52559
Black 51030
Blue 28404
Red 21635
Silver 13180
Brown 8116
Green 3469
Orange 2465
Yellow 2108
Multicolor 383
Purple 320
Turquoise 273

Suosituimmat värit suosituimmilla merkeillä vaihtelivat. Harmaa oli suosituin väri Dacialla. Mustaa suosivat eniten premium-merkit kuten Audi-, BMW-, Mercedes-Benz- ja Volvo-kuskit. Valkoinen oli suosituin usealla merkillä.


Mitkä ovat suosituimmat käyttövoimat? Huhut polttomoottorin kuolemasta näyttävät olevan vahvasti liioiteltuja. Bensiini on vahvasti paalupaikalla ja diesel jyrää kakkosena. Yli 14 prosenttia valitsi autoonsa sähköteknologian.

SUOSITUIMMAT KÄYTTÖVOIMAT
Petrol 68
Diesel fuel 16,4
Electricity 14,1
CNG 0,8
Petrol/CNG 0,6
Petrol/Electricity 0,1
Petrol/Ethanol 0,1

Mitkä ovat suosituimmat vaihteistot? Automaatti on syrjäyttänyt perinteisen vaihteiston. Kaksi kolmesta valitsi automaatin.

SUOSITUIMMAT VAIHTEISTOT
Automatic 61,7
Stepless 16,1
Manual 11,7

Kiinnostavaa oli tietää myös, minkä merkkien mallistoissa on eniten sähköhybridejä? Kärjessä ovat Suzuki, Mitsubishi ja Toyota. Ensirekisteröityjen sähköhybridien hiilidioksidipäästöt ovat keskimäärin noin 102 grammaa.

MERKIT, JOISSA ENITEN SÄHKÖHYBRIDEJÄ
Suzuki 88,7
Mitsubishi 87,6
Toyota 87,3
BMW 61,0
Volvo 58,7
Audi 53,7
Ford 47,1
Renault 45,0
Seat 45,0
Mercedes-Benz 44,1
Kia 39,8
Hyundai 39,5
Nissan 29,6
Volkswagen, 26,5
Skoda 24,1
Peugeot 15,3
Citroen 13,3
Opel 7,7

Autojen polttomoottoriteknologian kehittyminen näkyy vahvasti hiilidioksidipäästöjen kehityksessä. Päästöt ovat vähentyneet rajusti 1990-luvun puolivälistä alkaen. Vielä 1990-luvun puolivälissä päästöt olivat keskimäärin yli 220, kun nyt ne ovat keskimäärin noin 130.


Kuvaus koodista on nähtävissä github-profiilissani: https://github.com/markok20/Traficom

Mitä tietoa Suomi hakee Googlesta juuri nyt?

Featured

Mitä tietoa suomalaiset hakevat Googlen kautta? Mitkä ovat TOP 10 -teemat? Ja missä maassa haetaan eniten tietoa Teslasta? Ja kumpi, Espoo tai Vantaa, kumpi on haluttavampi ja kiinnostuksen paalupaikalla hakukoneessa?

Näihin kysymyksiin etsin vastauksia. Käytettävissä oli 10.10.2022 haettu Googlen Trends data. Google Trends on Googlen verkkosivusto, joka analysoi Google-haun hakukyselyiden suosiota lähes kaikilla alueilla, kielillä ja luokissa. Pureuduin dataan kiinni Pythonin Pytrendsin kirjastolla, josta poimin melkein kaiken, mitä Google Trends -verkkosivustolla on saatavilla.

Tarkastellaan ensin viimeisen kymmenen vuoden ajalta, miten hakusanojen Elisa Viihteen ja Telia TV:n hakukiinnostus on kehittynyt. Telia TV on ollut hieman takamatkalla, mutta on kuronut eron kiinni ja noussut Elisa TV:n ohi hakukiinnostuksessa viimeisten vuosien aikana.

Seuraavaksi katsotaan maailmanlaajuisesti, missä maissa Teslan hakukiinnostus on korkein. Kärjessä ovat seuraavat maat:

  • Serbia                                     100
  • Norja                                       86
  • Liechtenstein                         61
  • Huippuvuoret                      56
  • Montenegro                           53

Kiinnostavaa on tietää, millä hakusanoilla Teslaa haetaan eniten. Kärjessä ovat seuraavat hakusanat:

  • 0                         tesla model      100
  • 1                         stock tesla        86
  • 2                         tesla price        52
  • 3                         model 3            47
  • 4                         tesla model 3  46
  • 5                         nikola tesla      34
  • 6                         tesla model s   32
  • 7                         tesla car           26
  • 8                         tesla stock price 20
  • 9                         tesla model x  19
  • 10                       tesla share       14
  • 11                       aktie tesla        14
  • 12                       tesla share price 14
  • 13                       tesla model y  11
  • 14                       tesla roadster  11
  • 15                       model y            10
  • 16                       tesla cars          10
  • 17                       tesla truck        10
  • 18                       tesla news        9
  • 19                       elon musk        9
  • 20                       tesla elon musk 9

Kiinnostavaa on myös tietää, mitkä ovat olleet viimeisen vuorokauden aikana Suomessa kiinnostavimmat hakusanat?

  • 0                         Katie Piper
  • 1                         Bornholm
  • 2                         Madonna
  • 3                         Moldova
  • 4                         Ian Cole
  • 5                         Manu
  • 6                         Air Force one
  • 7                         Harriet Tubman
  • 8                         Ozzy Osbourne
  • 9                         San Marino
  • 10                       Air force 1
  • 11                       Arsenal – Liverpool
  • 12                       Everton – manu
  • 13                       Christopher Lloyd
  • 14                       Iker Casillas
  • 15                       Jordan Peterson
  • 16                       Abyss
  • 17                       Jules Bianchi
  • 18                       Barcelona – Celta Vigo
  • 19                       Max Verstappen

Katsotaan seuraavaksi, mikä on ollut kiinnostusaste hakea Espoota ja Vantaata viimeisen vuoden ajalta. Näyttää siltä, että Espoo on hieman edellä ja on ollut hieman kiinnostavampi kaupunki hakea kuin Vantaa.

Yhteenvedonomaisesti: Google Trends -dataa ja pytrends-kirjastoa voi hyödyntää tiedonkeruudatana ja tutkimusaineistona muun muassa oman yrityksen markkinointiviestinnän ja hakukoneoptimoinnin suunnittelussa. Sen päämääränä on tuoda verkkosivustolle lisää kävijöitä hakukoneista ja konvertoida heidät ostaviksi asiakkaiksi ilman, että joudut maksamaan niiden hankkimisesta.

Kuvaus koodista on nähtävissä github-profiilissani:

Koneoppimismalli ennustaa: kuinka sähkön pörssihinta kehittyy lähikuukausina?

Featured

Mikä sähköön liittyvä asia kiinnostaa jokaista kotitaloutta, joka asuu suorasähkölämmitteisessä talossa? No, tietenkin miten sähköpörssissä muodostuva sähkön hinta kehittyy seuraavien viikkojen tai kuukausien aikana? Onko hinnassa selvä trendi tai kausittaisuus? Minä kuukausina hinta nousee selkeästi keskimääräistä korkeammaksi ja milloin laskee?

Näihin kysymyksiin etsin vastauksia. Käytettävissä oli tammikuusta 2013 alkaen data, joka sisälsi 3 296 riviä spot-hintatietoa. Data ulottui aina 9. tammikuuhun 2022 saakka. Spot-hinta määräytyy Pohjoismaisessa Nord Pool-sähköpörssissä, jossa muodostetaan sähkön hinta jokaiselle vuorokauden tunnille. Suomen alueelle muodostuu oma Spot-hinta. Kuvaan aluksi hinnan kehitystä tammikuusta 2013 alkaen laskettuna siten, että kullekin kuukaudelle on määritelty keskiarvo. Niin kuin kuviosta näkyy, niin marras-joulukuussa 2021 hintakäyrä lähti jyrkkään nousuun, mutta tasoittui joulu-tammikuun vaihteessa.

Miten voidaan luoda täydellinen ennuste koneoppimismallilla sähkön pörssihinnan kehityksestä? Perinteisesti ennustemallina on käytetty liukuvaa keskiarvoa, joka on yksinkertaisin malli ennustaa kehitystä. Liukuvan keskiarvon menetelmässä tulevan ajanhetken kysynnän ennuste on keskiarvo menneiden ajanhetkien kysynnästä. Kuvaan alla liukuvan keskiarvohinnan (rolling mean) kehitystä, jossa näkyy myös joulukuun 2021 hintapiikki.

Eksponentiaalisen tasoituksen malli

Itse käytän ratkaisuna eksponentiaalisen tasoituksen (liukuva keskiarvo painotettuna tuoreimpiin ajankohtiin) mallia, joka reagoi herkästi muutoksiin ja on helposti päivitettävissä. Kyseessä on yksi suosituimmista kysynnän ennustamisen malleista.

Malliin voidaan lisätä komponentteja, jotka huomioivat trendin ja kausivaihtelun. Kysyntään vaikuttavia tekijöitä ovat kysynnän perustason lisäksi trendi-, kausi-, sykli- ja markkinointitekijät sekä ennustamaton vaihtelu.

Tarkastellaan seuraavaksi trendin ja kausittaisuuden kehitystä. Tuloksena saan neljä kuviota:

alkuperäinen aikasarja ylimmäisenä

aikasarjasta erotettu trendi toiseksi ylimmäisenä

aikasarjan kausivaihtelu toiseksi alimmaisena

aikasarjan jäljelle jäänyt osa trendin ja kausivaihtelun poistamisen jälkeen alimmaisena.

Yllä olevassa kuvassa nähdään, että trendi on aluksi hieman laskeva, mutta nouseva vuodesta 2016 – 2019, kunnes siirtyy uudestaan laskevaksi, mutta taas 2021 vuoden toisella puoliskolla trendi kääntyy jyrkkään nousuun. Datassa on nähtävissä selkeä kausittaisuus. Kausittaisuudesta nähdään se, että hinta nousee vuodenvaihteessa, mutta kääntyy kesää kohti laskevaksi. Kesän jälkeen hintakäyrä on nouseva vuodenvaihteeseen saakka.

Sovitetaan eksponentiaalista mallia historiadataan ja simuloidaan toteutunutta kehitystä ennusteella. Alla olevassa kuvassa nähdään ennusteen sovittuvan hienosti toteutuneeseen kehitykseen.

Tehdään historiadatan perusteella koneoppimismallilla ennustus, miten hinta kehittyy seuraavien 24 viikon aikana eli tammi-kesäkuussa 2022.

On hyvä muistaa, että Suomen alueen spot-hinta määräytyy sähköpörssissä seuraavan vuorokauden jokaiselle tunnille vuorokautta edeltävänä päivänä viimeistään kello 12:30 (CET). Hinta muodostuu sähköpörssiin syötettyjen osto- ja myyntitarjousten leikkauspisteessä.

Datassa oleva spot-hinta on raaka markkinahinta sähköenergialle kullekin alueelle, eikä se ota huomioon sähkönmyyjän toimintakustannuksia, kuten alkuperäsertifikaatteja, toimitusmaksua, profiilikustannuksia tai esimerkiksi sähkönmyyjän laskutusta tai asiakaspalvelua. Nord Poolissa sähkön hintojen yksikkönä käytetään euroa per megawattitunti, eivätkä pörssin listalla näkyvät hinnat sisällä arvonlisäveroa.

Data on saatavilla:

https://www.nordpoolgroup.com/historical-market-data/

Kuvaus koodista on nähtävissä github-profiilissani:

https://github.com/markok20/Forecasting-models-using-exponential-smoothing

Syväsukellus data-analytiikkaan

Featured

Mitä kuuluu datatieteeseen ja analytiikka-alalle? Mitkä ovat tuoreimmat ajankohtaiset uutiset ja kiinnostavimmat aitoa lisäarvoa tuovat AI-asiakaskeissit? Mitkä ovat analytiikan itsetuhonapit ja alan kuumimmat linkkivinkit? Päätin ottaa asiasta selvää ja lukaisin, mitä tarjoilee tuore Analyytikko-lehti. 50-sivuista lehteä julkaisee ja kustantaa Grohner Records.

Lehdelle on tilausta. Miksi? Tekoäly ja koneoppiminen mullistavat ihmisten elämän, bisneksen ja viestinnän seuraavan vuosikymmenen aikana. Muutosaalto on väistämätön eli nyt on jokaisen ryhdyttävä miettimään vakavasti, miten jokainen voisi hyödyntää tekoälyä bisneksessään. Ensimmäinen askel on päättää siitä, mitä dataa kukin tarvitsee, jotta se voi kilpailijoita paremmin hyödyntää tekoälyä ja siihen liittyvää koneoppimista. Tähän lehti tarjoaa hyvät eväät.

Suomalaiset yritykset ovat hyvissä asemissa, vaikkakin tekoälyn hyödyntämisaste on keskimäärin suhteellisen matala. Keväällä 2021 julkaistun Eurostatin tilaston mukaan suomalaiset yritykset hyödyntävät kolmanneksi eniten tekoälysovelluksia EU-jäsenmaiden alueella. Paalupaikalla on Irlanti (23%), toisena Malta (19%), kolmantena Suomi (12%) ja neljäntenä Tanska (11%). Hälyttävää on se, että keskimäärin vain seitsemän prosenttia EU-jäsenmaiden yrityksistä eli noin joka kymmenes hyödyntää tällä hetkellä tekoälyä bisneksessään.

Kirjoittajina alan johtavat asiantuntijat

Kirjoittajiksi lehden ensimmäiseen numeroon on kutsuttu alan johtavat asiantuntijat, jotka valottavat kokonaisuutta lähinnä asiakaskeissien ja ohjeistavien artikkeleiden avulla. Artikkeleita on höystetty koodeilla. Olisiko fiksua, että lukijaa voisi ohjata jatkossa lukemaan ja noutamaan koodit muun muassa githubista, josta ne voi kloonata omaan virtuaalikoneeseen.

Kokonaisuutta tukevat ajankohtaiset uutiset, vuorovaikutteisuuteen pyrkivät datapähkinät, tilastomatematiikkaa pohtivat kolumnit sekä linkkivinkit. Kirjoittajiksi on kutsuttu tällä kertaa pelkästään asiantuntijoita Suomesta. Olisiko hyvä jatkossa laajentaa näkökulmia etsimällä kirjoittajia myös kansainvälisiltä data-areenoilta?

Mielestäni lehden parasta antia on avausjuttu optimoidusta lentokentästä, jossa tekoälyn hyödyt oli havainnollistettu osuvasti. Kiintoisaa oli myös lukea juttu kolmesta tavasta hyötyä AI-teknologioiden valtavirtaistumisesta. Käytäntö on opettanut, että räätälöidyistä AI-projekteista on päästävä eroon ja ryhdyttävä tuotteistamaan AI-palveluja helposti ostettavaksi.    

Teksti on osittain hieman haastavaa lukea pitkine kappaleineen ja teksti olisi vaatinut oikolukua. Tekstin omaksumista voisivat lisätä muun muassa myyvät otsikoinnit, ingressit ja kuvatekstit sekä iskevät tietolaatikot ja artikkeleiden lopussa olevat yhteenvetoteesit. Kuvituksena on hyödynnetty valtaosin kuvapankkien kuvia.

Kehitysideoita

Jatkossa luettavuutta voisi parantaa autenttisilla kuvilla, jotka liittyvät juttujen teemoihin tai henkilöihin. Printtilehteä voisi jatkossa tukea monimediakonsepti: responsiivinen verkkojulkaisu, uutiskirje ja github-ohjelmavarasto. Yhteenvetona: lehti on kattavuutensa takia hyödyllinen muun muassa kaikille tulevaisuuteen katsoville päättäjille, jotka haluavat selvittää mahdollisuudet hyödyntää tekoälyä bisnespäätöksissään.

Artikkelin lähteenä käytetty: Artificial intelligence in EU enterprises

https://ec.europa.eu/eurostat/web/products-eurostat-news/-/ddn-20210413-1