Suunnitteletko matkaa kesällä Lontooseen? Haluatko tietää, missä hotellissa on paras asiakaskokemus otannan perusteella? Mitkä hotellit asiakkaat rankkaavat kärkeen? Mitä tekijöitä asiakkaat arvostavat eniten hotellissa: sijaintia tai palvelua? Kumpi merkitsee enemmän?

Näihin kysymyksiin hain vastauksia, kun kävin läpi Lontoon hotellien avointa dataa, jossa oli mukana kymmenkunta hotellia sekä kalleimmasta että edullisimmista päästä. Hain datan data.world-tietokannasta, jonne tiedot oli kerätty matkailuportaalin sivuilta vuosien 2012-2018 aikana.
Aineisto löytyy osoitteesta:
https://data.world/promptcloud/customer-of-reviews-of-london-based-hotels
Koko aineistossa oli rivejä yhteensä 27 330 kpl. Aineistoja rajasin sillä, että poistin mielipiteistä ei englantia sisältävän palautteen. Rajausten jälkeen palauterivien määrä laski 23 578 kpl:een. Aineistoa käsittelin Pythonilla. Artikkelin lopussa on linkki Python-koodiin.
Otannassa oli mukana seuraavat hotellit, vastausten määräjärjestyksessä
The Savoy 5073
Mondrian London at Sea Containers 3937
The Rembrandt 2524
Corinthia Hotel London 2519
Apex London Wall Hotel 1977
The Dorchester 1560
Hotel Xenia, Autograph Collection 1230
Ridgemount Hotel 1026
Mandarin Oriental Hyde Park, London 1024
Rhodes Hotel 988
Missä hotellissa on sitten paras asiakaskokemus? Datassa hotellikävijät arvioivat asiakaskokemusta arvosanaskaalalla (1=huono – 5=erittäin hyvä. Tulosten perusteella asiakaskokemus on hyvällä tasolla, koska valtaosa oli rankannut kokemuksen joko arvosanaksi 4 tai 5.

Kun vastauksiin otin mukaan vain arvosanan 5, niin kärkeen nousivat Corinthia Hotel London, The Savoy and The Dorchester.
Paras asiakaskokemus, % vastausmäärästä, arvosana 5 vain mukana
Corinthia Hotel London 86,78
The Savoy 78,85
The Dorchester 77,05
Apex London Wall Hotel 75,82
Mondrian London at Sea Containers 74,14
Hotel Xenia, Autograph Collection 64,96
Mandarin Oriental Hyde Park, London 61,82
Ridgemount Hotel 54,19
The Rembrandt 45,13
Rhodes Hotel 38,06
Mitkä sanat sitten toistuivat palautteissa eniten? Yhtenä visualisointitapana on sanapilvi. Mitä suuremmalla fontti on, sitä tiheämmin sana esiintyy vastausdatassa. Sanapilvestä näkee, että muun muassa palvelukyky, sijainti, henkilökunta, palvelualttius, ravintola, baari, hyvä ja ihastuttava nousevat tiheyskärkeen. Sanapilven heikkoutena on se, että siitä on vaikea määrittää tiheysarvoja eksaktisti.

Toisena tapana on lemmatisoida eli perusmuotoistaa sanat perusmuotoon ja nostaa esiin tiheimmin esiintyvät sanat. Alta kuviosta selviää, että palvelukyky esiintyy useammin datassa kuin sijainti. Toisin sanoen kävijät arvostavat enemmän hotellin kykyä palvella asiakkaita kuin sen sijaintia.

Toisena tapana on käyttää n-gram-algoritmiä, joka laskee datasta eniten toistensa kanssa esiintyvät sanat. Alta selviää, että ystävällinen henkilökunta mainitaan useammin vastauksissa kuin esimerkiksi hyvä sijainti.
Mitkä kaksi sanaa esiintyivät palautteissa eniten yhdessä?
(afternoon, tea) 1720
(staff, friendly) 1638
(stay, hotel) 1576
(room, service) 1497
(tube, station) 1476
(highly, recommend) 1395
(great, location) 1344
(one, night) 1326
(hyde, park) 1283
(walk, distance) 1230
(friendly, helpful) 1205
(american, bar) 1128
(5, star) 1123
(recommend, hotel) 1115
(would, definitely) 1112
(come, back) 1059
(go, back) 1010
(room, clean) 994
(stay, savoy) 989
(room, small) 978
Lisäksi alta selviää, että ystävällinen, palvelualtis henkilökunta mainitaan useammin vastauksissa kuin esimerkiksi kävelymatkan päässä oleva sijainti tai hotellin hyvä sijainti.
Mitkä kolme sanaa esiintyivät palautteissa eniten yhdessä?
(stay, one, night) 548
(staff, friendly, helpful) 536
(nothing, much, trouble) 481
(within, walk, distance) 460
(would, highly, recommend) 444
(would, definitely, stay) 440
(make, us, feel) 436
(hotel, great, location) 339
(apex, london, wall) 332
(5, star, hotel) 313
(would, definitely, recommend) 311
(highly, recommend, hotel) 301
(south, kensington, tube) 291
(would, recommend, hotel) 244
(worth, every, penny) 241
(full, english, breakfast) 229
(victoria, albert, museum) 227
(5, minute, walk) 224
(kensington, tube, station) 210
(royal, albert, hall) 197
Johtopäätökset:
- Hotellikävijät arvostavat ystävällistä, palvelualtista asiakaskokemusta enemmän kuin hotellin erinomaista sijaintia.
- Sijainnilla on kuitenkin väliä. Kävijät arvostavat sijaintia metroaseman juuressa.
- Aamiaisella on merkitystä. Kävijät haluavat nauttia englantilaisesta aamiaisesta.
- Asiakkaille merkitsee hotellin läheisyydessä olevat maamerkit muun muassa Kensington, Hyde Park ja Royal Albert Hall.
Eksploratiivinen data-analyysi on nähtävissä github-kansiossani kahdessa osassa:
https://github.com/markok20/London-Hotels-exploratory-data-analysis