Hyppää sisältöön

Omat datalähteet eivät enää riitä – yritykset tarvitsevat ulkopuolisia tietokantoja

Yritykset panostavat nyt täysillä datan hallinnan ja data-analytiikan kehittämiseen. Panostukset näkyvät IT-alan rekrytoinneissa: tehtävänimikkeet Data Analyst, Data Scientist ja Data Engineer keikkuvat haetuimpien ammattilaisten listausten kärjessä vuodesta toiseen.

Kaikkien analytiikkapyrkimysten ydin on kuitenkin virheetön, laadukas data.

Vaikka datan määrä on harvoin ongelma, yrityksille voi olla valtavaa hyötyä täydentää omia datavarastojaan ulkopuolisilla datalähteillä.

Kuten datan määrä yleensäkin, myös datamarkkinat kasvavat nopeasti. Kaupallisten datatarjojien ohella myös valtiollisten ja koulutusorganisaatioiden tarjoamia ilmaisia tietokantoja tulee koko ajan lisää. Ne ovat erityisen hyödyllisiä esimerkiksi silloin, kun on tarve analysoida väestöön ja asukkaisiin liittyvää tietoa eri maissa. Varsinkin Suomi on jo pitkään ollut edelläkävijä maantieteellisen datan tarjoamisessa julkiseen käyttöön.

Mitä hyötyä ulkopuolisten tietokantojen käyttämisestä on?

Laajempi näkyvyys

Kun yritys kerää itse dataa, sen näköala ulottuu vain yrityksen omaan vaikutuspiiriin: tietoa asiakkaista, toimittajista sekä yrityksen itse tuottamaa operatiivista ja taloudellista dataa.

Toki nämä ensikäden datanlähteet ovat ehdottoman tärkeitä, mutta ne rajoittuvat vain niihin tekijöihin ja sidosryhmiin, joihin yritys on suoraan yhteydessä. Toisen käden data (viittaa yritysdataan, jota saadaan muilta yrityksiltä) voi auttaa laajentamaan tätä näkemystä, mutta usein myös se rajoittuu vain dataa keräävän yrityksen lähimpiin sidosryhmiin.

Jotta yritys kykenee analysoimaan tekijöitä vaikutuspiirinsä ulkopuolelta, sen täytyy siis etsiä dataa ulkopuolisista lähteistä.

Varmistettu laatu

Usein analytiikkapanostukset epäonnistuvat oikeellisen datan puutteen tai datan huonon laadun vuoksi. Ulkopuolisten datalähteiden yksi etu onkin se, että datapalvelujen tarjoajien täytyy varmistaa, että niiden tarjoama data on virheetöntä ja ajantasaista. Vähintäänkin niiden on huolehdittava datan luokittelemisesta – asia, joka ei ole itsestäänselvyys monissa yrityksissä. Tämä vähentää datan laatuun ja saatavuuteen liittyviä riskejä.

Helppo saatavuus

Moniin perinteisiin tietokantoihin verrattuna ulkopuoliset datalähteet on usein suunniteltu käyttäjäystävälliseksi. Näin niiden hyödyntäminen on helpompaa ja niitä pystyy integroimaan olemassa olevaan infrastruktuuriin ilman datainsinöörejä.

Kuinka hyödyntää ulkopuolista dataa: tutkimusesimerkki

Elokuussa 2018 julkaisin artikkelin yhdessä laitokseni professoreiden kanssa International Journal of Logistics Research and Applications -lehdessä. Artikkelissa tutkin taloussuhdanteiden vaikutusta tavaraluoton arvoketjun eri tasoilla (valmistavassa teollisuudessa, tukkukaupassa ja vähittäismyynnissä). Tavaraluotolla tarkoitetaan tässä yhteydessä toimittajilta ja asiakkailta saatua rahoitusta, esimerkiksi tiukempia maksuehtoja hyödyntämällä.

Tutkimustuloksena havaitsin, että yritykset todennäköisemmin lainasivat toimittajiltaan ja asiakkailtaan taantuma-aikana kuin nousukauden aikana. Erityisesti valmistavan teollisuuden kohdalla tavaraluoton käyttö kasvoi taloussuhdanteiden heikentyessä.

Tutkimuksen aineistona käytin yli 50 000 Pk-yrityksen tilinpäätöstietoja kymmenen vuoden ajalta, vuosina 2006–2015. Aineiston keräämiseen käytin Bureau van Dijkin omistamaa Orbis-tietokantaa, jonka yrityshakemisto sisältää tietoja yli 300 miljoonasta yrityksestä globaalisti.

Tällainen analyysi ei olisi ollut mahdollinen ilman Orbisin kaltaista valmista tietokantaa. Yritysdatan listaamisen lisäksi Orbis varmistaa, että data on ajantasaista ja vertailukelpoista eri maissa. Palvelun avulla voi myös visualisoida, filtteröidä ja raportoida dataa.

Konkreettista hyötyä ja jopa pikavoittoja

Ulkopuolisten tietokantojen käyttäminen voi tuoda konkreettisia hyötyjä yrityksesi data-analytiikkaan. Erityisen hyödylliseksi se voi osoittautua liiketoiminnan ulkopuolisia tekijöitä analysoidessa – esimerkiksi markkina- tai asiakasanalyyseissa.

Yllä kuvaillut datalähteet voivat myös tuoda pikavoittoja tai ainakin auttaa eteenpäin, jos esimerkiksi laatuongelmat jarruttavat yrityksesi analytiikkaa. Kannattaa myös huomioida datan putsaamiseen liittyvät kustannukset: sillä on eroa, ostatko valmista dataa vai siivoatko dataa itse.

Etsi