Data-analyysi levyraadin tuloksista

Pääkomponenttianalyysi levyraadista

Data-analysoin ystäväni järjestämän levyraadin tulokset. Tutkin, onko voittaja valittu yksimielisesti ja kenellä raatilaisella on sama musiikkimaku kuin minulla.

Käytin työkaluina Python-ohjelmointikieltä sekä Pythonin data-analysointiin soveltuvia kirjastoja. Analyysi on tallennettu Jupyter Notebook -muistiona, josta näkee analysoinnin vaiheet ja lopputuloksen. Muistiota voi tutkia verkkoselaimella täältä.

Miten valitsen sopivan Linux-jakelun?

Verkkokaavio Linux-jakelun valintakriteereistä
Käyttäjä painottaa valintakriteerejä mieltymystensä mukaan. Valintakriteerit ovat pitkäikäisyys, tukiaika, tuki, jatkuvuus, ohjelmat, kieli, helppokäyttöisyys, etiikka sekä muut syyt.

Viimeisen kymmenen vuoden aikana olen kokeillut lukuisia Linux-jakeluja. Distro-hoppingiksi kutsuttu harrastus alkoi osaltani, kun halusin löytää parhaimman käyttöjärjestelmän koneelleni. Olin lukenut aiheeseen liittyviä ehtymättömiä nettikeskusteluja, joissa toistui seuraava ajatus: järjestelmän paremmuus riippuu käyttäjästä, eikä yksiselitteistä vastausta voi antaa. Tämä ohjenuora johti siihen, että asensin koneelleni kymmeniä eri käyttöjärjestelmiä, jotta olisin löytänyt itselleni sopivimman. Nyt jälkikäteen ajateltuna ohjenuora olisi voinut olla parempi. Jakeluiden välillä on konkreettisia käyttöön vaikuttavia eroja, joita ei voi verrata vaatteiden sävyeroihin tai ruokien makuvivahteisiin. Tämä kirjoitus on niille, jotka pohtivat kysymystä ”mikä on paras käyttöjärjestelmä minulle?”
Jatka artikkeliin Miten valitsen sopivan Linux-jakelun?

Provost ja Fawcett kertovat onnistuneesti data-analyysista

Toisinaan löytää sattumalta kirjan, joka osoittautuu erinomaisiksi. Yksi tällainen tapaus oli kirjastosta lainaamani Data Science for Business. Löysin teoksen, kun etsin netistä data-analyysiin liittyviä kirjoja. Silloin huomasin, että teos oli saanut Amazonissa myönteisiä arvioita ja lisäksi teoksessa painotettiin liiketoiminnan näkökulmaa. Kirja osoittautui hyvän palautteensa arvoiseksi.

Jatka artikkeliin Provost ja Fawcett kertovat onnistuneesti data-analyysista

Big data ja ylitsevuotavat odotukset

Salo, Immo (2013) Big data: Tiedon vallankumous
Salo, Immo (2013) Big data: Tiedon vallankumous

Yhtenä osana työtäni on datan kerääminen ja sen analysointi. Seuraan mielenkiinnolla data-analyysiin liittyviä asioita. Tällä hetkellä yleinen puheenaihe on big data, jolle ei ole vielä vakiintunut suomenkielistä termiä. Käsitteen merkitystä kuvaa sen suora suomennos, eli dataa on paljon ja sen analysoijat tarvitsevat tilanteeseen sopivat työkalut. Perinteinen Excel-taulukko tai SQL-tietokanta on riittämätön moninaisen datan säilömiseen ja käsittelyyn. Ideaalilla big data -työkalulla voisi tutkia yrityksen sisäisen materiaalin lisäksi Internetin teksti-, kuva- ja äänimateriaalia. Näin voitaisiin analysoida liiketoiminnan mennyttä, nykyistä ja mahdollisesti tulevaa tilannetta.

Jatka artikkeliin Big data ja ylitsevuotavat odotukset

Tietotekniikan toistuvat puheenaiheet vuodesta -86

Tajusin Markku I. Nurmisen (1986) kirjaa lukiessa, kuinka samat teknologiakeskustelut ovat jatkuneet vuosikymmeniä. Kirjan kirjoittamisen aikaan kotikoneet olivat vasta yleistymässä. Kymmenen vuotta myöhemmin kansalaiset totuttelivat GSM-puhelimiin ja verkkosivuihin. Nyt olemme jo nähneet puhjenneen IT-kuplan. Ennen kirjan lukemista kuvittelin, että 26 vuodessa ymmärrys teknologiasta olisi täysin uudistunut, vanhat ongelmat kuopattu ja uudet haasteet ainutlaatuisia. Vaikuttaa kuitenkin siltä, että on tiettyjä tekniikan peruskysymyksiä, jotka joudutaan käsittelemään aina uudelleen.

Jatka artikkeliin Tietotekniikan toistuvat puheenaiheet vuodesta -86