Tiedonlouhinta

Tiedonlouhinta (engl. data mining) tarkoittaa joukkoa menetelmiä, joilla pyritään oleellisen tiedon löytämiseen suurista datajoukoista.

Sovelluskohteet

Tiedonlouhintaa voidaan soveltaa hyvin laaja-alaisesti, sillä lähtökohdaksi tarvitaan ainoastaan dataa. Tyypillisesti tiedonlouhinnassa käytetty data on esimerkiksi mittauksia teollisuusprosessista, otteita asiakastietokannasta tai vaikkapa web-palvelimen loki-tiedostoja.

Menetelmät

Määritelmänä tiedonlouhinta ei rajaa käytettäviä menetelmiä. Useimmiten käytettäviä algoritmeja ovat mm. erilaiset klusteroinnit, korrelaatiot, neuroverkot, itseorganisoituvat kartat, jne. Yleisesti ottaen tiedonlouhinnan menestyksellisessä hyödyntämisessä kaikkein oleellisinta on datan ja sen eri suureiden kokonaisvaltainen ymmärtäminen. Myös pelkkä innovatiivinen lähestymistapa esimerkiksi datan visualisoinnissa voi auttaa näkemään tietovaraston hyötyjä täysin uudesta perspektiivistä.

Tämä tietotekniikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.