Tekstinlouhinta tarkoittaa tietokoneavusteista uuden informaation tuottamista suurista määristä tekstiä.[1][2] Tekstinlouhinnassa käytetään usein rakenteellisia tekstejä, koska tietokoneen on helpompi käsitellä niitä[3], mutta edistyneillä koneoppimismenetelmillä on mahdollista käsitellä myös rakenteetonta tekstiä. Uutta tietoa saadaan, kun löydetään teksteistä säännönmukaisuuksia esim. luokittelemalla, klusteroimalla tai jollakin muulla automatisoidulla menetelmällä.[3]
Lähteet