Data Mining Extensions

Data Mining Extensions (DMX) er et spørrespråk for å modellere datautvinning som støttes av Microsoft-verktøyet SQL Server Analysis Services (SSAS).[1]

I likhet med SQL støtter den et datadefinisjonsspråk, datamanipuleringsspråk og et dataspørringsspråk, og alle tre har SQL-lignende syntaks. Mens SQL-uttrykk opererer på relasjonstabeller opererer DMX-uttrykk på datautvinningsmodeller.

Tilsvarende støtter SQL Server MDX-språket for OLAP-databaser. DMX brukes til å lage og trene modeller for datautvinning, og til å bla gjennom, administrere og predikere modeller. DMX er sammensatt av datadefinisjonsspråk (DDL)-setninger, datamanipulasjonsspråk (DML)-setninger, samt funksjoner og operatorer.

Spørringer

DMX-spørringer formuleres ved hjelp av SELECT-uttrykk. De kan trekke ut informasjon fra eksisterende datautvinningsmodeller på ulike måter.

Datadefinisjonsspråk

Datadefinisjonsspråk-delen av DMX kan brukes til å:

  • Lage nye datautvinnings-modeller og -strukturer (CREATE MINING STRUCTURE, CREATE MINING MODEL)
  • Slette eksisterende datautvinnings-modeller og -strukturer (DROP MINING STRUCTURE, DROP MINING MODEL)
  • Eksport og import av utvinningsstrukturer (EXPORT, IMPORT)
  • Kopiere data fra en utvinningsmodell til en annen (SELECT INTO)

Datamanipulasjonsspråk

Datamanipulasjonsspråk-delen av DMX kan brukes til å:

  • Trene utvinningsmodeller (INSERT INTO)
  • Bla gjennom data i utvinningsmodeller (SELECT FROM)
  • Lage prediksjoner ved å bruke utvinningsmodeller (SELECT ... FROM PREDICTION JOIN)

Eksempel: En prediksjonsspørring

Følgende eksempel er en enkel prediksjonsspørring som predikerer om en gitt kunde vil være interessert i boliglånsprodukter:

SELECT
 [Loan Seeker],
 PredictProbability([Loan Seeker])
FROM
 [Decision Tree]
NATURAL PREDICTION JOIN
(SELECT
  35 AS [Age],
  'Y' AS [House Owner],
  'M' AS [Marital Status],
  'F' AS [Gender],
  2 AS [Number Cars Owned],
  2 AS [Total Children],
  18 AS [Total Years of Education]
)

Referanser