Organisasjoner kan analysere forretningsdata for å beskrive, forutsi og forbedre resultater. Spesifikke områder innen analytikk inkluderer beskrivende, diagnostisk, prediktiv, preskriptiv og kognitiv analytikk.[2] Analytikk kan brukes innen en rekke felter som markedsføring, ledelse, økonomi, online systemer, informasjonssikkerhet og programvaretjenester. Siden analytikk kan kreve omfattende beregninger (se stordata), bruk av algoritmer og programvare benyttes mange av de nyeste metodene fra informatikk, statistikk og matematikk.
Analytikk kontra analyse
Dataanalyse fokuserer på prosessen med å undersøke tidligere data gjennom forretningsforståelse, dataforståelse, datapreparering, modellering og evaluering.[3] Ifølge en kilde[4] utgjør dataanalyse en delmengde av dataanalytikk, mens dataanalytikk tar i bruk flere dataanalyseprosesser for å bestemme hvorfor en hendelse skjedde og forutsi hva som kan skje i fremtiden basert på tidligere data. Dataanalytikk kan slik brukes for å formulere større organisasjonsbeslutninger.
Stordata innebærer analyse av store og komplekse datamengder som ofte er i en konstant endringstilstand.[8] Mens dette tidligere stort sett var teoretiske problem i akademia er stordata i dag et stort problem for mange virksomheter som som har online transaksjonsprosessering, og som et resultat samler store datamengder raskt.[9][8]
Ustrukturerte data
Analyse av ustrukturerte data skiller seg fra strukturerte data ved at formatet varierer mye og at filene ikke kan lagres i tradisjonelle relasjonsdatabaser uten betydelig innsats for datatransformasjon.[10] Kilder til ustrukturerte data kan for eksempel være epost, tekstdokumenter, pdf-filer, geospatiale data, og så videre. Disse kan være verdifulle kilder til virksomhetsetterretning for bedrifter, myndigheter og universiteter.[11][12] For eksempel oppdaget man i Storbritannia ved hjelp av ustrukturert dataanalyse at et selskap solgte falske legeerklæringer for å hjelpe folk med å svindle arbeidsgivere og forsikringsselskaper.[13][14]
Forskjellsbehandling
Risiko for den generelle befolkningen inkluderer forskjellsbehandling på grunnlag av egenskaper som kjønn, hudfarge, etnisk opprinnelse eller politiske meninger, gjennom mekanismer som prisdiskriminering eller statistisk diskriminering.[15]