Analytikk

Trafikkanalyse av Wikipedia

Analytikk er et fagfelt som omhandler systematiske beregninger og analyse av data eller statistikk.[1] Den brukes for å oppdage, tolke og kommunisere meningsfulle mønstre i data for å støtte opp om effektiv beslutningstaking. Analytikk kan være særlig verdifullt på områder hvor man ha registrert mye informasjon, og bygger på teknikker fra statistikk, programmering og operasjonsanalyse.

Organisasjoner kan analysere forretningsdata for å beskrive, forutsi og forbedre resultater. Spesifikke områder innen analytikk inkluderer beskrivende, diagnostisk, prediktiv, preskriptiv og kognitiv analytikk.[2] Analytikk kan brukes innen en rekke felter som markedsføring, ledelse, økonomi, online systemer, informasjonssikkerhet og programvaretjenester. Siden analytikk kan kreve omfattende beregninger (se stordata), bruk av algoritmer og programvare benyttes mange av de nyeste metodene fra informatikk, statistikk og matematikk.

Analytikk kontra analyse

Dataanalyse fokuserer på prosessen med å undersøke tidligere data gjennom forretningsforståelse, dataforståelse, datapreparering, modellering og evaluering.[3] Ifølge en kilde[4] utgjør dataanalyse en delmengde av dataanalytikk, mens dataanalytikk tar i bruk flere dataanalyseprosesser for å bestemme hvorfor en hendelse skjedde og forutsi hva som kan skje i fremtiden basert på tidligere data. Dataanalytikk kan slik brukes for å formulere større organisasjonsbeslutninger.

Dataanalytikk er en tverrfaglige felt. Det er utstrakt bruk av programmeringskunnskaper, matematikk, statistikk, beskrivende teknikker og prediktive modeller for å hente ut verdifull kunnskap fra data gjennom analytikk.[5] Blant avanserte teknikker som har blitt populære i 2010-årene for å gjøre prediktiv modellering finnes eksempler som maskinlæring, nevrale nettverk, beslutningstrær, logistisk regresjon, lineær- og fler-regresjonsanalyse og klassifisering.[6][3] Andre eksempler er ikke-veiledet læring som klyngeanalyse, hovedkomponentanalyse, segmenteringsprofilanalyse og assosiasjonsanalyse.[7]

Utfordringer

Stordata

Stordata innebærer analyse av store og komplekse datamengder som ofte er i en konstant endringstilstand.[8] Mens dette tidligere stort sett var teoretiske problem i akademia er stordata i dag et stort problem for mange virksomheter som som har online transaksjonsprosessering, og som et resultat samler store datamengder raskt.[9][8]

Ustrukturerte data

Analyse av ustrukturerte data skiller seg fra strukturerte data ved at formatet varierer mye og at filene ikke kan lagres i tradisjonelle relasjonsdatabaser uten betydelig innsats for datatransformasjon.[10] Kilder til ustrukturerte data kan for eksempel være epost, tekstdokumenter, pdf-filer, geospatiale data, og så videre. Disse kan være verdifulle kilder til virksomhetsetterretning for bedrifter, myndigheter og universiteter.[11][12] For eksempel oppdaget man i Storbritannia ved hjelp av ustrukturert dataanalyse at et selskap solgte falske legeerklæringer for å hjelpe folk med å svindle arbeidsgivere og forsikringsselskaper.[13][14]

Forskjellsbehandling

Risiko for den generelle befolkningen inkluderer forskjellsbehandling på grunnlag av egenskaper som kjønn, hudfarge, etnisk opprinnelse eller politiske meninger, gjennom mekanismer som prisdiskriminering eller statistisk diskriminering.[15]

Se også

Referanser

  1. ^ «Oxford definition of analytics». Arkivert fra originalen 25. januar 2021. Besøkt 15. februar 2023. 
  2. ^ «Cognitive Analytics - combining Artificial Intelligence (AI) and Data Analytics». Besøkt 7. januar 2022. 
  3. ^ a b Kelleher, John D. (2020). Fundamentals of machine learning for predictive data analytics : algorithms, worked examples, and case studies. Brian Mac Namee, Aoife D'Arcy (2 utg.). Cambridge, Massachusetts. ISBN 978-0-262-36110-1. OCLC 1162184998. 
  4. ^ Park, David. «Analysis vs. Analytics: Past vs. Future». Besøkt 20. januar 2021. 
  5. ^ «What is Data Analytics?». Besøkt 8. juli 2021. 
  6. ^ «AI, Big Data & Advanced Analytics In The Supply Chain». Besøkt 16. april 2020. 
  7. ^ Ronin Myers (19. mai 2019). Data Management and Statistical Analysis Techniques. ISBN 9781839473395. Besøkt 16. april 2020. 
  8. ^ a b «2.3 Ten common characteristics of big data». Besøkt 10. januar 2022. 
  9. ^ Naone, Erica. «The New Big Data». Technology Review, MIT. Besøkt 22. august 2011. 
  10. ^ Inmon, Bill; Nesavich, Anthony. Tapping Into Unstructured Data. Prentice-Hall. ISBN 978-0-13-236029-6. 
  11. ^ Wise, Lyndsay. «Data Analysis and Unstructured Data». Dashboard Insight. Arkivert fra originalen 5. januar 2014. Besøkt 14. februar 2011. 
  12. ^ «Tapping the power of unstructured data». Besøkt 10. januar 2022. 
  13. ^ «Fake doctors' sick notes for Sale for £25, NHS fraud squad warns». The Telegraph. 26. august 2008. Besøkt 16. september 2011. 
  14. ^ «Big Data: The next frontier for innovation, competition and productivity as reported in Building with Big Data». The Economist. 26. mai 2011. 
  15. ^ «Big Data and discrimination: perils, promises and solutions. A systematic review». 
Autoritetsdata