La qualità dei dati si riferisce alla condizione di un insieme di valori di variabili qualitative o quantitative. Esistono molte definizioni di qualità dei dati, ma i dati sono generalmente considerati di alta qualità se sono "adatti ai [suoi] usi previsti nelle operazioni, nel processo decisionale e nella pianificazione".[1][2]
Potrebbe essere necessaria la pulizia dei dati per garantirne la qualità.[3]
ISO 8000 è uno standard internazionale per la qualità dei dati.[4]
Statistica
La qualità dei dati, in statistica, è la aderenza dei dati rilevati alla realtà concreta che si vuole misurare.[5]
Essa è definita da caratteristiche di validità e di conformità al tipo di analisi che viene effettuata.
Fra i parametri utili a stabilire la qualità dei dati sono misurabili l'accuratezza, l'attendibilità, la completezza, la consistenza.
Note
- ^ Thomas C. Redman, Data Driven: Profiting from Your Most Important Business Asset, Harvard Business Press, 30 dicembre 2013, ISBN 978-1-4221-6364-1.
- ^ Kayode Philip Fadahunsi, James Tosin Akinlua, Siobhan O’Connor, Petra A Wark, Joseph Gallagher, Christopher Carroll, Azeem Majeed e John O’Donoghue, Protocol for a systematic review and qualitative synthesis of information quality frameworks in eHealth, in BMJ Open, vol. 9, n. 3, March 2019, pp. e024722, DOI:10.1136/bmjopen-2018-024722, ISSN 2044-6055 (WC · ACNP).
- ^ What is data scrubbing (data cleansing)? - Definition from WhatIs.com, su searchdatamanagement.techtarget.com.
- ^ ISO/TS 8000-1:2011 Data quality -- Part 1: Overview, su iso.org, International Organization for Standardization. URL consultato l'8 dicembre 2016.
- ^ Glossario della qualità dei dati statistici, su regione.toscana.it.