Datos en bruto

La segunda columna, empezando a contar por la izquierda, de esta tabla son datos en bruto de colesterol "bueno" (HDL, lipoproteína de alta densidad) de 18 pacientes. La cuarta columna contiene los mismos datos, pero ordenados de menor a mayor, por lo que ya no son datos en bruto, sino datos procesados.

Los datos en bruto, también conocidos como datos brutos, datos primarios o datos sin procesar son los datos (p. ej., pesos de productos envasados, mediciones de piezas fabricadas, etc.) tal como se toman inicialmente de la fuente, sin ninguna transformación, limpieza u organización.

Si un científico configura un termómetro computarizado que registra la temperatura de una mezcla química en un tubo de ensayo cada minuto, la lista directa de lecturas de ese termómetro son los datos en bruto. Estos datos no se han sometido a ningún tratamiento ni procesamiento, "limpieza" por parte de los investigadores (o de algún programa informático) para eliminar valores atípicos, errores obvios de lectura del instrumento o errores de ingreso de datos, ni a ningún análisis, como la media aritmética o la mediana (estadística).

El término datos en bruto es relativo (ver Dato), porque una vez que un equipo de investigadores ha limpiado y procesado los datos iniciales, otro equipo puede considerar estos datos procesados como "datos sin procesar" para otra etapa de la investigación. Los datos sin procesar pueden ingresarse en un programa informático o usarse en procedimientos manuales.

Generación de datos

Hay 2 formas de generar datos. La primera es capturarlos,[1]​ y se realiza colocando expresamente un dispositivo adecuado (sensor, medidor) en un punto apropiado para medir la magnitud que se desea conocer (por ejemplo, un sensor de óxido nitroso se coloca en una calle de mucho tráfico para capturar los niveles de este contaminante). La segunda es aprovechar datos que se originaron con otro propósito,[1]​ y normalmente los recopilan máquinas o terminales como una función secundaria. En inglés se conocen como exhaust data, por analogía con exhaust gas (gas de escape), pero en español no se emplea lo que sería la traducción literal, datos de escape, sino datos desechables.[2]​ Por ejemplo, los terminales de punto de venta recopilan datos de lo que compran los clientes con tarjeta de crédito para cargarles el importe en sus cuentas bancarias. Ese es el propósito inicial. Pues bien, el Instituto Nacional de Estadística (España) utiliza esos datos para seguir la evolución de los precios.[3]

Los datos "desechables" se consideran generalmente demasiado voluminosos o de poca utilidad, por lo que frecuentemente, al poco tiempo se borran, o se sobrescriben con nuevos datos.[1]​ Pero precisamente esos datos son el objeto de deseo de la minería de datos y los macrodatos (big data),[4]​ que los llaman "secundarios" (no porque deriven de los primarios o datos en bruto, sino porque son el resultado de un propósito principal) y los aprovechan para aplicaciones de inteligencia artificial[5]​ e inteligencia empresarial.

Características

En informática, los datos en bruto pueden tener las siguientes características: posiblemente contengan errores humanos, de máquina o de instrumentos; es posible que no estén validados; podrían estar en diferentes formatos; sin codificar o sin formato; o algunas entradas pueden ser "sospechosas" (p. ej., valores atípicos), lo que requiere confirmación o referencia bibliográfica. Por ejemplo, una hoja de entrada de datos puede contener fechas en muchos formatos: "31 de enero de 1999", "31/01/1999", "31/1/99", "31 de enero" u "hoy". Una vez capturados, estos datos en bruto se pueden procesar almacenados en un formato normalizado, por ejemplo una fecha juliana, para que sean más fáciles de interpretar por los ordenadores y los humanos. Los datos brutos (a veces denominados coloquialmente "datos de fuente" o "datos crudos" —en referencia a que los datos están sin cocinar, como un huevo crudo—) son la entrada de datos para el procesamiento. Se hace una distinción entre datos e informaciónː la información es el producto final del procesamiento de datos.

Aunque los datos en bruto tienen el potencial de transformarse en información, normalmente se requiere un examen analítico, una limpieza y alguna forma de organización (en gráficos, en tablas, con textos explicativos...) para que puedan convertirse en información utilizable. Los datos procesados a veces se denominan coloquialmente datos "cocinados".

Por ejemplo, un terminal de punto de venta (TPV o datáfono), una caja registradora computarizada) en un supermercado concurrido, recopila todos los días grandes volúmenes de datos brutos sobre las compras de los clientes. Sin embargo, esta lista de artículos, sus precios y la hora y fecha de compra no brinda mucha información hasta que se procesa. Una vez procesados y analizados por un programa informático de análisis de datos, pueden indicar los artículos particulares que compra cada cliente, cuándo los compra y a qué precio; asimismo, un analista o gerente podría calcular las ventas totales promedio por cliente o el gasto promedio por cada hora de cada día de la semana. Estos datos procesados y analizados proporcionan información al gerente, que luego podría usar para determinar, por ejemplo, cuántos cajeros contratar y en qué horarios.

Como resultado del procesamiento, los datos recopilados de una fuente a veces terminan en una base de datos, lo que permite que sean accesibles para su posterior análisis de muchas maneras diferentes.

Unos datos ya procesados pueden someterse a un nuevo procesamiento, diferente del inicial, que encuentre en ellos información distinta.

Activismo

Tim Berners-Lee (inventor de la World Wide Web) sostiene que compartir datos sin procesar es importante para la sociedad. Inspirado en una publicación de Rufus Pollock de Open Knowledge Foundation, su llamada a la acción es "Raw Data Now" Archivado el 21 de noviembre de 2011 en Wayback Machine. (Datos brutos ahora), lo que significa que todo el mundo debería exigir que los gobiernos y las empresas compartan los datos brutos que recopilan. Señala que «los datos impulsan una gran cantidad de lo que sucede en nuestras vidas... porque alguien toma los datos y hace algo con ellos». Para Berners-Lee, es esencialmente a partir de este intercambio de datos brutos que surgirán los avances en la ciencia.

Los defensores de los datos abiertos argumentan que, una vez que los ciudadanos y las organizaciones de la sociedad civil tengan acceso a los datos de las empresas y los gobiernos, podrán realizar su propio análisis, lo que les permitiría sus propias interpretaciones y alentaría las iniciativas resultantes. Por ejemplo, un gobierno puede afirmar que sus políticas están reduciendo el desempleo, pero, si los datos en bruto están disponibles, un grupo de activistas contra la pobreza puede hacer que sus econometristas realicen su propio análisis, lo que le puede llevar a conclusiones diferentes.

Importancia de conservar los datos en bruto

Podría parecer que lo importante es la información resultante de procesar los datos en bruto, y que por tanto se pueden borrar o tirar, pero en realidad resulta muy conveniente conservarlos por diversas razonesː

  • Se pueden producir errores durante el procesamiento que dejen fuera aspectos importantes. Si se conservan los datos brutos, se les puede someter a un nuevo procesamiento, mejorado.
  • En el caso de investigaciones científicas, por ejemplo durante una revisión por pares, puede necesitarse examinar los datos brutos para comprobar los resultados alegados. Lo mismo para investigaciones periodísticas.[6]

Véase también

Referencias

  1. a b c Kitchin, Rob (2014). The Data Revolution. United States: Sage. p. 6. 
  2. Toharia, José Juan (18 de diciembre de 2015). «Humanizar los datos». El País (Madrid, España). Consultado el 18 de agosto de 2022. 
  3. «El presidente del INE destaca el amplio uso de registros administrativos y bases de datos privadas en la estadística oficial». INE. 20 de diciembre de 2021. 
  4. «Sus datos, a buen recaudo». 8 de septiembre de 2016. 
  5. «Datos primarios y secundarios para explicar big data y data exhaust». 13 de febrero de 2017. 
  6. SÁNCHEZ DE LA VIÑA LÓPEZ-URRUTIA, SUSANA (2014/2016). «Verdad, valor social, aprendizaje». En Víctor Sampedro, ed. FILTRACIONES CIUDADANAS. PERIODISMO DE INVESTIGACIÓN MANCOMUNADO. España. p. 23. ISBN 978-84-617-7648-1. Consultado el 18 de agosto de 2022. 

Para saber más

Read other articles:

Artikel ini membahas mengenai bangunan, struktur, infrastruktur, atau kawasan terencana yang sedang dibangun atau akan segera selesai. Informasi di halaman ini bisa berubah setiap saat (tidak jarang perubahan yang besar) seiring dengan penyelesaiannya.Untuk tempat lain yang bernama sama, lihat Gado Bangkong. Untuk kegunaan lain, lihat Gadobangkong. Halte Gadobangkong B11C11 Halte Gadobangkong, 2022LokasiGadobangkong, Ngamprah, Bandung Barat, Jawa Barat 40722IndonesiaKoordinat6°52′3″S 107...

 

Strada regionale 155di FiuggiDenominazioni precedentiStrada statale 155 di Fiuggi Denominazioni successiveStrada regionale 155 di Fiuggi LocalizzazioneStato Italia Regioni Lazio Province Frosinone Roma DatiClassificazioneStrada regionale InizioFrosinone FineSan Cesareo Lunghezza74,600[1] km Data apertura1953 Provvedimento di istituzioneD.P.R. 27 maggio 1953, n. 782[2] GestoreTratte ANAS: nessuna (dal 2002 la gestione è passata alla Regione Lazio che ha poi...

 

برة العجوز  -  قرية مصرية -  تقسيم إداري البلد  مصر المحافظة المنوفية المركز قويسنا المسؤولون السكان التعداد السكاني 3,949 نسمة (إحصاء 2006) معلومات أخرى التوقيت ت ع م+02:00  تعديل مصدري - تعديل   برة العجوز إحدى قرى مركز قويسنا التابع لمحافظة المنوفية في جمهورية م�...

European Cup 1988–89Camp Nou in Barcelona hosted the final.Informasi turnamenJadwalpenyelenggaraan6 September 1988 – 24 May 1989Jumlahtim peserta31Hasil turnamenJuara Milan (gelar ke-3)Tempat kedua Steaua BucureștiStatistik turnamenJumlahpertandingan59Jumlah gol170 (2,88 per pertandingan)Jumlahpenonton1.773.922 (30.066 per pertandingan)Pencetak golterbanyakMarco van Basten (Milan)10 goals← 1987–88 1989–90 → Piala Champions Eropa 1988-89 adalah musim ke-34 turnam...

 

U.S. House districts in the state of South Carolina South Carolina's congressional districts from 2023 There are currently seven United States congressional districts in South Carolina. There have been as few as four and as many as nine congressional districts in South Carolina. The 9th district and the 8th district were lost after the 1840 census. The 5th district and the 6th district were also briefly lost after the Civil War, but both had been regained by the 1880 census. Because of the st...

 

Broadcast magnetic tape-based videotape format used in Europe Type B VideotapeType B videotape, one hour reelMedia typeMagnetic TapeEncodingNTSC, PAL, SECAMCapacityUp to 2 hours (120 Min.)Read mechanismHelical scanWrite mechanismHelical scanStandardInterlaced videoDeveloped byBosch FernsehDimensions1 Inch reel to reelUsageVideo production 1–inch type B VTR (designated Type B by SMPTE) is a reel-to-reel analog recording video tape format developed by the Bosch Fernseh divi...

Mural in Portland, Oregon The KnowledgeThe mural in 2017Artist Harrell Fletcher Avalon Kalin Year2010 (2010)TypeMuralLocationPortland, Oregon, United StatesCoordinates45°30′36″N 122°40′57″W / 45.50997°N 122.68250°W / 45.50997; -122.68250 The Knowledge is a 2010 mural by Harrell Fletcher and Avalon Kalin, installed on the Portland State University campus in Portland, Oregon, in the United States. Description The Knowledge is a mural depicting books from...

 

Petivillecomune Petiville – Veduta LocalizzazioneStato Francia Regione Normandia Dipartimento Senna Marittima ArrondissementLe Havre CantoneNotre-Dame-de-Gravenchon TerritorioCoordinate49°28′N 0°35′E / 49.466667°N 0.583333°E49.466667; 0.583333 (Petiville)Coordinate: 49°28′N 0°35′E / 49.466667°N 0.583333°E49.466667; 0.583333 (Petiville) Superficie16,72 km² Abitanti1 084[1] (2009) Densità64,83 ab./km² Altre...

 

هنودمعلومات عامةنسبة التسمية الهند التعداد الكليالتعداد قرابة 1.21 مليار[1][2]تعداد الهند عام 2011ق. 1.32 مليار[3]تقديرات عام 2017ق. 30.8 مليون[4]مناطق الوجود المميزةبلد الأصل الهند البلد الهند  الهند نيبال 4,000,000[5] الولايات المتحدة 3,982,398[6] الإمار...

2016年美國總統選舉 ← 2012 2016年11月8日 2020 → 538個選舉人團席位獲勝需270票民意調查投票率55.7%[1][2] ▲ 0.8 %   获提名人 唐納·川普 希拉莉·克林頓 政党 共和黨 民主党 家鄉州 紐約州 紐約州 竞选搭档 迈克·彭斯 蒂姆·凱恩 选举人票 304[3][4][註 1] 227[5] 胜出州/省 30 + 緬-2 20 + DC 民選得票 62,984,828[6] 65,853,514[6]...

 

Частина серії проФілософіяLeft to right: Plato, Kant, Nietzsche, Buddha, Confucius, AverroesПлатонКантНіцшеБуддаКонфуційАверроес Філософи Епістемологи Естетики Етики Логіки Метафізики Соціально-політичні філософи Традиції Аналітична Арістотелівська Африканська Близькосхідна іранська Буддій�...

 

Bilateral relationsChinese-Italian relations China Italy Bilateral relations between China and Italy date back to Imperial China and Ancient Rome but the ties between Italy and modern China only formally began on 27 November 1928 (began in 1913) and recognized the People's Republic on 6 November 1970.[1] News of Italy's recognition of the People's Republic of China and consequent breaking of formal relations with the Republic of China (Taiwan) spurred other European countries such as ...

Disused railway station in Northumberland on the Tyne Valley Line GilslandGeneral informationLocationGilsland, NorthumberlandEnglandCoordinates54°59′26″N 2°34′12″W / 54.9905°N 2.5699°W / 54.9905; -2.5699Grid referenceNY636663Platforms2Tracks2Other informationStatusDisusedHistoryOriginal companyNewcastle and Carlisle RailwayPre-groupingNorth Eastern RailwayPost-grouping London and North Eastern Railway British Rail (Eastern Region) Key dates19 July 1836Opene...

 

Location of Pacific County in Washington This list presents the full set of buildings, structures, objects, sites, or districts designated on the National Register of Historic Places in Pacific County, Washington, and offers brief descriptive information about each of them. The National Register recognizes places of national, state, or local historic significance across the United States.[1] Out of over 90,000 National Register sites nationwide,[2] Washington is home to appro...

 

一中同表,是台灣处理海峡两岸关系问题的一种主張,認為中华人民共和国與中華民國皆是“整個中國”的一部份,二者因為兩岸現狀,在各自领域有完整的管辖权,互不隶属,同时主張,二者合作便可以搁置对“整个中國”的主权的争议,共同承認雙方皆是中國的一部份,在此基礎上走向終極統一。最早是在2004年由台灣大學政治学教授張亞中所提出,希望兩岸由一中各表�...

  بوليفيا (بالإسبانية: Estado Plurinacional de Bolivia)‏[1][2]  بوليفياعلم بوليفيا  بوليفياشعار بوليفيا    الشعار الوطني(بالإسبانية: La Unión es la Fuerza)‏  النشيد: نشيد بوليفيا الوطني  الأرض والسكان إحداثيات 17°03′25″S 64°59′28″W / 17.056869611111°S 64.991228611111°W / -17.05686961111...

 

For this architect's father, see Amon Wilds. Amon Henry WildsBorn1784 or 1790Died13 July 1857Shoreham-by-SeaNationalityEnglishOccupationArchitectBuildingsBrighton Unitarian Church;Gothic House, Brighton;Park Crescent, Brighton;Park Crescent, Worthing;St Mary the Virgin Church, Brighton;Royal Albion Hotel;Western Pavilion;Wykeham Terrace (attr.)ProjectsRegency Square;Kemp Town;Brunswick estate;Montpelier Crescent;Anthaeum (destroyed) The Western Pavilion, built by Amon Henry Wilds as his Brigh...

 

This is the talk page for discussing improvements to the Ancient Greece topics template. Put new text under old text. Click here to start a new topic. New to Wikipedia? Welcome! Learn to edit; get help. Assume good faith Be polite and avoid personal attacks Be welcoming to newcomers Seek dispute resolution if needed This template does not require a rating on Wikipedia's content assessment scale.It is of interest to the following WikiProjects:Greece Greece portalThis template is within the sc...

Head of government of Poland For a list of holders of the office, see List of prime ministers of Poland. President of theCouncil of MinistersPrezes Rady Ministrów (Polish)Logo used by institutions of thePolish GovernmentFlag of PolandIncumbentDonald Tusksince 13 December 2023Council of MinistersChancellery of the Prime MinisterStyleMr Prime Minister (informal)His Excellency (diplomatic)TypeHead of governmentMember ofEuropean CouncilResidenceWilla Parkowa, WarsawSeatBuilding of the ...

 

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: ABCs of Death 2 – news · newspapers · books · scholar · JSTOR (April 2015) (Learn how and when to remove this message) 2014 filmABCs of Death 2Theatrical release posterDirected byVarious directorsWritten byVarious screenwritersProduced by Ant Timpson Tim League...