Datacompressie

Datacompressie is het representeren van digitale gegevens met minder bits dan de oorspronkelijke representatie. Dit artikel zou bijvoorbeeld minder ruimte innemen als we overal het woord 'comp' in plaats van 'compressie' kunnen schrijven. Daardoor zou het bijvoorbeeld sneller over een netwerk verstuurd kunnen worden.

Het comprimeren van gegevens is nuttig, omdat het helpt om bronnen te verkleinen en daardoor een hogere opslagcapaciteit of transmissiecapaciteit geeft. Dezelfde hoeveelheid gegevens kunnen namelijk in minder bytes worden verzonden en opgeslagen. Gecomprimeerde gegevens moeten eerst worden uitgepakt, hiervoor is tijd en rekenkracht nodig. Dit vergt een afweging tussen ruimtebesparing of tijdsbesparing.

Er zijn twee vormen van datacompressie; hardwarematig en softwarematig. Hardwarematige compressie wordt uitgevoerd door gespecialiseerde apparatuur, zoals een speciale videokaart. Dit versnelt de compressie aanzienlijk. Softwarematige compressie wordt gedaan door een computerprogramma, deze oplossing is goedkoper en universeler.[1]

Typen datacompressie

Er zijn verschillende typen datacompressie:

  1. exact omkeerbaar (Engels: lossless, zonder kwaliteitsverlies)
  2. niet-exact omkeerbaar (Engels: lossy, met kwaliteitsverlies)

Exact omkeerbare compressie

Bij exact omkeerbare compressie is het gedecomprimeerde (uitgepakte) bestand een exacte kopie van het oorspronkelijke bestand. Dat is essentieel voor bijvoorbeeld tekstdocumenten, spreadsheets en databasebestanden. De mate van compressie (de afname van het aantal bytes in het gecomprimeerde bestand vergeleken met het oorspronkelijke bestand) ligt in de praktijk tussen de 30% en de 70%.

Tekstbestanden

Bij tekstbestanden komen bijvoorbeeld sommige letters veel vaker voor dan andere (vergelijk e en q in het Nederlands). Een compressiemethode is daarom om unieke lettercoderingen van verschillende bitlengte te kiezen, waarbij de meest voorkomende letters de kortste codes krijgen toebedeeld. Dit is de basis van de Huffmancodering, een algoritme dat voor deze methodiek de optimale code genereert op basis van de frequentietabel van de tekens in het bestand. Ook in de morsecode wordt dit principe, dat de frequentste letters de kortste codes hebben, gehanteerd, al was de theorie op het moment dat de morsecode werd uitgevonden nog niet zo formeel uitgewerkt. Op tekstbestanden zijn echter door gebruik van andere algoritmen veel kleinere compressieratio's te behalen. (De compressieratio is de verhouding tussen de grootte van het bestand na en voor compressie: een compressieratio van 0,8 betekent dat het gecomprimeerde bestand 80% van de grootte van het oorspronkelijk bestand heeft.)

Gewone Nederlandse tekst is met optimale technieken exact omkeerbaar te comprimeren tot ca. 25 à 30 procent van de oorspronkelijke grootte. Vaak moet er een optimum worden gevonden tussen de theoretisch mogelijke graad van compressie en de daarvoor benodigde tijd of hoeveelheid geheugenruimte, waarbij ten behoeve van de snelheid met een iets minder goede compressie wordt volstaan.

Bij veel tekst kunnen (lange) woorden en zinsdelen vervangen worden door een kortere code. Als dat wordt toegepast wordt de compressie beter naarmate er meer tekst is. Ook kan gebruikgemaakt worden van een standaardbibliotheek met woorden, waardoor enkel de speciale code nog ruimte inneemt.

Exact omkeerbare compressie zal sommige bestanden langer maken

Exact omkeerbare compressie kan niet alle mogelijke bestanden daadwerkelijk comprimeren. Er zullen ook bestanden zijn die door de gehanteerde compressiemethode in omvang gelijk blijven of toenemen. Anders gezegd, elk (exact omkeerbaar) compressiealgoritme moet noodzakelijkerwijs bij bepaalde invoerbestanden een uitvoerbestand genereren dat langer is dan het invoerbestand.

Het bovenstaande is eenvoudig te bewijzen met een telargument. Het aantal binaire bestanden van maximaal N bits is eindig. Het exact omkeerbare compressiealgoritme beeldt een-eenduidig dit eindige aantal bestanden op zichzelf af. Als er een bestand is dat in gecomprimeerde vorm geringer in omvang is, kunnen niet alle bestanden van die geringere omvang meer op zichzelf afgebeeld worden, en zal er dus minstens een zijn die door de compressie in omvang toeneemt.

Op een vergelijkbare manier heeft Claude Shannon in 1948 bewezen dat er een limiet is aan lossless compressie. Om die reden is de nooit gerealiseerde "uitvinding" van Jan Sloot, waarbij zestien willekeurige speelfilms lossless in 64 kilobyte zouden passen, theoretisch onmogelijk.

Dus elk exact omkeerbare compressiealgoritme kan een bestand genereren dat langer is dan het oorspronkelijke bestand. Een goed compressiealgoritme moet dus toegesneden zijn op de eigenschappen, zoals statistiek etc., van de te comprimeren bestanden. Wanneer de werkelijkheid afwijkt van de veronderstellingen waarop de compressor is gebaseerd, kunnen grote teleurstellingen het resultaat zijn.

Wanneer na compressie het uitvoerbestand langer blijkt te zijn dan het invoerbestand, kan compressie uiteraard beter achterwege worden gelaten. Het al of niet toegepast hebben van de compressie wordt doorgegeven aan de ontvanger. Dit kost ten minste een extra bit.

Niet-exact omkeerbare compressie

Lossy compression wordt gebruikt voor digitale formaten die een weergave zijn van een analoog signaal, bijvoorbeeld beeld en geluid.

Omdat het digitale formaat een weergave is van een analoog signaal is het niet noodzakelijk om het oorspronkelijke digitale signaal te kunnen reconstrueren en kan men de eis dat er geen informatie verloren mag gaan laten vallen. Daardoor is er een veel grotere mate van compressie mogelijk zonder dat het de toeschouwer of luisteraar, die alleen het gereconstrueerde analoge signaal waarneemt, opvalt dat het origineel niet identiek is aan het weer gedecomprimeerde signaal. Bij niet-exact omkeerbare compressiealgoritmes zijn, afhankelijk van de te comprimeren gegevens, compressies van meer dan 99% mogelijk, het gecomprimeerde bestand heeft dan dus een grootte die minder dan 1% bedraagt van de grootte van het ongecomprimeerde bestand.

Veelgebruikte niet-omkeerbare compressiealgoritmes zijn:

Methodiek

Voorbeeld van Run-Length codering.

Datacompressie verwijdert de zogenaamde redundantie (lett: 'overbodigheid') van de informatie in bestanden. Bestanden met bijvoorbeeld meer nullen dan enen, of meer enen dan nullen, vertonen redundantie, die met compressie kan worden verwijderd. Een gecomprimeerd bestand zal, als de compressie goed geslaagd is, geen of weinig redundantie vertonen. Om die reden heeft het daarom vaak weinig zin om een compressiebewerking te herhalen met de verwachting dat het bestand nog verder gecomprimeerd wordt. Compressie van willekeurige gegevens (bijvoorbeeld getallen verkregen uit een ideale toevalsgenerator), en dus niet redundant, is niet mogelijk. Voor een goede keuze van het compressie-algoritme (codec) is het van groot belang de aard van de bestanden die ermee zullen worden gecomprimeerd te kennen, omdat we anders een goede kans hebben met een langer 'gecomprimeerd' bestand te eindigen.

Het succes van compressie is afhankelijk van de interne structuur van de informatie. Herhalende patronen laten zich over het algemeen beter comprimeren, terwijl bestanden waarin al een vorm van compressie is toegepast niet of nauwelijks verder te comprimeren zijn. Dat laatste is bijvoorbeeld het geval bij veel digitale media zoals MP3, JPEG en diverse videoformaten.

Sommige goede compressiemethoden mogen niet door iedereen worden gebruikt omdat er een octrooi op rust.

Toepassingen

Tegenwoordig wordt datacompressie voor verschillende toepassingen gebruikt, zoals:

Algoritmen

Er bestaan verschillende algoritmen voor datacompressie, bijvoorbeeld:

Programma's

Zie Lijst van datacompressiesoftware voor het hoofdartikel over dit onderwerp.

Veel mensen werken met datacompressie door middel van compressieprogramma's voor algemeen gebruik. Bekende voorbeelden daarvan zijn:

Zie ook

Read other articles:

Lily Estelita LianaLahirLily Estelita Liana22 Juli 1993 (umur 30)Sleman, Daerah Istimewa Yogyakarta, IndonesiaNama lainLily EstelitaEstelita LianaAlmamaterUniversitas Gadjah MadaPekerjaanModelRatu kecantikanDokterTinggi172 cm (5 ft 8 in)Pemenang kontes kecantikanGelar Puteri Indonesia Yogyakarta 2014 Puteri Indonesia Pariwisata 2014 Miss Supranational Indonesia 2014 Warna rambutHitamWarna mataHitamKompetisiutama Puteri Indonesia Yogyakarta 2014(Pemenang) Puteri Indone...

Amphibia Serie de televisión Títulos en español Anfibilandia (España)Género ComediaFantasíaCreado por Matt BralyDirigido por Derek Kirk KimBert YoungKim RobersonIan WorrelVoces de Brenda SongJustin FelbingerBill FarmerAmanda LeightonAnna AkanaTroy BakerHaley TjuKeith DavidTema principal Welcome to Amphibia (instrumental)Temas de cierre Anne's Theme(compuesto por T. J. Hill (temporada 1 y 2)). Anne's Theme (Remix)(compuesto por compuesta por T. J. Hill y voces interpretadas por Brenda So...

artikel ini perlu dirapikan agar memenuhi standar Wikipedia. Tidak ada alasan yang diberikan. Silakan kembangkan artikel ini semampu Anda. Merapikan artikel dapat dilakukan dengan wikifikasi atau membagi artikel ke paragraf-paragraf. Jika sudah dirapikan, silakan hapus templat ini. (Pelajari cara dan kapan saatnya untuk menghapus pesan templat ini) Genshin ImpactInformasi produksiPengembangmiHoYoPenerbitmiHoYo Cognosphere Pte. Ltd. (di bawah merek HoYoverse)[1][2]ProduserCai H...

Kruckel Stadt Dortmund Koordinaten: 51° 27′ N, 7° 25′ O51.4557.4108333333333110Koordinaten: 51° 27′ 18″ N, 7° 24′ 39″ O Höhe: ca. 110 m ü. NHN Einwohner: 1327 (31. Dez. 2018) Eingemeindung: 1. August 1929 Postleitzahl: 44227 Vorwahl: 0231 Unterbezirk: 662 Verbliebene Gebäude der Zeche Vereinigte Wiendahlsbank Bahnhof Dortmund-Kruckel Kruckel ist ein südwestlicher Stadtteil von Dortmund im Stadt...

  ميّز عن الغرب الأمريكي القديم. غرب الولايات المتحدة   الإحداثيات 40°N 113°W / 40°N 113°W / 40; -113  تقسيم إداري  البلد الولايات المتحدة[2][1]  التقسيم الأعلى الولايات المتحدة  رمز جيونيمز 11887751  تعديل مصدري - تعديل   ولايات الغرب الأمريكية، الت

O remo é um esporte disputado em Jogos Olímpicos desde Paris 1900. Em sua história, teve diversas provas, algumas das quais retiradas do programa olímpico. Estes são os medalhistas olímpicos do esporte:[1] Programa atual Skiff simples Evento Ouro Prata Bronze Paris 1900(detalhes) Hermann BarreletFRA França André GaudinFRA França George Saint AsheGBR Grã-Bretanha St. Louis 1904(detalhes) Frank GreerUSA Estados Unidos James JuvenalUSA Estados Unidos Constance TitusUSA Estados Unidos L...

Town in Uttarakhand, India This article is about Kedarnath town. For the temple, see Kedarnath Temple. For the mountain, see Kedarnath (mountain). For the film, see Kedarnath (film). Town in Uttarakhand, IndiaKedarnath KedarkhandTownA view of KedarnathKedarnathLocation in Uttarakhand, IndiaShow map of UttarakhandKedarnathKedarnath (India)Show map of IndiaCoordinates: 30°44′N 79°04′E / 30.73°N 79.07°E / 30.73; 79.07Country IndiaStateUttarakhandDistrictRudra...

For other uses, see Orbea (disambiguation). OrbeaTypeCo-operativeIndustryBicyclesFounded1840; 183 years ago (1840)HeadquartersMallabia, SpainArea servedWorldwideProductsBicycles and related componentsWebsiteorbea.com Orbea is a bicycle manufacturer based in Mallabia, Spain. It is part of the Mondragón Cooperative Corporation and Spain's largest bicycle manufacturer. Orbea manufactures and assembles bikes at their own factory in Mallabia, the other models being made in Portu...

Hospital in Texas, United States Memorial Hermann Memorial City Medical Center The Memorial Hermann Memorial City Medical Center is a hospital in Memorial City, Houston, Texas. It is a part of the Memorial Hermann Healthcare System and houses the system's headquarters.[1][2] Pediatric care to the hospital is provided by doctors from Children's Memorial Hermann Hospital which treats infants, children, teens, and young adults age 0-21. History This section needs expansion. You c...

WWE pay-per-view and livestreaming event Survivor SeriesPromotional poster featuring The UndertakerPromotionWWEBrand(s)RawSmackDownDateNovember 22, 2020CityOrlando, FloridaVenueWWE ThunderDome at Amway CenterAttendance0 (behind closed doors)[Note 1]Tagline(s)Best of the Best[1]Undertaker 30Undertaker's Final Farewell[2]WWE Network event chronology ← PreviousHell in a Cell Next →NXT TakeOver: WarGames Survivor Series chronology ← Previous2019 Next&#...

Sebuah perhitungan Indeks Pembangunan Manusia (IPM) yang menggunakan metode baru dilaksanakan oleh Badan Pusat Statistik (BPS) dari tahun 2010 hingga sekarang. Berikut ini akan disajikan penjelasan, sejarah, dan metodologi perhitungan IPM, serta daftar kabupaten dan kota administrasi Daerah Khusus Ibukota Jakarta menurut IPM tahun 2012. Penjelasan Indeks Pembangunan Manusia (IPM)/Human Development Index (HDI) adalah pengukuran perbandingan dari harapan hidup, melek huruf, pendidikan dan stand...

This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (April 2015) (Learn how and when to remove this template message) Waller Air Force Base Part of Sixth Air ForceArima, Trinidad and Tobago Waller AFBCoordinates10°36′48.87″N 061°12′48.30″W / 10.6135750°N 61.2134167°W / 10.6135750; -61.2134167TypeMilitary airfieldSite information...

Questa voce sull'argomento centri abitati dell'Ohio è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. North Cantoncity(EN) North Canton, Ohio North Canton – Veduta LocalizzazioneStato Stati Uniti Stato federato Ohio ConteaStark TerritorioCoordinate40°52′30″N 81°24′04″W / 40.875°N 81.401111°W40.875; -81.401111 (North Canton)Coordinate: 40°52′30″N 81°24′04�...

American college football season 1980 Ohio State Buckeyes footballFiesta Bowl, L 19–31 vs. Penn StateConferenceBig Ten ConferenceRankingCoachesNo. 15APNo. 15Record9–3 (7–1 Big Ten)Head coachEarle Bruce (2nd season)Offensive coordinatorGlen Mason (1st season)Defensive coordinatorDennis Fryzel (2nd season)MVPCalvin MurrayCaptains Doug Donley Ray Ellis Keith Ferguson Calvin Murray Home stadiumOhio Stadium(Capacity: 83,112)Seasons← 19791981 U...

Colpo proibitoJames Cagney e Olivia de HavillandTitolo originaleThe Irish in Us Lingua originaleinglese Paese di produzioneStati Uniti d'America Anno1935 Durata84 min Dati tecniciB/Nrapporto: 1,37:1 Generecommedia RegiaLloyd Bacon SoggettoFrank Orsatti SceneggiaturaEarl Baldwin ProduttoreSamuel Bischoff Casa di produzioneWarner Bros. Pictures FotografiaGeorge Barnes MontaggioJames Gibbon MusicheHeinz Roemheld ScenografiaEsdras Hartley CostumiOrry-Kelly (non accreditato) Eugene Joseff (gioiell...

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (نوفمبر 2019) نات فينكلستاين معلومات شخصية الميلاد 16 يناير 1933[1]  بروكلين  الوفاة 2 أكتوبر 2009 (76 سنة) [2][1]  سبب الوفاة ذات الرئة  مواطنة الولايات المتح...

Anthony Turgis (2023) BiografiaNaixement16 maig 1994 (30 anys)Bourg-la-Reine (França) Dades personalsNacionalitat FrançaAlçada179 cm ActivitatOcupacióciclista Nacionalitat esportivaFrança Esportciclisme de carretera Disciplina esportivaciclisme de carretera Posició a l'equipesprintadorTrajectòria  Equip Competició 2013-2014 CC Nogent-sur-Oise 2014-2014 Cofidis 2015-2018 Cofidis 2019- TotalEnergies Participà en1r juliol 2023Tour de França de 2023 (94è)../... 25+ FamíliaGer...

1913 – MCMXIII111 år sedan År1910 | 1911 | 191219131914 | 1915 | 1916 Årtionde1890-talet  | 1900-talet 1910-talet1920-talet | 1930-talet Århundrade1800-talet 1900-talet2000-talet Årtusende1000-talet Året Födda | AvlidnaBildanden | Upplösningar Humaniora och kultur Film | Konst | Litteratur | Musik | Serier | Teater Samhällsvetenskapoch samhälleKrig | Politik | Sport Teknik och vetenskap Vetenskap Andra tideräkningar...

Old Seglora Church at Skansen. Seglora (Swedish pronunciation: [ˈsêːˌɡluːra])[1] is the most rural part of the Borås Municipality. It is bordering to Mark Municipality and Bollebygd Municipality in western Sweden. Seglora as a locality is not very well known in Sweden, but most Swedes know of the Seglora Church that can be found at Skansen. The Church there was sold to Skansen in 1916, and in 1918 the church was reopened at its new locality. References ^ Jöran Sahlgren...

Santiago GentilettiGentiletti, nel 2015, con la maglia della LazioNazionalità Argentina Altezza184 cm Peso81 kg Calcio RuoloDifensore Termine carriera12 luglio 2021 CarrieraGiovanili 2003-2004 Gimnasia (LP) Squadre di club1 2004-2008 Gimnasia (LP)63 (1)2008→  Osorno6 (1)2009→  O'Higgins30 (1)2010-2011 Argentinos Juniors58 (2)2011-2012→  Brest18 (2)2012-2014 San Lorenzo73 (3)2014-2016 Lazio33 (1)2016-2018 Genoa19 (0)2018-2019 Albace...