דחיסה מאבדת נתונים

דחיסה מאבדת נתונים (על פי האקדמיה ללשון העברית: דחיסה מפחיתה[1]) היא דחיסת נתונים שיש לתוצאתה פחות מידע מאשר המקור, אך היא עדיין שימושית. הדחיסה מאבדת הנתונים בדרך כלל מסירה נתונים שהעין או האוזן האנושית אינן מבחינות בהם באופן רגיל, כדי לקבל יחסי דחיסה גבוהים בהרבה מאלה של דחיסה ללא איבוד נתונים (על פי האקדמיה ללשון: דחיסה לא מפחיתה[2]).

דחיסת תמונות

הדחיסה מאבדת הנתונים הנפוצה ביותר לתמונות היא JPEG. בפורמט זה מחולקת התמונה לריבועים של 8 על 8 פיקסלים והבדלי גוון ובהירות שהעין אינה מבחינה בהם באופן רגיל משוטחים. פורמט JPEG מגיע בדרך כלל, בתצלומים ותמונות דמויות תצלומים (כגון הדמיות בתלת-ממד), לקבצים בגודל של עשירית מהקובץ הלא דחוס, לעומת חצי בפורמט ללא איבוד נתונים כמו PNG.

דחיסת קול

הדחיסה מאבדת הנתונים לקול משתמשת בדגמים פסיכואקוסטיים כדי להסיר נתוני קול שהאוזן האנושית אינה מבחינה בהם באופן רגיל. למשל, אוזנינו אינן שומעות צליל בעוצמה נמוכה הבא מיד אחרי רעש גדול, ועל כן הצליל הזה יוסר. הפורמט הנפוץ ביותר לדחיסה מאבדת נתונים של קול הוא MP3, אך קיימים עוד בשימוש, כמו Vorbis ו-AAC. אף כאן מושגת דחיסה לכדי עשירית מגודל הקובץ הלא דחוס, לעומת חצי בדחיסה ללא איבוד נתונים כמו FLAC.

יתרונות וחסרונות

היתרון הגדול של דחיסה מאבדת נתונים, כמובן, הוא יחסי הדחיסה הגבוהים. יחסי דחיסה אלה מציבים את גודל הקובץ באזור המתקבל על הדעת לתעבורה דרך האינטרנט. מהפכת המוזיקה הדיגיטלית מעולם לא הייתה מתאפשרת ללא פורמטים כמו MP3. לפני עלייתה של הדחיסה מאבדת הנתונים, הדרך היחידה להקטין קבצים במידה מספקת לתעבורת אינטרנט הייתה להנמיך את רמת הדגימה שלהם. לדוגמה להמיר קובץ קול סטראופוני מקורי בפורמט WAV בתדר דגימה של 44.1 קילוהרץ, ב-16 סיביות לדגימה (65,536 אפשרויות עוצמה בדגימה אחת), לקובץ WAV בתדר דגימה של 22.05 קילוהרץ, 8 סיביות לדגימה (256 אפשרויות עוצמה בלבד) וגם מעבר מסטראו למונו. המרה כזאת הייתה מקטינה את הקובץ רק לכדי שמינית, וזאת במחיר של אובדן עצום באיכות. על ידי שימוש בדחיסה מאבדת נתונים באיכות של 128 קילו־סיביות לשנייה ניתן להשאיר את הקובץ ברמת דגימה של 44.1 קילוהרץ, 16 סיביות וסטריאו, בגודל עשירית מהקובץ המקורי, ללא ירידה משמעותית באיכות.

אולם, העובדה היא שהדחיסה הזאת מסירה מידע מהקובץ המקורי, ההסרה הזו עלולה להיות מורגשת. למשל, בשמיעה באוזניות טובות, אפשר להבחין בהבדלים בין קובץ MP3 באיכות של 128 קילו־סיביות לשנייה לעומת הקובץ המקורי. המרה לקובץ MP3 באיכות של 48 קילו־סיביות לשנייה מקטינה את הקובץ פי 30 אך האיבוד באיכות הוא משמעותי וגם מאזין לא מקצועי יבחין בירידה באיכות. את התוצאות של דחיסת JPEG אפשר לראות כאשר מגדילים את התמונה, וככל שמשתמשים ברמת דחיסה גבוהה יותר (כלומר הסרה של יותר נתונים) ההבדלים מורגשים יותר. בנוסף, כל שמירה של קובץ בפורמט מאבד נתונים מסירה ממנו עוד נתונים, כך שעריכת קובץ JPEG או MP3 עלולה בסופו של דבר להניב קובץ באיכות ירודה ביותר. מקובל כי לשם שימור לטווח ארוך בארכיוני צליל של מוזיקה יש לשמור את כל הקבצים בפורמט לא דחוס או בדחיסה ללא איבוד נתונים. הפורמט המינימלי המומלץ על ידי האיגוד העולמי לארכיוני צליל IASA הוא קובצי WAV בתדר דגימה של 48 קילוהרץ, ב-24 סיביות לדגימה.

שיטות לדחיסה מאבדת נתונים

תמונות דוממות

תמונות נעות

דחיסת מוזיקה

דחיסת דיבור

סוגי מידע אחרים

אפשר לדחוס טקסט אם מסירים סימנים במידה שהבנת המשמעות המקורית עדיין אפשרית. יש הרואים בכתיב חסר ניקוד צורה של דחיסה מאבדת נתונים. ברם, דחיסה מאבדת נתונים לטקסט אינה פופולרית כלל. כל הדחיסות המקובלות לקובצי טקסט, כמו ZIP, הן דחיסות ללא איבוד נתונים.

ראו גם

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא דחיסה מאבדת נתונים בוויקישיתוף

הערות שוליים