أحد الأنماط الرئيسة في الترميز الإنتروبي هي بإنشاء وتعيين «ترميز بادئة حر وفريد» لكل رمز فريد مدخل، هذه الرموز تشكل ترميز كلمة كخرج ل «متحول طول البادئة الحرة».[1]
المبدأ
طول كل ترميز كلمة تأخد متوسطإحتمالي قريب للوغارتم السالب لإحتمال ترميزها ولذلك الرمز الأكثر تكرارا سيأخذ الترميز الأقصر.
طبقا لترميز شانون، طول الترميز الأمثل لرمز يعطى بالعلاقة حيث b عدد الرموز المستخدمة في الخرج و P الاحتمال لرموز الدخل.
اعتبارا من 2014، تم البدء بضغط البيانات استعانة بعائلة أنظمة الارقام اللامتماثلة في تقنيات الضغظ الانتروبي، والذي سمح بدمج: نسبة ضغط الضغط الحسابي مع تكلفة معالجة ترميز هوفمان[1]
الإنتروبيا كمقياس للتشابه
إلى جانب استعمال الترميز الإنتروبي كوسيلة ضغط البيانات الرقمية، يمكن استخدام مرمز إنتروبي لقياس كمية التشابه بين تيار بيانات موجود مسبقا في صفوف البيانات، وذلك عن طريق توليد «ضاغط / مرمز إنتروبي» لكل صف من البيانات.
البيانات غير المعروفة تصنف إحصائيا عن طريق تغذية هذه الملفات غير المضغوطة لكل ضاغط إنتروبي وتقدير نتائج الضغط للحصول على النسبة الأعلى، فيكون المرمز ذو النسبة الأفضل الأعلى إحتماليا لأن يكون المرمز الذي تدرب على البيانات الأكثر شبها للبيانات غير المعروفة.[1]