Phân tích tần suất

Biểu đồ tần suất các ký tự trong tiếng Anh.

Trong phân tích mật mã, phép phân tích tần suất là phương pháp thường dùng để phân tích mật mã cổ điển, bằng cách tính tần suất các ký tự hoặc nhóm ký tự trong bản mã và so sánh với tần suất thực tế trong các văn bản thường.

Nguyên lý của phân tích tần suất dựa trên một thực tế là trong mỗi ngôn ngữ, mỗi ký tự trong bảng chữ cái có một tần suất xuất hiện nhất định. Tần suất này càng rõ ràng khi văn bản phân tích càng dài. Ví dụ trong tiếng Anh, E, T, A và O là những chữ cái xuất hiện nhiều nhất, trong khi Z, Q và X lại rất hiếm hoi. Tương tự, ta có TH, ER, ON, và AN là các nhóm ký tự phổ thông nhất, còn SS, EE, TT, và FF là các bộ đôi ký tự lặp xuất hiện nhiều nhất[1]. "ETAOIN SHRDLU" là 12 ký tự có tần suất cao nhất trong một văn bản tiếng Anh thông thường.

Trong một số bản mã, khi một vài đặc trưng ngôn ngữ được tìm thấy, rất có thể nó có thể bị phá vỡ bằng tấn công chỉ từ bản mã.

Phân tích tần suất cho mật mã đơn giản

Lịch sử và ứng dụng

Trang đầu Sổ tay phương pháp giải mã của Al-Kindi

Phương pháp phân tích tần suất được biết đến đầu tiên là trong cuốn Sổ tay phương pháp giải mã của nhà thông thái Ả-rập Al-Kindi vào thế kỷ thứ 9[2]. Ông nhận ra rằng trong kinh Koran, mỗi chữ cái Ả rập đều có một tần suất xác định, điều tương tự cũng xảy ra trong các ngôn ngữ khác.

Trong văn học

Tham khảo

  1. ^ Singh, Simon. “The Black Chamber: Hints and Tips”. Bản gốc lưu trữ ngày 18 tháng 5 năm 2011. Truy cập ngày 26 tháng 10 năm 2010.
  2. ^ Ibrahim A. Al-Kadi "The origins of cryptology: The Arab contributions", Cryptologia, 16(2) (April 1992) pp. 97–126.

Liên kết ngoài