Lý thuyết thông tin

Lý thuyết thông tin là một nhánh của toán học ứng dụngkĩ thuật điện nghiên cứu về đo đạc lượng thông tin. Lý thuyết thông tin được xây dựng bởi Claude E. Shannon để xác định giới hạn cơ bản trong các hoạt động xử lý tín hiệu chẳng hạn như nén dữ liệu hay lưu trữtruyền dẫn dữ liệu. Ngay từ những ngày đầu, nó đã mở rộng phạm vi ứng dụng ra nhiều lĩnh vực khác, bao gồm suy luận thống kê, xử lý ngôn ngữ tự nhiên, mật mã học, các mạng lưới bên cạnh mạng lưới viễn thông - chẳng hạn như trong thần kinh[1], sự tiến hóa[2] và chức năng[3] của các mã phân tử, lựa chọn mô hình[4] trong sinh thái học, vật lý nhiệt, máy tính lượng tử[5], phát hiện sao chép[6] và các hình thức phân tích dữ liệu khác.[7]

Một độ đo cơ bản của thông tin là entropy, thường được diễn đạt dưới dạng số lượng bit cần thiết trung bình để lưu trữ hoặc dẫn truyền. Entropy lượng hóa sự không chắc chắn trong việc dự đoán giá trị của một biến ngẫu nhiên. Ví dụ như, xác định kết quả của một lần tung đồng xu công bằng (hai kết quả có khả năng như nhau) cho ít thông tin hơn (entropy nhỏ hơn) là xác định kết quả của một lần tung xúc sắc (sáu kết quả có khả năng như nhau).

Các ứng dụng cơ bản của lý thuyết thông tin bao gồm nén không mất dữ liệu (chẳng hạn như ZIP), nén mất dữ liệu (chẳng hạn MP3, JPG), mã hóa kênh (chẳng hạn như trong DSL). Lý thuyết thông tin nằm ở phần giao nhau giữa toán học, thống kê, khoa học máy tính, vật lý, thần kinh, và kĩ thuật điện. Các ngành hẹp quan trọng của lý thuyết thông tin bao gồm mã hóa nguồn, mã hóa kênh, lý thuyết thông tin thuật toán, bảo mật theo lý thuyết thông tin.

Tổng quan

Khái niệm cơ bản của lý thuyết thông tin có thể được nắm bắt thông qua việc xem xét hình thức liên lạc phổ biến nhất của con người: ngôn ngữ. Hai yếu tố quan trọng của một ngôn ngữ ngắn gọn là: các từ thông dụng (như "một", "cái", "tôi") nên ngắn gọn hơn các từ kém thông dụng hơn (như "thông tin", "thợ thủ công") để các câu không bị quá dài. Sự cân bằng độ dài các từ như vậy cũng tương tự như trong nén dữ liệu và là một thành phần cơ bản của mã hóa nguồn. Ngoài ra, nếu một phần của câu không nghe được hoặc bị nghe nhầm do tiếng ồn, chẳng hạn như do có ô tô chạy qua, thì người nghe vẫn có thể đoán ra ý nghĩa của câu. Sự vững chắc đó là một thành phần thiết yếu cho hệ thống liên lạc điện tử cũng như cho ngôn ngữ. Tính chất đó trong truyền thông được đảm bảo bởi mã hóa kênh. Mã hóa nguồn và mã hóa kênh là những mối quan tâm chính của lý thuyết thông tin.

Lý thuyết thông tin thường được xem là xuất phát từ bài báo quan trọng của Shannon (1948) mang tên "A Mathematical Theory of Communication". Mô hình trung tâm của lý thuyết thông tin cổ điển là vấn đề kĩ thuật của việc truyền dẫn thông tin trên một kênh nhiễu. Kết quả cơ bản trong lý thuyết này là định lý mã hóa nguồn của Shannon, khẳng định rằng tính trung bình, số bit cần dùng để mô tả kết quả của một sự kiện ngẫu nhiên chính là entropy của nó, và định lý mã hóa trên kênh nhiễu cũng của Shannon, khẳng định rằng việc liên lạc không lỗi trên một kênh nhiễu là có thể miễn là tốc độ truyền dữ liệu là nhỏ hơn một giới hạn nhất định, gọi là dung lượng kênh. Có thể đạt đến gần dung lượng kênh trong thực tế bằng cách sử dụng các hệ thống mã hóa và giải mã thích hợp.

Bối cảnh lịch sử

Sự kiện nổi bật đánh dấu sự khởi đầu của lý thuyết thông tin là bài báo của Claude E. Shannon "A Mathematical Theory of Communication" ở Bell System Technical Journal vào tháng 7 và tháng 10 năm 1948.

Trước bài báo này, một số ý tưởng về lý thuyết thông tin đã được phát triển tại Bell Labs, trong trường hợp đặc biệt khi tất cả các sự kiện đều có cùng xác suất. Bài báo năm 1924 của Harry Nyquist, "Certain Factors Affecting Telegraph Speed", chứa một phần lý thuyết định lượng "tri thức" (intelligence) và "tốc độ đường truyền" (line speed), đưa ra mối liên hệ W = Klogm, trong đó W là tốc độ dẫn truyền tri thức, m là số cấp điện áp có thể sử dụng tại mỗi bước và K là một hằng số. Bài báo năm 1928 của Ralph Hartley, "Transmission of Information", sử dụng thuật ngữ "thông tin" (information) như một đại lượng đo được, thể hiện khả năng phân biệt giữa các dãy ký hiệu của người nhận, do đó lượng hóa thông tin bởi H = logSn = nlogS, trong đó S là số ký hiệu có thể sử dụng, và n là số ký hiệu được truyền đi. Đơn vị tự nhiên của thông tin do đó là một chữ số thập phân, sau này được đổi tên là hartley để ghi danh đóng góp của ông, là một đơn vị đo thông tin. Năm 1940, Alan Turing đã sử dụng những ý tưởng tương tự cho phân tích thống kê để phá bộ mã Enigma của Đức trong chiến tranh thế giới thứ hai.

Phần lớn lý thuyết toán học đằng sau lý thuyết thông tin với các sự kiện có xác suất khác nhau được xây dựng trong ngành nhiệt động học bởi Ludwig BoltzmannJ. Willard Gibbs. Mối liên hệ giữa entropy thông tin và entropy nhiệt động học, bao gồm đóng góp quan trọng của Rolf Landauer trong thập kỉ 1960, được mô tả trong trang Entropy trong nhiệt động học và lý thuyết thông tin.

Đo lường thông tin

Lý thuyết thông tin được xây dựng dựa trên lý thuyết xác suấtthống kê. Thông số quan trọng nhất của thông tin là entropy, lượng thông tin trong một biến ngẫu nhiên, và thông tin tương hỗ, lượng thông tin chung giữa hai biến ngẫu nhiên.

Entropy

Entropy của một phép thử Bernoulli dưới dạng hàm số của xác suất thành công, thường gọi là hàm entropy nhị phân, . Entropy mỗi lần thử tối đa là 1 bit khi hai kết quả có cùng khả năng xảy ra, như trong một lần tung đồng xu công bằng.

Nếu là tập hợp tất cả các thông điệp có thể nhận giá trị, và là xác suất nhận giá trị , thì entropy của được định nghĩa như sau:[8]

Trường hợp đặc biệt của entropy thông tin cho biến ngẫu nhiên với đúng hai khả năng gọi là hàm entropy nhị phân, thường được tính theo lôgarit cơ số 2:

Entropy hợp

Entropy hợp của hai biến ngẫu nhiên rời rạc XY là entropy của cặp (X, Y). Có nghĩa là nếu XYđộc lập thì entropy hợp là tổng của entropy của mỗi biến.

Entropy có điều kiện

Entropy có điều kiện của X cho trước Y là giá trị kì vọng của entropy của X theo phân bố của Y.

Một tính chất cơ bản của entropy có điều kiện là

Thông tin tương hỗ

Thông tin tương hỗ đo lượng thông tin thu được về một biến ngẫu nhiên thông qua giá trị của một biến ngẫu nhiên khác.

Một tính chất cơ bản của thông tin tương hỗ là

Thông tin tương hỗ có tính chất đối xứng:

Thông tin tương hỗ có thể được biểu diễn dưới dạng khoảng cách Kullback-Leibler của phân bố hậu nghiệm của X nếu biết giá trị của Yphân bố tiền nghiệm của X:

Nói cách khác, độ đo này xác định, về mặt trung bình, sự thay đổi của phân bố của X nếu biết giá trị của Y. Giá trị này còn có thể tính bằng khoảng cách giữa tích của các phân bố biên với phân bố hợp:

Khoảng cách Kullback-Leibler

Khoảng cách Kullback-Leibler (hoặc entropy tương đối) là một cách so sánh hai phân bố: phân bố "thật" p(x) và một phân bố bất kì q(x). Nó được định nghĩa như sau:

Mặc dù đôi khi nó được sử dụng như một "khoảng cách metric", khoảng cách Kullback-Leibler không phải là một metric do nó không đối xứng và không thỏa mãn bất đẳng thức tam giác.

Các thông số khác

Một vài thông số khác trong lý thuyết thông tin bao gồm entropy Rényi, entropy vi phân, thông tin tương hỗ có điều kiện.

Lý thuyết mã hóa

Một bức ảnh các vết xước trên bề mặt của một đĩa CD-R. Nhạc và dữ liệu lưu trên CD được mã hóa bằng mã tự sửa lỗi và do đó vẫn có thể đọc được ngay cả khi có những vết xước nhỏ, bằng cách sử dụng kĩ thuật phát hiện và sửa lỗi.

Lý thuyết mã hóa là một trong những ứng dụng quan trọng và trực tiếp nhất của lý thuyết thông tin. Nó có thể được chia làm lý thuyết mã hóa nguồn và lý thuyết mã hóa kênh. Sử dụng kết quả thống kê cho dữ liệu, lý thuyết thông tin định lượng số bit cần thiết để lưu trữ dữ liệu (chính là entropy thông tin của dữ liệu).

  • Nén dữ liệu (mã hóa nguồn): Có hai hình thức nén dữ liệu:
  1. Nén không mất dữ liệu: dữ liệu phải được khôi phục chính xác
  2. Nén mất dữ liệu: phân bổ đủ số bit cần thiết để khôi phục dữ liệu, trong một độ chính xác định trước, đo bởi một hàm biến dạng.
  • Mã sửa lỗi (mã hóa kênh): Khi nén dữ liệu đã loại bỏ hoàn toàn phần dữ liệu thừa, một mã sửa lỗi thêm vào một số thông tin dự phòng để có thể truyền dữ liệu một cách hiệu quả và trung thực qua một kênh nhiễu.

Cách phân chia lý thuyết mã hóa thành nén và truyền được giải thích bởi các định lý truyền thông tin, hoặc các định lý phân chia nguồn-kênh, trong đó lý giải việc sử dụng bit làm đơn vị chung cho thông tin trong nhiều bối cảnh khác nhau. Tuy nhiên các định lý này chỉ đúng trong trường hợp một người gửi muốn truyền thông tin cho đúng một người nhận. Trong trường hợp có nhiều người gửi (kênh đa truy cập), hoặc nhiều người nhận (kênh phát sóng), hoặc có người trung gian giúp đỡ (kênh tiếp sức), hoặc tổng quát hơn, trong mạng máy tính, việc nén rồi truyền có thể không còn tối ưu. Lý thuyết thông tin trên mạng nghiên cứu về những mô hình truyền thông nhiều đối tượng.

Ghi chú

  1. ^ F. Rieke, D. Warland, R Ruyter van Steveninck, W Bialek, Spikes: Exploring the Neural Code. The MIT press (1997).
  2. ^ cf. Huelsenbeck, J. P., F. Ronquist, R. Nielsen and J. P. Bollback (2001) Bayesian inference of phylogeny and its impact on evolutionary biology, Science 294:2310-2314
  3. ^ Rando Allikmets, Wyeth W. Wasserman, Amy Hutchinson, Philip Smallwood, Jeremy Nathans, Peter K. Rogan, Thomas D. Schneider Lưu trữ 2012-02-04 tại Wayback Machine, Michael Dean (1998) Organization of the ABCR gene: analysis of promoter and splice junction sequences, Gene 215:1, 111-122
  4. ^ Burnham, K. P. and Anderson D. R. (2002) Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach, Second Edition (Springer Science, New York) ISBN 978-0-387-95364-9.
  5. ^ Jaynes, E. T. (1957) Information Theory and Statistical Mechanics, Phys. Rev. 106:620
  6. ^ Charles H. Bennett, Ming Li, and Bin Ma (2003) Chain Letters and Evolutionary Histories Lưu trữ 2007-10-07 tại Wayback Machine
  7. ^ David R. Anderson (ngày 1 tháng 11 năm 2003). “Some background on why people in the empirical sciences may want to better understand the information-theoretic methods” (PDF). Bản gốc (pdf) lưu trữ ngày 23 tháng 7 năm 2011. Truy cập ngày 23 tháng 6 năm 2010.
  8. ^ Fazlollah M. Reza (29 tháng 12 năm 1994). An Introduction to Information Theory. Dover Publications, Inc., New York. ISBN 0-486-68210-2.

Các công trình cổ điển

Read other articles:

إدوين هوارد آرمسترونغ (بالإنجليزية: Edwin Howard Armstrong)‏  معلومات شخصية الميلاد 18 ديسمبر 1890(1890-12-18)مدينة نيويورك الوفاة 31 يناير 1954 (63 سنة)مدينة نيويورك سبب الوفاة سقوط  مواطنة الولايات المتحدة  الحياة العملية المدرسة الأم جامعة كولومبيا المهنة مهندس كهربائي،  ومخترع، &...

 

نهائي دوري أبطال أوروبا 2012الحدثدوري أبطال أوروبا 2011-12 بايرن ميونخ تشيلسي 1 1 فاز تشيلسي 4–3 بركلات الترجيحالتاريخ19 مايو 2012الملعبأليانز أرينا، ميونخيويفا رجل المباراةديدييه دروغباالحكمبيدرو بروينسا(البرتغال)الحضور62,500[1]الطقسغائم جزئيًا20 °م (68 °ف)38% الرطوبة → 2011 2...

 

PavlosRaja Pavlos pada 1939Raja HellenesBerkuasa1 April 1947 – 6 Maret 1964PendahuluGeorge IIPenerusKonstantinus IIPerdana MenteriLihat daftarInformasi pribadiKelahiran(1901-12-14)14 Desember 1901Athena, YunaniKematian6 Maret 1964(1964-03-06) (umur 62)Athena, YunaniPemakaman12 Maret 1964Pemakaman Kerajaan, Istana Tatoi, YunaniWangsaWangsa Schleswig-Holstein-Sonderburg-GlücksburgAyahKonstantinus I dari YunaniIbuSophia dari PrusiaPasanganFrederica dari HannoverAnakRatu Sofía dari ...

دوري نجوم قطر الموسم 2009-10 البلد قطر  المنظم الاتحاد الآسيوي لكرة القدم  النسخة 37  عدد الفرق 12   الفائز الغرافة الوصيف نادي الغرافة  الفرق الهابطة الشمال عدد المباريات 132   2008-09 2010-11 تعديل مصدري - تعديل   دوري نجوم قطر 2009-10 هو النسخة 37 من دوري نجوم قطر. توسعة الب...

 

Exercise in rhetoric The Latin poet Ovid enjoyed his suasoria. Suasoria is an exercise in rhetoric: a form of declamation in which the student makes a speech which is the soliloquy of an historical figure debating how to proceed at a critical junction in his life.[1] As an academic exercise, the speech is delivered as if in court against an adversary and was based on the Roman rhetorical doctrine and practice.[2] The ancient Roman orator Quintilian said that suasoria may call ...

 

Henrietta SzoldLahir(1860-12-21)21 Desember 1860Baltimore, Maryland, Amerika SerikatMeninggal13 Februari 1945(1945-02-13) (umur 84)Yerusalem, Mandat PalestinaDikenal atasPendiri Hadassah, the Women's Zionist Organization of America Perangko Henrietta Szold Henrietta Szold (/zoʊld/ zohld, bahasa Hungaria: [ˈsold]; 21 Desember 1860 – 13 Februari 1945) adalah seorang pemimpin Zionis Yahudi Amerika Serikat dan pendiri Hadassah, the Women's Zionist Organization of Amer...

Serie D 1961-1962 Competizione Serie D Sport Calcio Edizione 3ª Organizzatore Lega Semiprofessionisti Luogo  Italia Partecipanti 108 Formula 6 gironi all'italiana Risultati Promozioni Rapallo Ruentes, Rizzoli;CRDA Monfalcone, Solvay Rosignano;Trani, Avellino. Retrocessioni (le squadre scritte in corsivo sono poi state riammesse)Sammargheritese, Aosta;Sestrese, Audace SME;Leffe, Falck Vobarno;Miranese, Vigor Senigallia;Schio, Carbonia;Fondana, Piombino;Casarano, Martina;Ortona, Bagheria...

 

American judge (born 1944) Alvin Anthony SchallSchall in 2011Senior Judge of the United States Court of Appeals for the Federal CircuitIncumbentAssumed office October 5, 2009Judge of the United States Court of Appeals for the Federal CircuitIn officeAugust 17, 1992 – October 5, 2009Appointed byGeorge H. W. BushPreceded byEdward Samuel SmithSucceeded byKathleen M. O'Malley Personal detailsBornAlvin Anthony Schall (1944-04-04) April 4, 1944 (age 80)New York City, New YorkEdu...

 

Election in Arkansas Main article: 1964 United States presidential election 1964 United States presidential election in Arkansas ← 1960 November 3, 1964 1968 →   Nominee Lyndon B. Johnson Barry Goldwater Party Democratic Republican Home state Texas Arizona Running mate Hubert Humphrey William E. Miller Electoral vote 6 0 Popular vote 314,197 243,264 Percentage 56.1% 43.4% County Results Johnson   40-50%   50-60%   60...

谢赫·穆吉布·拉赫曼Sheikh Mujibur Rahmanশেখ মুজিবুর রহমান第1任孟加拉總統任期1971年4月11日—1972年1月12日总理塔杰丁·艾哈迈德前任首任继任Nazrul Islam (Acting)任期1975年1月25日—1975年8月15日总理Muhammad Mansur Ali前任Mohammad Mohammadullah继任孔达卡尔·穆什塔克·艾哈迈德第2任孟加拉總理任期1972年1月12日—1972年1月24日总统阿布·赛义德·乔杜里Mohammad Mohammadullah前任Tajud...

 

Town in Western AustraliaEneabbaWestern AustraliaEneabba Sands Tavern, 2014.EneabbaCoordinates29°49′09″S 115°16′09″E / 29.81917°S 115.26917°E / -29.81917; 115.26917Population142 (SAL 2021)[1]Established1961Postcode(s)6518Elevation99 m (325 ft)Area1,407.6 km2 (543.5 sq mi)Location 282 km (175 mi) N of Perth 31 km (19 mi) ENE of Leeman 70 km (43 mi) SE of Dongara LGA(s)Shire of CarnamahState elec...

 

2001 single by Snoop Dogg featuring Master P, Nate Dogg, Butch Cassidy, and Tha Eastsidaz This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Lay Low Snoop Dogg song – news · newspapers · books · scholar · JSTOR (September 2014) (Learn how and when to remove this message) Lay LowSingle by Snoop Dogg featuri...

Speech by US president John F. Kennedy January 30, 1961, State of the Union AddressDateJanuary 30, 1961 (1961-01-30)Duration43 minutes[1]VenueHouse Chamber, United States CapitolLocationWashington, D.C.Coordinates38°53′23″N 77°00′32″W / 38.88972°N 77.00889°W / 38.88972; -77.00889TypeState of the Union AddressParticipantsJohn F. KennedyLyndon B. JohnsonSam RayburnPreviousJanuary 12, 1961, State of the Union AddressNext1962 State of the...

 

Les conjointes des souverains de Monaco ont toutes porté le titre de leur époux, dame lorsque celui-ci était seigneur, princesse lorsque celui-ci était prince. Seuls deux hommes ont acquis le statut de prince par mariage, et sont devenus de fait princes de plein droit. Il n'apparaissent donc pas dans cette liste. Il s'agissait de : Lamberto Grimaldi (1420-1494), d'abord fiancé à sa lointaine cousine Claudine de Monaco (1451-1515) et désigné comme héritier, puis devenu seigneur s...

 

La Nouvelle-Calédonie a obtenu ses premiers représentants parlementaires en 1945 après son accession au statut de Territoire d'outre-mer. Elle a alors un seul député (qui représente aussi les citoyens français des Nouvelles-Hébrides dans une circonscription unique), puis est divisée en deux circonscriptions en 1978 : la 1re est la circonscription Est (la côte Est de la Grande-Terre, les Îles Loyauté et les citoyens français des Nouvelles-Hébrides avant leur indépendance po...

Para anggota Diplomatik Jepang Pertama ke Eropa, pada 1862, mengelilingi Shibata Sadataro, kepala staff misi tersebut (sedang duduk). Para anggota Diplomatik Jepang sedang berkunjung ke Pameran Internasional 1862 di London, dari Illustrated London News. Anggota senior diplomatik tersebut. Para anggota diplomatik di Utrecht. Kedua dari kiri adalah Fukuzawa Yukichi. Perwakilan Diplomatik Jepang Pertama ke Eropa (Jepang:第1回遣欧使節, juga 開市開港延期交渉使節団) dikirim ke Er...

 

魔法ワールド > ハリー・ポッター (映画シリーズ) > ハリー・ポッターと炎のゴブレット (映画) ハリー・ポッターと炎のゴブレット Harry Potter And The Goblet Of Fire監督 マイク・ニューウェル脚本 スティーブ・クローブス原作 J・K・ローリング製作 デヴィッド・ハイマン製作総指揮 デヴィッド・バロンターニャ・セガーチェン出演者 ダニエル・ラドクリフルパー�...

 

Disambiguazione – Se stai cercando il singolo dei Kraftwerk, vedi Expo 2000 (singolo). Expo 2000Esposizione universaleThe 2000 Hanover’s World ExpositionLogo Stato Germania CittàHannover TemaUmanità, Natura, Tecnologia Periododal 1º giugnoal 31 ottobre Partecipanti155 Paesi18 organizzazioni Visitatori18 milioni Area160 ha Riconoscimento7 dicembre 1994 Cronologia PrecedenteSuccessiva Expo '98Expo 2005 Lisbona Prefettura di Aichi   Manuale L'Expo 2000 (ufficialmente (EN) The 2...

This template does not require a rating on Wikipedia's content assessment scale.It is of interest to the following WikiProjects:Germany: Transport Germany portalThis template is within the scope of WikiProject Germany, a collaborative effort to improve the coverage of Germany on Wikipedia. If you would like to participate, please visit the project page, where you can join the discussion and see a list of open tasks.GermanyWikipedia:WikiProject GermanyTemplate:WikiProject GermanyGermany articl...

 

Play by Aaron Sorkin This article is missing information about a plot summary. Please expand the article to include this information. Further details may exist on the talk page. (May 2021) To Kill a MockingbirdPromotional Playbill cover of the original Broadway productionWritten byAaron SorkinBased onTo Kill a Mockingbirdby Harper LeeDate premieredDecember 13, 2018 (2018-12-13)Place premieredShubert Theatre, New York CityGenreDramaSettingMaycomb, Alabama To Kill a Mockingbird i...