Сжатие аудиоданных

Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.

Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а, соответственно, методы сокращения психоакустической избыточности — сжатием с потерями.

История

В грамзаписи

Вопрос повышения плотности аудиозаписи встал практически сразу же после появления звукозаписи как таковой. В эпоху механической грамзаписи для этой цели старались укладывать на поверхность пластинки звуковую дорожку как можно более плотно. Для этих целей необходимо было либо снижать качество записи, уменьшая динамический и частотный диапазон, что практиковалось, например, при записи речи (аудиоспектакли, лекции, пластинки для озвучивания диафильмов). Однако в 1930-х годах, при переходе на виниловые пластинки был предложен иной способ, основанный на независимом ограничении трех составляющих закона движения резца при записи и иглы при воспроизведении: колебательного смещения, колебательной скорости и колебательного ускорения. На низких частотах колебательные скорости и ускорения малы и наибольшую роль в передаче сигнала играет колебательное смещение. На средних частотах смещение уже не может достигать больших величин и наибольшую роль в передаче сигнала начинает играть скорость. На высших частотах эта роль переходит к ускорению. Вот эта особенность механической звукозаписи и была использована для эффективного сжатия аудиоинформации. При записи звуковой сигнал подвергается предыскажениям, таким образом, чтобы максимально использовать возможности отводимой ширины звуковой дорожки (которая ограничивает смещение), радиуса её кривизны (которая ограничивает скорость) и прочности материала пластинки (которая ограничивает ускорение). Наиболее популярной и, позже, стандартизированной стала кривая предыскажений RIAA. Сжатие аудиозаписи на грампластинках, по своей сути, является оптимизацией функции спектральной плотности.

В магнитной записи

Как и в случае с грамзаписью, повышение плотности магнитной записи было связано с оптимизацией функции спектральной плотности сигнала, в соответствии с физическими ограничениями, создаваемыми системой магнитная головка — магнитная лента. Важной характеристикой, влияющей на качество магнитной записи является ширина немагнитного зазора головки. Чем она меньше, тем более широкий диапазон частот может быть записан, но уровень сигнала, особенно в области низких частот, при этом снижается, а нелинейные искажения возрастают. Наоборот, чем шире зазор, тем сильнее сверху будет ограничен частотный диапазон, но уровень сигнала будет выше, а нелинейные искажения — ниже. Для преодоления этого противоречия канал записи магнитофона содержит фильтры предыскажений. Дело в том, что на низких частотах сигнал ограничивается магнитным насыщением, на средних частотах — коэрцитивной силой, а на высоких — полем рассеяния головки. Поэтому фильтр предыскажений на нижних частотах заставляет работать усилитель записи в режиме источника тока, тем самым ограничивая величину намагниченности. На средних частотах происходит переход от режима источника тока в режим источника напряжения и наконец, на высших частотах усилитель записи работает в режиме источника напряжения. АЧХ фильтра предыскажений усилителя записи магнитофона напоминает кривую RIAA, но имеет иные значения частот полюсов, которые зависят от скорости движения ленты и её типа. В многоскоростных магнитофонах высокого класса были наборы переключаемых фильтров.

В радиотрансляции

Стремление снизить полосу частот, занимаемых в эфире вещательной радиостанцией, без ухудшения качества звучания привело к использованию сжатия аудиосигнала и в радиовещании. Однако поскольку системы вещания с амплитудной модуляцией в диапазонах длинных, средних и коротких волн были разработаны ещё в 1920-х — 1930-х годах, они остались не охваченными сжатием аудиосигнала и ограничение занимаемой в эфире полосы частот выполнялось просто за счет снижения качества вещания. А вот в диапазоне ультракоротких волн при передаче сигнала с частотной модуляцией, где ширина полосы частот определяется не шириной спектра исходного звукового сигнала, а его динамическим диапазоном была применена система «компрессор-эспандер», позволившая ограничить девиацию частоты значением в 75 кГц, обеспечив динамический диапазон 96 дБ.

В стереосистемах

В стереосистемах сжатие аудиосигнала основано на суммарно-разностном принципе и особенностях слуха человека. Дело в том, что в естественных условиях отсутствуют полностью разделенные источники звука для левого и правого уха. Поэтому нет необходимости в стереофонической звукозаписи создавать разницу между мгновенным значением звукового давления на левом и правом ухе более чем в 40 дБ. Поэтому в аналоговых аудиосистемах широко применялся способ «совмещенного стерео» (joint stereo), когда с высоким качеством записывался сигнал суммы каналов, а сигнал разности каналов записывался сжатый по амплитуде и ограниченный по частоте сигнал разности каналов. В воспроизводящем устройстве сигнал левого канала получался в виде суммы суммарного и разностного сигналов, а правого - в виде разности суммарного и разностного сигналов. Система совмещенного стерео применялась в грамзаписи и стереофоническом радиовещании.

Сжатие без потерь

Сокращение статистической избыточности основано на учёте свойств самих звуковых сигналов. Она определяется наличием корреляционной связи между соседними отсчетами цифрового звукового сигнала, устранение которой позволяет сокращать объём передаваемых данных на 15…25 % по сравнению с их исходной величиной. Для передачи сигнала необходимо получить более компактное его представление, что возможно осуществить с помощью ортогонального преобразования. Важными условиями применения такого метода преобразования являются:

  • возможность восстанавливать исходный сигнал без искажений
  • способность обеспечивать наибольшую концентрацию энергии в небольшом числе коэффициентов преобразования
  • быстрый вычислительный алгоритм

Этим требованиям отвечает модифицированное дискретно-косинусное преобразование (МДКП).

Уменьшить скорость цифрового потока позволяют методы кодирования, учитывающие статистику звуковых сигналов, например, вероятности появления уровней разной величины. Одним из таких методов является код Хаффмана, где наиболее вероятным значениям сигнала приписываются более короткие кодовые слова, а значения отсчетов, вероятность появления которых мала, кодируются кодовыми словами большей длины. Именно в силу этих двух причин в наиболее эффективных алгоритмах компрессии цифровых аудиоданных кодированию подвергаются не сами отсчеты звукового сигнала, а коэффициенты МДКП.

Подобные методы применяются при архивации файлов.

Сжатие с потерями

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определённых случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы:

  • частотное (одновременное) маскирование
  • временное (неодновременное) маскирование

Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного.

Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости (порог слышимости одного сигнала в присутствии другого), когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления послемаскировки (изменение порога слышимости после сигнала высокого уровня) и предмаскировки (изменение порога слышимости перед приходом сигнала максимального уровня). Более слабый сигнал становится неслышимым за 5 − 20 мс до включения сигнала маскирования и становится слышимым через 50 − 200 мс после его включения.

Наилучшим методом кодирования звука, учитывающим эффект маскирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая кадром, поступает на блок фильтров который разделяет сигнал на частотные поддиапазоны. На выходе каждого фильтра оказывается та часть входного сигнала, которая попадает в полосу пропускания данного фильтра. Далее, в каждой полосе с помощью психоакустической модели, анализируется спектральный состав сигнала и оценивается, какую часть сигнала следует передавать без сокращений, а какая лежит ниже порога маскирования и может быть переквантована на меньшее число бит. Для сокращения максимального динамического диапазона определяется максимальный отсчет в кадре и вычисляется масштабирующий множитель, который приводит этот отсчет к верхнему уровню квантования. Эта операция аналогична компандированию в аналоговом вещании. На этот же множитель умножаются и все остальные отсчеты. Масштабирующий множитель передается к декодеру вместе с кодированными данными для коррекции коэффициента передачи последнего. После масштабирования производится оценка порога маскирования и осуществляется перераспределение общего числа битов между всеми полосами.

Очевидно, что после устранения психоакустической избыточности звуковых сигналов их точное восстановления при декодировании оказывается уже невозможным. Методами устранения психофизической избыточности можно обеспечить сжатие цифровых аудиоданных в 10 − 12 раз без существенных потерь в качестве.

Структура кодера сжатия аудиоданных с потерями

Обобщенная структура кодера звукового сигнала с компрессией цифровых аудиоданных
  • Исходный цифровой звуковой сигнал разделяется на частотные поддиапазоны и сегментируется по времени в блоке временной и частотной сегментации.
  • Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется так называемая длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени. Решение об изменении длины кодируемой выборки принимает блок психоакустического анализа, вычисляя значение психоакустической энтропии сигнала.
  • После сегментации сигналы частотных поддиапазонов нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не сами отсчеты выборки звукового сигнала, а соответствующие им коэффициенты МДКП.
  • Учёт закономерностей слухового восприятия звукового сигнала выполняется в блоке психоакустического анализа. Здесь по специальной процедуре для каждого частотного поддиапазона рассчитывается максимально допустимый уровень искажений (шумов) квантования, при котором они ещё маскируются полезным сигналом данного поддиапазона.
  • Блок динамического распределения бит в соответствии с требованиями психоакустической модели для каждого поддиапазона кодирования выделяет такое минимально возможное их количество, при котором уровень искажений, вызванных квантованием, не превышал порога их слышимости, рассчитанного психоакустической моделью.
  • Также могут использоваться:
    • матрицирование стерео — сложение и вычитание левого и правого канала для устранения повторяющейся информации
    • специальные процедуры итерационных циклов, позволяющие управлять величиной энергии искажений квантования в поддиапазонах при недостаточном числе доступных для кодирования бит
    • процедуры линейного и обратного адаптивного предсказаний
    • техника сглаживания переходных шумов во временной области (Temporal Noise Shaping — TNS), позволяющая управлять микроструктурой искажений квантования внутри каждого поддиапазона кодирования

Многие другие приёмы могут послужить способом сократить объём данных звуковой информации. Даже простое сужение полосы частот сигнала вместе с уменьшением динамического диапазона может уже называться сжатием аудиоданных. Например, в стандарте сжатия звука в сотовой связи используется и то и другое. Стремясь удалить избыточность из звука, кодек при плохом качестве сигнала становится избирателен к определённым словам, упорно проглатывая их.

Субъективная оценка качества

Для сжатых аудиоданных существует субъективная оценка качества, оцениваемая как процент людей, почувствовавших разницу с оригиналом.

Соответствие битрейта кодека MP3 в режиме стерео и процента людей заметивших разницу с оригиналом
Приблизительное количество людей, услышавших разницу между оригинальной и сжатой записями, % Битрейт сжатой записи, кбит/сек
0…1 320
5…30 256
30…40 192
40…70 128

Следует учесть тот факт, что качество получившегося материала зависит от характера сжимаемых данных, от жанра, наличия фона, помех. После сжатия, например MP3, на средних битрейтах, слушатели отмечают оловянность перкуссионных. А на голосе сжатие (даже сильное) отражается мало.

См. также

Ссылки

Read other articles:

Hector-Irénée SévinKardinal, Uskup Agung LyonGerejaGereja Katolik RomaKeuskupan agungLyonTakhtaLyonPenunjukan2 Desember 1912Masa jabatan berakhir4 Mei 1916PendahuluPierre-Hector CoulliéPenerusLouis-Joseph MaurinJabatan lainKardinal-Imam Santissima Trinità al Monte Pincio (1914–16)ImamatTahbisan imam10 Juni 1876oleh Jean-Joseph MarchalTahbisan uskup5 April 1908oleh Louis-Henri-Joseph LuçonPelantikan kardinal25 Mei 1914oleh Paus Pius XPeringkatKardinal-ImamInformasi pribadiNam...

 

artikel ini perlu dirapikan agar memenuhi standar Wikipedia. Tidak ada alasan yang diberikan. Silakan kembangkan artikel ini semampu Anda. Merapikan artikel dapat dilakukan dengan wikifikasi atau membagi artikel ke paragraf-paragraf. Jika sudah dirapikan, silakan hapus templat ini. (Pelajari cara dan kapan saatnya untuk menghapus pesan templat ini) Artikel ini tidak memiliki referensi atau sumber tepercaya sehingga isinya tidak bisa dipastikan. Tolong bantu perbaiki artikel ini dengan menamba...

 

School in Changanassery, Kerala, IndiaSt. Berchmans Higher Secondary SchoolLocationChanganassery, KeralaIndiaCoordinates9°27′13″N 76°32′50″E / 9.45373°N 76.54723°E / 9.45373; 76.54723InformationOther nameSBHSSEstablished1891Grades5-12Websitehttps://www.sbhss.in/ St. Berchmans Higher Secondary School[1][2] is an aided school in the Kottayam district and it is one of the oldest Christian schools in Kerala. The Archdiocese of Changanassery runs...

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: 2006 Major League Baseball season – news · newspapers · books · scholar · JSTOR (April 2013) (Learn how and when to remove this template message) This article is about the 2006 Major League Baseball season only. For information on all of baseball, see 2006 in ...

 

For the aperture synthesis interferometer in the northeastern Netherlands, see Westerbork Synthesis Radio Telescope. Radio station in Gaylord, MichiganWSRTGaylord, MichiganBroadcast areaPetoskey, MichiganFrequency106.7 MHzBrandingStar Country 106.7ProgrammingFormatClassic countryOwnershipOwnerPatricia MacDonald Garber(MacDonald Garber Broadcasting, Inc.)Sister stationsWKLTHistoryFirst air date1972 (as WWRM)Former call signsWKPK (10/1/84-9/14/05)WWRM-FM (11/15/82-10/1/84)WWRM (1972-1982)Call s...

 

Peruvian University of Applied SciencesUniversidad Peruana de Ciencias AplicadasOther nameUPCMottoExígete. Innova. UPC.Motto in EnglishPush yourself. Be creative. UPC.TypePrivateEstablishedJanuary 5, 1994 (1994-01-05)FoundersGraciela Bancalari David FischmanAlfredo Miró QuesadaMariana RodríguezAffiliationLaureate International UniversitiesRectorDr. Edward Roekaert Embrechts[1]Academic staff3,336 (2017)Students82,228 (2021)Undergraduates64,767Postgraduates17,461...

Esta página cita fontes, mas que não cobrem todo o conteúdo. Ajude a inserir referências. Conteúdo não verificável pode ser removido.—Encontre fontes: ABW  • CAPES  • Google (N • L • A) (Abril de 2013) Um monumento em Berlim aos soldados poloneses e alemães anti-fascistas mortos Resistência alemã (Widerstand) foi a oposição de indivíduos e grupos organizados ao avanço e a consolidação do regime nazista entre 1933 ...

 

Traudl JungeJunge pada 1945LahirGertraud Humps(1920-03-16)16 Maret 1920Munich, Bavaria, GermanyMeninggal10 Februari 2002(2002-02-10) (umur 81)Munich, Bavaria, JermanSebab meninggalKankerKebangsaanJermanPekerjaanSekretaris, wartawan ilmiah sub-editorTempat kerjaAdolf HitlerDikenal atasSekretaris pribadi Adolf Hitler pada masa Perang Dunia KeduaSuami/istriHans Junge (terbunuh saat bertugas pada 1944)AnaknoneOrang tuaMax Humps and Hildegard Humps (née Zottmann)KerabatSaudari; Inge Hu...

 

Министерство природных ресурсов и экологии Российской Федерациисокращённо: Минприроды России Общая информация Страна  Россия Юрисдикция Россия Дата создания 12 мая 2008 Предшественники Министерство природных ресурсов Российской Федерации (1996—1998)Министерство охраны...

1538 battle during the Spanish conquest of the Muisca Battle of TocaremaPart of Spanish conquest of New GranadaMap of the Muisca ConfederationTocarema is at the border of Muisca & PancheDate19–20 August 1538LocationTocarema, Panche territory4°45′02″N 74°26′05″W / 4.75056°N 74.43472°W / 4.75056; -74.43472Result Spanish and Muisca victoryTerritorialchanges Panche partially submitted to Spanish colonial reignBelligerents Spanish conquistadorsZipazgo of t...

 

Hat manufacturer in Stockport, England Battersby's Hat Works as it appeared in 2009. Battersby Hats was the trading name of Battersby & Co, a hat manufacturer of Stockport, England. The firm once had a capacity of 12,000 hats per week but it declined in the second half of the twentieth century and merged with other hat manufacturers in 1966 before hat production ceased altogether in 1997. History Battersby's Hat Factory in Offerton, Stockport, first appeared on Ordnance Survey maps in 189...

 

SMA Negeri 31 JakartaInformasiDidirikan1978AkreditasiA+Kepala SekolahSiti Mukhlisoh,M.pdJumlah kelas10-12 kelas setiap tingkatJurusan atau peminatanBahasa, IPA dan IPSRentang kelasX, XI IPA, XI Bahasa, XI IPS, XII IPA, XII Bahasa, XII IPSKurikulumKurikulum 2013/Kurikulum MerdekaJumlah siswa±1.000 siswa (40 siswa per kelas)StatusReguler‎NEM terendah9,000(2010)NEM tertinggi9,980(2010)AlamatLokasiJln. Kayumanis Timur No. 17. Utan Kayu Selatan, Matraman., Jakarta Timur, DKI Jaka...

Una possibile deformazione di una curva attorno alla sfera 2-dimensionale in un punto. In topologia, uno spazio topologico è semplicemente connesso se è connesso per archi e il suo gruppo fondamentale è il gruppo banale, ovvero se ogni curva chiusa può essere deformata fino a ridursi a un singolo punto. Più intuitivamente, uno spazio topologico è semplicemente connesso se è fatto di un pezzo solo e non ha buchi. Esempi di spazi semplicemente connessi sono la palla (con o senza la parte...

 

Elections in Nevada Federal government U.S. President 1864 1868 1872 1876 1880 1884 1888 1892 1896 1900 1904 1908 1912 Dem GOP 1916 Dem GOP 1920 Dem GOP 1924 Dem GOP 1928 Dem GOP 1932 Dem GOP 1936 Dem GOP 1940 Dem GOP 1944 Dem GOP 1948 Dem GOP 1952 Dem GOP 1956 Dem GOP 1960 Dem GOP 1964 Dem GOP 1968 Dem GOP 1972 Dem GOP 1976 Dem GOP 1980 Dem GOP 1984 Dem GOP 1988 Dem GOP 1992 Dem GOP 1996 Dem GOP 2000 Dem GOP 2004 Dem GOP 2008 Dem GOP 2012 Dem GOP 2016 Dem GOP 2020 Dem GOP 2024 Dem GOP U.S. ...

 

Comic book character For other uses, see Archie Andrews (disambiguation). Fictional character Archie AndrewsArchie Comics characterFirst appearancePep Comics #22 (December 1941)Created byJohn L. GoldwaterBob MontanaVic BloomVoiced byCharles Mullen (1943–1944)Jack Grimes (1944)Burt Boyar (1945)Bob Hastings (1945–1953)Dallas McKennon (1968–1976)J Michael Roncetti (1987)Andrew Rannells (1999–2002)Portrayed byKJ Apa (2017–2023)Christopher Rich (1990)Brock Brown (Riverdale; young)Agastya...

Arabic female royal title For other uses, see Sultana (disambiguation). Part of a series onImperial, royal, noble, gentry and chivalric ranks in West, Central, South Asia and North Africa Emperor: Caliph Shahanshah King of Kings Padishah Banbishn Sultan of Sultans Chakravarti Samrat Maharajadhiraja Khagan King: Maharaja Malik Sultan Sultana Shah Shahbanu Shirvanshah Khan Khatun Hatun Dey Nizam Nawab Amir al-umara Khagan Bek Prince or Duke: Emir Sheikh Raja Rana Ikhshid Beylerbey Pasha Babu Sa...

 

Accumulation of rainwater for reuse Basic configuration of domestic rainwater harvesting system in Uganda.[1] Rainwater harvesting (RWH) is the collection and storage of rain, rather than allowing it to run off. Rainwater is collected from a roof like surface and redirected to a tank, cistern, deep pit (well, shaft, or borehole), aquifer, or a reservoir with percolation, so that it seeps down and restores the ground water. Rainwater harvesting differs from stormwater harvesting as the...

 

American archaeologist and linguist (1885–1967) John Alden MasonJohn Alden MasonBornJanuary 14, 1885Orland, Indiana, U.S.DiedNovember 7, 1967 (aged 82)Bryn Mawr Hospital, Bryn Mawr, Pennsylvania, U.S.NationalityAmericanOccupation(s)Linguist and anthropologistAcademic workMain interestsIndigenous languages of the Americas John Alden Mason (January 14, 1885 – November 7, 1967) was an American archaeological anthropologist and linguist. Mason was born in Orland, Indiana, but grew up in Phila...

Paul Painlevé Presidente del Consejo de Ministrosde la República francesa 12 de septiembre-16 de noviembre de 1917Presidente Raymond PoincaréPredecesor Alexandre RibotSucesor Georges Clemenceau 17 de abril-28 de noviembre de 1925Presidente Gaston DoumerguePredecesor Édouard HerriotSucesor Aristide Briand Información personalNacimiento 5 de diciembre de 1863París, FranciaFallecimiento 29 de octubre de 1933 (69 años)París, FranciaSepultura Panteón de París y Cementerio de Montpar...

 

Pour les articles homonymes, voir Bibliothèque royale et Bibliothèque nationale. Bibliothèque royale Entrée de la bibliothèque Présentation Coordonnées 59° 20′ 17″ nord, 18° 04′ 19,75″ est Pays Suède Ville Stockholm Informations Site web http://www.kb.se Bibliothèque royale Géolocalisation sur la carte : Suède Bibliothèque royale modifier  Kungliga biblioteket La Bibliothèque royale (en suédois : Kungliga biblioteket) (KB) ...