MP3 (エムピースリー、英 : MPEG-1 Audio Layer-3 )は、音響データを圧縮 する技術の1つであり、それから作られる音声ファイルフォーマット でもある。ファイルの拡張子 は「.mp3 」である。
概要
本フォーマットでは、1411.2 kbps で収録されている音楽CD 規格のPCM などを、後述する範囲内で任意のビットレート ・サンプリング周波数 等を設定し、圧縮することができる。
狭義のMP3は、ビデオ圧縮規格であるMPEG-1 のオーディオ規格として開発された。非可逆圧縮であり、それ以前の規格であるMP1およびMP2を改良したものにあたる。当初は「MPEG-1 Audio Layer-3 」の略称だったが、のちに互換性 を持つ「MPEG-2 AudioBC (MPEG-2 Audio Layer-3) 」が加わったので、合わせて「MPEG-1/2 Audio Layer-3 」とすることもある。更に、非公式規格の「MPEG-2.5 Audio Layer-3 」を含む場合もある。なお、MPEG-1 Audio Layer-3の仕様はISO 11172-3 (JIS X 4323、ただし2011年1月20日に廃止) で規格化されている。規格書は有料であり、それゆえインターネット上では詳細な仕様は公開されていない。
MP1 (MPEG-1 Audio Layer-1) 、MP2 (MPEG-1 Audio Layer-2) は前身規格でありMP3との互換性はない。
また、MP3とMP4 の名称が類似していることからMP4が同類のAudio Layer-4と誤解されるケースが見受けられるが、MP4はあくまでMPEG-4 の関連規格であり、直接の関連性はない規格である。また逆にMP3がMPEG-3の略称であるとされるケースもあるが、MPEG-3は策定段階でMPEG-2 規格に吸収されているため存在せず、これも同様に誤解である。
「MP3」という語は「データ圧縮の規格やそれに基づいて作成されたファイルのフォーマット 」を指すが、店頭広告で「MP3が安い」などの表現が使われるために、MP3が携帯型デジタルオーディオプレーヤー そのものであると誤認されることもある。
特徴・歴史
MP3圧縮アルゴリズム は1991年 12月 、ドイツ のフラウンホーファー IIS(集積回路 研究所)で発明された。
これは1970年代後半、フラウンホーファー の「電話回線で音楽信号を送信する」というアイデアを実現させたものである。
1995年、フラウンホーファー はMPEGレイヤー3のファイル拡張子を「.mp3 」と命名。[ 1] その特許権収入は2005年 時点で約1億ユーロ に上る。
MP3は、音声の周波数帯域では極端な声質の劣化を伴わずに圧縮でき[ 注 1] 、音声をデジタル化するために用いられた。後に音楽をCD などの音源媒体からパーソナルコンピュータ (PC) のハードディスクドライブ (HDD ) に取り込む用途で広く普及した。
MP3は音の聞こえ易さの違い(周波数ごとの最小可聴値 )や大きな音が鳴った際に、その直前直後や近い周波数の小さな音が聞こえにくくなる現象(時間/周波数マスキング)等の人間の聴覚心理を利用した圧縮を行うため、エンコーダの実装 (聴覚心理モデルの調整)次第で圧縮後の再生品質は大きく変化する。
音楽用途の評価が高まると、MP3に対応する携帯型音楽プレーヤー が現われ、これらはMP3プレーヤー と呼ばれている。大容量のHDDを内蔵したプレーヤーなら1万曲以上の楽曲が収録可能であり、MP3による音楽ファイルをCD-RやDVD-Rなどに書き込むなら数百曲や数千曲が収まり、対応しているCD/DVDプレーヤーなどで再生可能である。
ボイスレコーダーでも、三洋電機 など以前からMP3形式での録音可能な機種が発売されていたメーカー以外にも、今まで独自規格を採用していたパナソニック やソニー 製のボイスレコーダーでも、汎用性等の観点からMP3形式での録音可能な機種が出始めている。
圧縮したデータはサイズの減少から取り回しが容易となるため、通信回線上で転送することも容易となり、インターネットラジオ などで広く用いられる一方、著作権 者が再配布を認めていない楽曲の不正配布に用いられることもある。これに対し「MP3にデジタル著作権管理 機能が付いていないためだ」という主張などがある。最近[いつ? ] の音楽携帯 にはこのような事態を防ぐべく、いわゆる著作権保護に対応するためのmp3としてセキュアmp3 を採用している企業もある。
MP3が広く普及した要因として、無料 のエンコーダ ・デコーダ ソフトウェアが入手可能な点が挙げられる。1998年 以降にはドイツ のフラウンホーファー協会 とフランス のトムソン社 がライセンス の保有を主張しているが、自由ソフトウェアライセンス で提供されているLAME などの無料のエンコーダやWindows Media Player などの無料の再生ソフトウェアが入手できたため、普及を妨げることはなかった。Windows においては1999年 11月 にリリースされたWindows Media Player 6.4でMP3が標準対応になり、爆発的に普及することになった。
MP3の後継規格としては、後発の標準規格「AAC 」が「iTunes 」・「mora 」・「iPod 」・「着うた 」などで用いられている。また同様にMP3の代替を目的とした後発規格としてマイクロソフト が開発した「WMA 」や、特許の制約を受けない完全にフリーなコーデックとして開発された「Vorbis 」、可逆圧縮コーデックとして開発された「FLAC 」、ソニー が開発した「ATRAC 」などがある[ 注 2] 。
なお、WMAやATRAC については、デジタル著作権管理 の機能が備わっているために、ネット上での音楽配信サービスを行う事業者が採用する傾向がある。また、FLACは可逆圧縮のほか、ハイレゾ 級のサンプリング周波数(主に96kHz、192kHz)・量子化ビット数(主に24bit)を用いた超高音質の音楽配信などが可能などという利点から採用される機会が広がりつつある。
2017年 4月23日 、フラウンホーファーIISおよびテクニカラー(旧トムソン)によるMP3ライセンスプログラムが、基本特許の存続期間満了により終了した[ 2] [ 3] 。これにより、これら特許がカバーしてきたMP3の基本技術はパブリックドメイン となった。
仕様
項目
規定
アルゴリズム
サンプリング周波数
32 kHz, 44.1 kHz, 48 kHz (MPEG-1 Audio Layer-3)
16 kHz, 22.05 kHz, 24 kHz (MPEG-2 Audio Layer-3)
8 kHz, 11.025 kHz, 12 kHz (MPEG-2.5 Audio Layer-3)
入力サンプリング精度
制限なし
チャンネル数
ビットレート
32 kbps, 40 kbps, 48 kbps, 56 kbps, 64 kbps, 80 kbps, 96 kbps, 112 kbps, 128 kbps, 160 kbps, 192 kbps, 224 kbps, 256 kbps, 320 kbps (MPEG-1 Audio Layer-3)
8 kbps, 16 kbps, 24 kbps, 32 kbps, 40 kbps, 48 kbps, 56 kbps, 64 kbps, 80 kbps, 96 kbps, 112 kbps, 128 kbps, 144 kbps, 160 kbps (MPEG-2/2.5 Audio Layer-3)
チャンネルカップリング
和差(ミッドサイド)ステレオ
共包絡(インテンシティ)ステレオ
ビットレート制限
最小32 kbps、最大320 kbps (MPEG-1 Audio Layer-3)
最小8 kbps、最大160 kbps (MPEG-2/2.5 Audio Layer-3)
MIME Type
audio/mpeg
[ 4]
audio/MPA
[ 5]
audio/mpa-robust
[ 6]
独自拡張として、以下を用いるソフトウェアも存在する
audio/mp3
audio/mpg
audio/x-mp3
audio/x-mpeg
audio/x-mpg
x-audio/mp3
x-audio/mpeg
x-audio/mpg
ストリーミング
未対応
チェックサム
オプション
コピーガード
未対応
タグ情報
ID3タグ (ID3v1, ID3v2)
コンテナ対応
ギャップレス再生
未対応(要MP3 Info (LAME Tag) フレーム対応エンコーダ・プレイヤー)
ローパスフィルター (LPF)
16 kHz LPF処理
MP3では比較的低ビットレートでのエンコード時に16 kHz付近でLPFを掛けるエンコーダが多い。これはフォーマット上の制約から高周波 成分の記録には多くのデータ量を必要とするため、全体の品質を保つためにはビットレートを大きく上げなければならなくなるからである[ 7] 。
LPFを外せばスペクトログラム 上での見かけは周波数特性 が良くなったように見えるが、聴覚上の品質は低下している事が多い。カットオフ周波数 を低くすると、特にビットレートの低い場合で聴覚上の音質が向上する。高ビットレートでのエンコードでは高周波成分の記録にゆとりが出てくるので、ビットレートに応じてLPFのカットオフ周波数を変えるエンコーダがほとんどである。
メタデータ
メタデータはファイルに楽曲情報などを持たせる規格で、ID3タグ やXing などが存在する。
ID3
ID3には、ファイルの末尾に付加されるID3v1と、ファイルの先頭に付加されるID3v2が存在する。
なお、ID3v1とID3v2の両方をファイルに埋め込んでもよい[ 8] 。
Xing
MP3のデータ情報を持たせる規格。可変ビットレート (VBR )のファイルの再生時間を算出する為に用いられる事が多いことからVBRタグ とも呼ばれる。
関連技術
MPEG-2にもAudio Layer-3が存在し、同様にMP3と呼ばれるが、規格上ではMPEG-2 AudioBC (backward compatible ) が正式である。この規格では圧縮方式は同じだが、ビットレートの低いメディアのための高圧縮率対応やマルチチャンネル対応がなされている。この形式はヨーロッパ 向けのDVD で採用されている。
MPEG-1/2 Audio Layer-1
通称「MP1 」と呼ばれ、拡張子は「.mpa 」か「.mp1 」。
PCMデータの周波数帯域を帯域分割フィルタを用いて32個のサブバンドに分け、聴覚心理モデルに基づいてサブバンド毎に量子化する。各サブバンドはさらなる帯域分割細分化が行われない(MDCTは使わない)。また、ハフマン符号化による可逆圧縮も行われない。そのためビットレートがかなり高く、約1/4にしか圧縮できないが、エンコードが非常に速い。PASC としてデジタルコンパクトカセット (以下DCC)で採用されている。基本ビットレートは320 kbps(DCCでは384 kbps)。
MPEG-1/2 Audio Layer-2
通称「MP2 」と呼ばれるMP3の前身規格。拡張子は「.mp2 」か「.mpc 」。比較的普及率の高い音声圧縮フォーマット。
Video-CD やCSデジタル放送 (日本 国内ではスカパー! )をはじめ、D-VHS 、DVD-Video 、Blu-ray まで採用され、殆どの規格の基本フォーマットとして使われている。圧縮アルゴリズムはMP1とほぼ同様であり、MDCTを用いた各サブバンドごとのさらなる帯域分割細分化は行われないし、ハフマン符号化による可逆圧縮も行われない。圧縮効率はMP1より高まっているが、約1/7程度に留まっている。基本ビットレートは特に規定は無いがVideo-CDに使われている224 kbps、または256 kbpsが標準として用いられる場合が多い。
MPEG-2 Audio Layer-3
通常はMPEG-2 AudioBCと呼ばれることが多い。サンプリング周波数の低いMP3に使われる規格で、主に24 kHz と22.05 kHz、16 kHzで扱われる。他はMPEG-1 Audio Layer-3と変わらない。他にもMPEG-2.5が存在している。
なお24 kHz 以下のサンプリング周波数 のものはすべてこれと見なせる為、Windows のWAVに標準で使えるMPEG Layer-3 コーデック がこれとなる。
MPEG-1 Audio Layer-4
ここで言うMP4は、一般的に言われるMP4 とはまったく別である。
MP3からの派生品にMP4 (MPEG-1 Audio Layer-4) がある。これは圧縮技術ではなく著作権保護 を目的とした規格として開発され、音声部分の技術はMP3と変わらなかった[ 9] 。
利便性が悪く、更にMP3プレイヤー などでは再生できないという互換性の問題も生じている。その後、MP3よりも高圧縮、高音質で著作権保護を謳う「WMA」や「AAC」などの登場により、またコンテナ形式の一種であるMP4コンテナ (MPEG-4 Part 14) の登場により普及どころか殆どその名を残さずに終ってしまっている。
mp3PRO
2001年 に発表された、MP3をベースに圧縮率を向上させた規格。ほとんど普及していない。
MP3 Surround
MP3を最大5.1チャンネルに拡張したサラウンド 音声フォーマット。2004年発表。ほとんど普及していない。
mp3HD
2009年にトムソン社が発表した可逆圧縮 音声フォーマット。他のロスレスフォーマット(FLAC、Apple Lossless、WMA Lossless等)と同程度の圧縮率(概ね50パーセント)で可逆圧縮を行う。従来のMP3のストリームも格納されるため、非対応の機器やソフトウェアでもMP3部分が再生可能[ 10] 。ほとんど普及していない。
特許と代替技術
最初は無圧縮のWAVEファイルである。次に48 kbpsのVorbisで、最後は
LAME でエンコードされた48 kbps MP3である。
mp3PRO 、AAC 、MP2 はMP3とほぼ同じような音響心理学モデル を利用している。フラウンホーファー がこれらのフォーマットの多くの基本特許 を持っており、ドルビー 、ソニー 、Thomson Consumer Electronics 、AT&T も同様である。他にオープンソースの圧縮フォーマットであるOpus 、Vorbis があり、フリーで特許の制約がない。新しい音声圧縮フォーマットの一種であるAAC、WMA Pro、VorbisはMP3エンコーダーにあるようなMP3フォーマット固有の制限に縛られない[ 11] 。
フラウンホーファーは2017年4月23日、MP3に関する各種特許の保護期間が終了したと発表し[ 12] 、アメリカの公共ラジオ局ナショナル・パブリック・ラジオ が同年5月11日に、フラウンホーファーが所有するmp3技術のライセンス販売のライセンス期限が4月23日に終了した旨を報じている[ 13] 。
非可逆圧縮フォーマットのほかに可逆圧縮コーデック がMP3の意義深い代替になりうる。可逆圧縮は音声の中身を変えないが容量は非可逆圧縮よりも増大する。可逆圧縮にはFLAC やApple Lossless などがある。
脚注
注釈
出典
関連作品
関連項目