mp3

Материал из Lurkmore

(Перенаправлено с Мп3)
Перейти к: навигация, поиск
Drama.pngZOMG TEH DRAMA!!!11
Обсуждение этой статьи неиллюзорно доставляет не хуже самой статьи. Рекомендуем ознакомиться и причаститься, а то и поучаствовать, иначе впечатление будет неполным.
UnLurkomoring.PNGЭту статью или раздел следует развикифицировать.
Эта статья выглядит как или даже является копипастой из википедии. Здесь полностью отсутствуют лулзы, описание драм и прочие ништяки, зато присутствуют нейтральная точка зрения™ и унылая спискота, или в ней много узкоспециализированной информации сомнительной ценности и энциклопедических терминов. Необходимо срочно привести статью в удобоваримый вид, пока не случилось страшное.

mp3 (устар. MPEG 1 Layer III, быдл. Эм Эр Зэ) — формат сжатия звука, в своё время запиленный арийскими учеными в институте Фраунгофера.

Кто не знает может попробовать догадаться, как в этом формате сжатия звука должна расшифровываться аббревиатура «mp». Правильный ответ — «двигающаяся картинка».

Сегодня является безоговорочным королём форматов сжатия звука с потерей качества («lossy»). Битрейт 320 (kbps; максимальное качество в пределах мп3) некоторых и сейчас устраивает больше, чем занимающий на диске в три раза больше места файл в лосслесс-формате сжатия. Соотношение объективности и инвалидности в утверждении «Ведь качество не отличается» — это отдельный повод для вялых холиваров. А в обсуждениях любых наушников (или звуковух, или усилков…) среднего и верхнего ценового сегмента популярным, но литературным способом обосрать продукт является снисходительное «ну, эмпэтри на этом слушать, конечно, можно».

Содержание

Кто не любит mp3

И без учёта случая ненависти за компанию («мой брат сказал, что mp3 гавно, а wma руль»), существуют следующие примеры господ, граждан и товарищей, горящих нелюбовью, с морем разнообразных на то причин.

  • Копирасты — за распространённость. Одним из признаков победной поступи формата исторически стал вал сайтов, на которых любой мог качать музыку. Профит генерировался и уходил при этом сайту через просмотры баннеров, клики, переходы, подцепленные вирусы, пожертвования, ЧСВ. А дядя-правообладатель на суде потом говорит, что так к нему в магазин пришёл один человек, из покупки которого сделан материал для сайта, а могли прийти 175 тысяч, которые показывает счётчик скачиваний с сайта; на эту разницу он и подаёт иск. Потом пошли торренты и айтюнсы, путающие карты морализаторам, но страдания и жгучее желание отмщения (ради профита-то) можно и сымитировать.
  • Аудиофилы — за низкое качество звучания и срез частот выше 17 кГц. Хотя эти товарищи даже разницу между побитными копиями файлов "слышат" и как правило люто лажают в слепом тесте.
    • Аудиофилы и меломаны -- за возможность оказаться слишком ужатым, ага. Если обычному человеку будет похуй, с его наушниками-„затычками“ или китайскими колонками «SVEN» или «Genius», то более искушённый слушатель, с нормальными ушами за 9000 и более-менее хорошей техникой, разницу таки слышит (а именно — если сабж был пережат в 64кб/сек)[1].
      • Ещё одна причина не любить mp3 аудиофилам заключается в том, что максимальное число каналов в этом вашем mp3... всего ДВА! Стерео! А если точнее, то joint stereo, которое кодируется с использованием суммы и разности сигналов левого и правого каналов, что тоже ведет к неизбежной потере звуковой информации. Имея колонки от 5.1, аудиофил от звука в два канала получить оргазм не может.
  • Кровавая гэбня — за распространённость. Востребованность таких форматов толкнула вперёд технологии гаджетов (сейчас сабжевый формат, пожалуй, не понимают только микроволновки и стиральные машины), и теперь у каждого плебея есть опасная игрушка «гаджет», которая может быть употреблена в целях дестабилизации режима (хоть обычным террористом, взрывающим аэропорты, хоть по-настоящему опасными мутителями рассудков). В части звука для применений по двойному назначению есть и более шустрые и эффективные специализированные кодеки типа AMR, AMR-WB и иже с ними, а также свободные Speex и Opus.
  • Линуксоиды — за распространённость и проприетарность кодека. Подавители свободы Патенты (а точнее — немецкий НИИ, в котором придумали сабж), своими когтями впившиеся в такую распространённую сущность, оскверняют публичное пространство и создают лишний гемор в обвесе дистрибутивов, от стремления к распространённости тоже не отказавшихся.

Собственно, о формате

Основан на идее «сделать из *.wav *.mid», а именно разбиения сигнала по частотам с помощью БПФ, то бишь кагбэ по нотам, и потом кодирование этих «нот». Это примерно как перевод растровой картинки в векторный вид с отбрасыванием незначительных деталей.

Для усиления эффективности сжатия выпиливаются самые «тихие» (по мнению разработчиков энкодера) «ноты», а также всего того, что ухо среднестатистического обывателя не в состоянии услышать.

Но есть и такие, кто слышит и обдает окружающих потоком негодования, противопоставляя mp3 lossless форматы, где всё остаётся на месте. Справедливости ради стоит заметить, что разработан также режим кодирования mp3HD, который по сути является lossless-сжатием, но в то же время совместимым с битстримом MP3 (правда, нужна поддержка VBR >320kbs).

К врождённым недостаткам формата относится плохое обращение с высокими частотами. Зависит качество обращения с высокими частотами в первую очередь от стереопанорамы, то есть от разницы между двумя стереоканалами, при нулевой разнице (псевдо-моно) лоу-пасс фильтра срежет что-либо зависимо от настроек, но всё, что останется, психоакустический кодер не попортит, либо зацепит минимально. При плавающей панораме около 90 градусов и насыщенности средними частотами есть высокие шансы, что высокие «хлюпать» будут и в битрейте 320. Школота особенно остро ощущает этот недостаток (конечно, если не убила слух громким звуком из наушников), так как с возрастом чувствительность к ним пропадает. ВЧ или звенят металлическим звоном или же как бы отсутствуют. Имеется также врождённый дефект кодека (гуглить sfb21), создающий принципиальную проблему с кодированием частот выше 16 кГц из CD аудио - их надо либо срезать, либо кодировать кривовато, либо раздувать битрейт. Это свойство мп3шного сжатия обычно используется для опознания качества источника записи. Кстати, эта проблема решена в формате-наследнике — AAC, да и вообще много где, но всем похуй. Если высокие частоты срезаны на частоте сильно выше 16 кГц, то, вероятно, перед нами звук качества CD-DA. В любом случае, взгляд на спектрограмму часто позволяет опознать якобы оригинал, сделанный из mp3, а для особо ленивых есть специальные программы.

На самом деле высокие частоты режутся специально, ибо при таких битрейтах они превращаются в кашу и лучше их просто отрезать. Плюс на несоответствующей аппаратуре их не услышать. AAC делает то же самое, но там зависит от используемого кодировщика. Если так нужны высокие частоты — есть lossless, или на крайний случай Ogg Vorbis, который стремится хоть как-то их сохранить.

Другие форматы

Существуют более эффективные способы сжимать музыку. AAC, (OGG)Vorbis/OPUS, MPC, WavPack. Однако по распространённости MP3 затыкает всех за пояс. Поэтому массы выбирают mp3, а аудиофилы негодуют. Впрочем, линуксоиды часто выбирают OGG, ибо свободный и сжимает аудио аккуратнее даже при учете меньшего битрейта у выходного файла. Так, OGG 96 kbit по качеству сравним с mp3 128-160 kbit.

Технология

Появление mp3 напрочь убило ранние системы звукозаписи. Наступление шло по двум фронтам:

  1. технологическому (больше записи в том же объеме данных, что позволило резко уменьшить носители или резко увеличить объем в минутах)
  2. коммерческому (меньший объем данных + развитие интернета сделали доступным невозбранное скачивание аудиофайлов).

Современные технологии позволили внедрить mp3 во всё, что угодно, вплоть до хлебопечек и холодильников. Mp3-плеер 21 века — это не только специальное устройство (клипса с проводком в наушники), но и свойство телефона, компьютера, КПК — просто так, в качестве приятного и почти бесплатного бонуса. Большинство продвинутых устройств, кроме проигрывания, умеет и записывать, что, естественно, вин.

Проблема в том, что записывать звук на твердотельную память теперь умеет всё, что угодно, кроме, собственно, диктофонов. То есть записывай что угодно, но говном. А нормальные цифровые диктофоны с чувствительностью кассетных нужно заказывать из Пиндостана. Впрочем, в последнее время появляются они и в этой стране.

Декодеры

Звучание декодеров разных плееров слабо отличается, так как большинство из них давно соответствуют стандарту, декодируя одинаково с точностью лучше шестнадцати бит, то есть услышать разницу не получится при всём желании. Когда всё только начиналось и процессоры в PC были послабее, некоторые разработчики следовали естественному желанию понизить точность арифметики при декодировании, что вызывало накопление ошибки в процессе. Сейчас такие трюки полностью утратили актуальность, и разница в звучании современных плееров, помимо зачастую очень существенных отличий в аналоговой части, объясняется только настройками, а не "качеством": настройками эквалайзеров, расширением стереобазы, динамической компрессией, живительным ревербом и прочими улучшайзерами, но не декодерами. В таких условиях, например, держаться за старые плееры под Windows смысла немного, потому что относительно новых они могут быть совсем уже не торт, как когда-то легендарный Apollo пруф.

Вообще можно покурить этот сайт http://mp3decoders.mp3-tech.org/decoders.html и не разводить на эту тему срачи более. Фанатам Winamp читать тут и радоваться.

Mp3 на фоне быдла и аудиофилов

Целевая аудитория

Прослушивание mp3 с мобильников через динамик является достаточным признаком для причисления пациента к сонму быдла, которое бывает нескольких видов, но чаще всего это либо объебосы, либо гопники. Mp3 в телефонах бессердечно вытравливает духовные скрепы давних традиций бряцать кассетными магнитофонами «Весна», изрыгавшими «Ласковый Май» или «Модерн Токинг» (сейчас бы на их месте были «весёленькие песни про тюрьму» или плейлист радио «Восток FM»). Предположительно, претензий к качеству звука на подобных сейншенах у аудитории не возникает. Им главное, чтобы заряда аккумулятора хватало надолго. Заряда аккумулятора хватает надолго.

Аудиофилы (от греческого «любители слушать») утверждают, причем небезосновательно (и вообще они скромные люди), что на хорошей акустике можно без проблем различить звучание mp3 и оригинального CD. Чтобы услышать отличия, требуется сразу несколько факторов из списка:

Ощущается как изменение деталей/стереопанорамы по сравнению с исходным CD. Как правило, начиная от 192 kbps и меньше. Многие найдут различия между оригинальным CD-звуком и пожатой мп3шкой, даже если пожато было с оригинального сиди и прямыми руками, а уж если с постоянным пережатием mp3-wav-mp3-wav-mp3-wav, и с битрейтом менее 160кбит/с — вообще «тушите свет».

Важно отметить, что попсень, говнорок, шансон и клубняк — короче, все громкое, но предельно простое жмется с меньшими отличиями от CD, а вот бетховены, индастриал, звуки природы и этнических дудок (а также тихие саундтреки к фильмам) в силу своей частотной извращенности ниже 256 кбит не жмутся вообще, а на 256 и выше жмутся кое-как (на высоких мр3 всегда будет шепелявить как беззубый старпер).

Не занимайся самостоятельно кодированием, если не любишь себя озадачивать тонкостями кодирования и любишь софт с одной БОЛЬШОЙ кнопкой «Сконвертировать в МП3». По-умолчанию большинство МР3-кодировщиков включают lowpass и highpass фильтры, а также используют быстрые алгоритмы кодирования, что неслабо ухудшает качество, и потом, такой МР3 на выходе превращается в уродство, убогость которого можно не заметить лишь на убогих дубовых наушниках (или аудиосистеме). Перед кодированием стоит основательно покурить Man, чтоб без запинки мог рассказать по памяти, что значит «lame.exe -V 0 --vbr-new --highpass 0.001 --lowpass 24 -m j -q 0 -b 256 -B 320».

Для глухих же людей с поражёнными медведём ушами рекомендуется кодировщик LAME последней версии с использованием пресетов. Умные разрабы и сотни тестеров уже позаботились о тебе, анон. Если не слышишь разницы, смело используй пресеты. Разница с оригиналом неуловима на большинстве мобильников, с которых ты наверняка будешь слушать любимого Guf_а. Ну тыпонел.

Урок истории

Давным-давно, когда компьютерные игры занимали на жёстких дисках целых 50 мегабайт, процессоры едва-едва тянули 3D шутеры с унылым графоном, а CD-R были запредельной роскошью, люди пользовались так называемыми "музыкальными центрами", в которые вставляли компакт-диски формата CD-DA (74 минуты звучания несжатого звука), купленные в магазине. Обычным делом было записать коллекцию любимых песен с CD на кассету и слушать потом эту кассету в компактном плеере, радуясь шипению, убитым басам с верхами и скорому размагничиванию записи (однако, кассета, записанная на тру-деке, и потом проигранная на тру-плеере, типа SONY Волкмен, играла не хуже, чем этот ваш Айпод, правда не долго). Тру меломаны покупали блочные радиокомплексы, в которые обычно входил хороший, годный усилитель звука ватт этак под 100, кассетная дека, эквалайзер, проигрыватель CD, опционально также мог наличествовать проигрыватель винила, FM-радиотюнер, PC. В некоторых блочных CD-проигрывателях был так называемый "CD-чейнджер", в который вставлялось 3-5 компактов, и который по окончании одного диска подсовывал лазеру следующий, можно было слушать музыку, управляя процессом кнопочками на пульте и даже создавать плей-листы путём программирования процесса воспроизведения (подобное было и на кассетах, но там это всё работало через задницу в виду аналоговости стандарта). В автомобиле надо было либо иметь вторую коллекцию тех же дисков (по пятнадцать баксов за диск, и, нет, песни отдельно из альбома покупать нельзя), либо носить диски туда-сюда, либо не выпендриваться и слушать кассеты.

Прогресс, однако, на месте не стоял. Вскоре жёсткие диски выросли до пары гигабайт, а Pentium 100 МГц перестал быть чем-то сверхъестественным. Внезапно обнаружилось, что музыку можно хранить на HDD, и не только в несжатом виде (WAV с качеством, аналогичным CD-DA) или унылом формате ADPCM, но и что-то куда получше. На тот момент самым свежим аудиокодеком оказался MPEG-1 layer 3. Как нетрудно догадаться, это был третий по счёту кодек MPEG для аудио после layer 2 и layer 1. В нём исправили некоторые недостатки layer 2 и добавили режим joint stereo (то есть кодировать сумму и разницу между каналами — это очень выгодно, когда всё самое интересное звучит в середине стереопанорамы), поэтому использовать layer 2 смысла не было. Сыграло огромную роль появление досовского энкодера l3enc.exe, который давал пристойное качество даже в бесплатной версии с битрейтом 112 кбит/с (конечно, обычно его крякали). Пипл не смутило, что порождаемые файлы были т. н. элементарным потоком, в который пришлось запихивать абы как теги, то есть сопроводительную информацию типа названия песни, — это потом вышло боком, когда появился новый «стандарт» на запихивание. Определение длины в секундах и переход на конкретное время также перестали быть тривиальными задачами, как только в моду вошёл переменный битрейт. Однако всё это казалось ерундой по сравнению с тем, что теперь можно было собирать коллекцию любимых песен огромного размера по сравнению с кассетами и минидисками (похожее на mp3 сжатие на магнитооптике, появился за несколько лет до mp3, ныне официально мёртв — Сони протупила тему), делать плейлисты в удобном виндовом интерфейсе, легко обмениваться музыкой в хорошем качестве с друзьями и даже скачивать её из интернета. Для быдла наступило светлое будущее, а меломаны как крутили CD на своих блочниках, плюясь в сторону Sound Blaster 2.0 с качеством звука китайской аудиокассеты, так и порою крутят до сих пор, хотя уже давно есть годные форматы со сжатием без потерь качества (flac и иже).

Ближе к середине 00-х mp3 стало доступно любому быдлу: теперь не надо покупать компьютер, чтобы слушать mp3: файлы, записанные на обычный компакт диск в режиме CD-ROM смогли научиться проигрывать бытовые музыкальные центры и «магнитолы с CD», чуть позднее — DVD-плееры, пиратские «mp3-диски» стояли рядом с Audio CD и медленно, но верно, завоёвывали популярность, а потом всем пришёл Интернет, и mp3-диски тоже начали вымирать, а музыкальные центры научились читать mp3 файлы с USB-flash и SD-карты. У меломанов же появились хорошие внешние звуковые карты за пару десятков «косарей» с хорошим ЦАП и форматы со сжатием без потерь, так что сегодня надобность в дисках формата Audio CD отпала. Но их всё равно ещё любят — полиграфия и физичность носителя, за который отданы деньги (компакт-диск можно потрогать, понюхать, полизать, а файл — нельзя) делают своё дело.

Ещё немного истории

MPEG-1 layer 2 используется до сих пор в телевещании - потому что лучше, чем layer 3, на высоких битрейтах и для единообразия, если битрейт не столь высок.

После опубликования стандарта MPEG-1 layer 3 группа MPEG, понятное дело, продолжила свою деятельность. В группе стандартов MPEG-2 аудио был слегка расширен собственно mp3, а также появился многоканальный MPEG аудио на основе layer 2. Увы, требование обратной совместимости (что очень вредило эффективности сжатия), а главное, неспособность Philips вовремя написать качественный энкодер обеспечили стандарту полный фейл. Говорят, где-то в Австралии всё же успели издать пару DVD с таким звуком.

Следующим шагом MPEG стал AAC (Advanced audio coding). Было ясно, что мощность процессоров уже достаточна и будет расти, поэтому фантазия авторов развернулась на полную - кодек, вначале введённый в семействе MPEG-2, а потом дополненный в MPEG-4, включал в себя всё, что только могло прийти в голову. Правда, не обошлось без конфуза - основной профиль кодека оказалось неудобно реализовывать на специализированных процессорах, поэтому в качестве основы (к которой присоединяют т. н. расширения) используют профиль пониженной сложности AAC LC, а AAC Main Profile остался курьёзом. На обратную совместимость забили, так что AAC LC решал известные проблемы mp3, включая нелепые, типа sfb21:

  • неудачно выбранные размеры длинных и коротких фреймов - в первом случае страдала эффективность, во втором даже на 320 кбит/с можно услышать "пре-эхо" перед резкими звуками;
  • недостаточно гибкий режим joint stereo - теперь он мог включаться только на тех частотах, где надо;
  • многоканальность, конечно.

В результате качество AAC LC на 128 кбит/с заметно лучше mp3, а на низких битрейтах mp3 нынче совсем в пролёте. Также в MPEG-4 предлагался вменяемый формат "обёртки" - с тегами и индексом. Основным локомотивом продвижения AAC для музыки в массы стал Apple. Получается, правда, так себе, хотя идея в целом правильная.

В AAC запилили два расширения специально для низких битрейтов, AAC LC с ними называется AAC HE:

  • PS (параметрическое стерео), дающее значительно лучший результат, чем старый режим intensity stereo, - звук кодируется в моно, а в расширении идёт информация, как из него реалистично сделать стерео;
  • SBR - кодируется только нижняя половина частот, при декодировании она дублируется в качестве верхней, подкручивается по сохранённой кривой, и добавляются тональные сигналы по необходимости. Звучит безумно, но это реально работает.

Оба расширения требуют совсем небольшую добавку битрейта. Результат - пристойное качество стерео при 32 кбит/с, хорошее при 48 кбит/с. Однако, в силу костыльной сущности, на битрейтах от 128 кбит/с и выше использовать эти расширения настоятельно не рекомендуется, качество станет хуже.

Само собой, некоторым хитрожопым бизнесменам пришла в голову мысль настричь бабла на закрытых расширениях mp3, но так, чтобы файлы как-то игрались на обычных устройствах. Первой попыткой стал mp3Pro - mp3 + SBR (алгоритм тот же, но формат, понятно, не такой, как в AAC). Было выпущено даже несколько портативных плееров. Однако париться с закрытым форматом с неясным будущим никто не захотел - ёмкость жёстких дисков продолжала расти. Результат - фейл. Второй попыткой был mp3HD - музыка обыкновенно кодировалась в mp3, а разница с исходным сигналом кодировалась другим алгоритмом и помещалась в один из тегов (похожим образом работает, например, DTS HD MA). Проблема в том, что объём тегов не может превышать 256 мегабайт, так что немногие в теме посмеялись и забыли.

Копирасты

В 2002 году произошла история с объявлением формата MP3 платным. Компания решила сделать платными не только кодеры, но и декодеры формата.

На сайте www.mp3licensing.com была вывешена таблица, в которой указана стоимость, которую производители программ должны выплатить за каждый плеер. Для свободного софта это, естественно, было неприемлемо.

Этим воспользовались разработчики свободного кодека Vorbis, прорекламировав свой православный кодек. Позднее представители корпорации объяснили, что произошло недоразумение, на странице с условиями не оказалось правила, согласно которому некоммерческое распространение происходит безвозмездно.

Тем не менее, поскольку Linux может распространяться и коммерчески, для некоторых дистрибутивов (почти всех основных, кроме Slackware, где Патрегу похуй, Gentoo, который вообще source-based, и некоторых других) оказалось неприемлемо помещение кодеков MP3 в стандартную поставку.

См. также

Ссылки

Примечания

  1. Но разница между 128 кбит/с и 320 кбит/с, как правило, хорошо заметна.
Источник — «http://lurkmore.co/Mp3»