что значит 320 кб с в музыке

Есть ли разница между FLAC и mp3? Разбираемся.

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке

После конвертирования, загрузил два трека — mp3 и FLAC в бесплатную программу по редактированию звука Audacity. Верхний трек это FLAC, нижний — mp3. Как видно на скрине, верхние частоты выше 16.5 кГц у mp3 начинают срезаться (см. 3). Далее выставил параметры для вывода звука Windows WASAPI (см. 1). Этот интерфейс дает максимальное качество, минуя преобразования самой винды. Включил прослушивание и начал переключаться между обоими треками, кликая на кнопку «Соло» (см. 2). Она позволяет слушать только нужный трек, автоматически приглушая другой. Слушал я на домашней неплохой мультимедийной акустике Edifier Studio R2730DB через оптический вход, а также на наушниках Audio-Technica ATH-M50 с выводом по звуковой карте ASUS Xonar Essence STX.

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке

Так вот, тыкал я тыкал, но так и не услышал разницы в звучании. Были небольшие нюансы, но это скорее вопрос к параметрам кодирования. Но ни на частотном диапазоне, ни на глубине сцены разницы я не почувствовал.

Часто встречаю людей, которые утверждают, что слышат разницу между FLAC и mp3. Что-ж, возможно так и есть. Скорее всего, mp3 был пожат некачественно, оттого и разница ощутима. Еще есть научное мнение, что с возрастом человеческое ухо слышит хуже высокие частоты. Мне 40 лет, и возможно, я тоже уже потерял возможность для подобных сравнений. И если уж нет разницы на домашнем оборудовании, то я точно не услышу ее и в автомобиле. Поэтому, я cконвертировал нужную мне музыку для прослушивания в авто в формат mp3. Причина простая, у меня в ГУ установлена карта памяти на 64 Гб, и с FLAC это место быстро забьется. А mp3 позволит разместить в 2.5-3 раза больше.

Даю возможность читателям послушать и сравнить. Вот архив с двумя треками. А вот ссылка на сайт Audacity.

Источник

Разница между mp3 128 kbps, 320 kbps и flac

Добрый день, уважаемые читатели!

А вы когда-нибудь задумывались, что именно теряется при сжатии из lossless в mp3 128 kbps или 320 kbps?
Я проверил и результат показался интересным. В первую очередь предлагаю пройти опрос, чтобы понять для себя слышите ли вообще разницу. Если не уверены, что слышите или уверены, что не слышите, то предлагаю к вашему вниманию простую и изящную идею: надо взять и столкнуть лбом две звуковые волны одна из которых будет находиться в противофазе, соответственно при сведении двух треков будет преимущественно слышно то, что не погасилось. Интересные графики пока не обещаю, но зато вы сможете сами на своей системе услышать какие именно звуки потерялись при сжатии из flac в mp3 128\320 kbps, архив с примерами в конце статьи.

Опрос
Исходные данные

The Black Keys — Everlasting Light (flac, 44100 Hz, 24-Bit, 1613 kbps), ознакомиться можно на Youtube.
Ludovico Einaudi — Drop (flac, 96000 Hz, 24-Bit, 2354 kbps), ознакомиться можно на Яндекс Музыка.
CC Coletti — Rock and Roll (flac, 192000 Hz, 24-Bit, 4845 kbps), ознакомиться можно на Youtube.
Annihilator — Ultra-motion (flac, 44100 Hz, 16-bit, 1022 kbps), ознакомиться можно на Youtube.

Параметры конвертации в mp3

44.1kHz, stereo, 128 kbps или 320 kbps

Описание эксперемента

Исходные файлы режутся на куски длительностью по 10 секунд, каждый из кусочков экспортируется в wav. После импортирования полученных треков в начало каждого добавляется 2 секунды тишины и секундный тоновый сигнал, затем конвертируются в mp3. После импортирования mp3 файлов выясняется, что относительно оригинала, полученный файл «ушел вперед». Это не баг, это фича. Производим синхронизацию относительно заданного тонового сигнала у оригинального (я пробовал для каждого файла mp3 несколько значений, которые впоследствии уточнял до наилучшего результата), избавляемся от тонового сигнала, тишины и полученные треки экспортируем в wav. Теперь осталось инвертировать треки, чтобы получились разнонаправленные пики, и свести с оригиналом.

Результат

57Мб). В данном архиве содержатся треки с звуками, которые потерялись при сжатии.

Источник

Как влияет битрейт на качество музыки?

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке
В наши дни очень много разговоров о том, что мы потеряли настоящую музыку с приходом форматов сжимающих аудио, таких, как MP3, AAC и похожих. Действительно ли это так? Спасут ли музыку Lossless форматы? Может ли вообще неподготовленный слушатель отличить музыку в форматах MP3 от FLAC? Давайте разберемся в этом вопросе.

Что такое битрейт (Bitrate)?

Вероятно, вы уже слышали термин «битрейт» раньше, и вы, вероятно, имеете общее представление о том, что это значит, но, возможно, неплохо познакомиться с ее официальным определением, чтобы вы знали, как все это работает.

Битрейт — это число бит или количеству данных, которые обрабатываются в течение определенного периода времени. В аудио это обычно означает килобит в секунду. Например, музыка, которую вы покупаете в iTunes, составляет 256 килобит в секунду, то есть в каждой секунде песни содержится 256 килобайт данных.

Чем выше битрейт трека, тем больше места он займет на вашем компьютере. Как правило, аудио CD занимает довольно много места, поэтому стало обычной практикой сжимать эти файлы, чтобы вы могли записать больше музыки на ваш жесткий диск (или iPod, Dropbox или что-то еще). Именно здесь вступают в спор форматы «без потерь» и «с потерями».

Lossless и Lossy форматы: в чём разница?

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке
Когда мы говорим «без потерь», мы имеем в виду, что мы действительно не изменили исходный файл. То есть мы скопировали трек с компакт-диска на наш жесткий диск, но не сжали его до такой степени, что мы потеряли какие-либо данные. Это, по сути, так же, как и оригинальная дорожка компакт-диска.

Однако, чаще всего вы, вероятно, копируете свою музыку в Lossy формате. То есть вы взяли компакт-диск, скопировали его на жесткий диск и сжали треки, чтобы они не занимали много места. Типичный MP3 или AAC альбом, вероятно, занимает 100 МБайт или около того. Тот же альбом в формате без потерь, такой как FLAC или ALAC (также известный как Apple Lossless), займет около 300 Мбайт, так что стало обычной практикой использовать форматы с потерями для более быстрой загрузки и большей экономии жесткого диска.

Проблема заключается в том, что когда вы сжимаете файл для экономии места, вы удаляете куски данных. Точно так же, как когда вы берете изображение с высоким качеством, и сжимаете его в JPEG, ваш компьютер берет исходные данные и «обманывает» определенные части изображения, делая его в основном таким же, но с некоторой потерей ясности и качественный.

В качестве примера возьмем два изображения, приведенных ниже: правый справа явно сжат, и в результате качество уменьшилось.

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке

Помните, что вы экономите место на жестком диске сжимая музыку в Lossy форматы, что может иметь большое значение для iPhone с 32 ГБ памяти, но по соотношению объём/качество это всего лишь компромисс.

Существуют различные уровни сжатия: 128 Кбит/с, например, занимают очень мало места, но также будут иметь низкое качество воспроизведения, чем более крупный файл 320 Кбит/с, который, в свою очередь, ниже качеством, чем эталонный файл с 1,411 Кбит/с. 1,411 Кбит/с — это качество уровня Audio CD, которого, в большинстве случаев, более чем достаточно.

Вся проблема не в том, как сильно сжата музыка, а на каком оборудовании вы её слушаете.

Действительно ли битрейт имеет значение?

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке
Поскольку память с каждым годом становиться всё дешевле, прослушивание звука с более высоким битрейтом, или вовсе в Lossless форматах, начинает становиться всё более популярной. Но стоит ли это времени, усилий и занятого объёма памяти в вашем телефоне или компьютере?

Я не люблю отвечать на вопросы таким образом, но, к сожалению, ответ: это зависит.

Часть уравнения — это оборудование, которое вы используете. Если вы используете качественную пару наушников или динамиков, вы привыкли к большому частотному и динамическому диапазонам. Таким образом, вы, скорее всего, заметите недостатки, которые возникают при сжатии музыки в файлы с более низким битрейтом. Вы можете заметить, что в низкокачественных MP3-файлах отсутствует определенный уровень детализации; Тонкие фоновые треки могут быть более трудными для восприятия, верхние и низкие частоты не будут такими динамичными, или вы можете услышать искажения в вокале солиста. В этих случаях вам может потребоваться дорожка с более высоким битрейтом.

Однако, если вы слушаете свою музыку с помощью пары дешёвых наушников на вашем iPod, вы, вероятно, не заметите разницы между файлом со скоростью 128 Кбит/с и файлом 320 Кбит/с, не говоря уже музыке без потерь 1,411 Кбит/с. Помните, когда я показывал вам изображение несколькими абзацами выше и отметил, что вам, вероятно, пришлось вглядываться в него, чтобы увидеть недостатки? Ваши наушники подобны усеченной версии изображения: они сделают эти недостатки трудными для восприятия, так как они физически не способны сыграть вам музыку так, как нужно.

Другая часть уравнения, конечно, ваши собственные уши. Некоторым людям может быть очень тяжело отличить два разных битрейта по простой причине — они мало слушают музыку. Навык слуха, как и любой другой, развивается с практикой. Если вы часто и много слушаете любимую музыку, ваш слух становится более точным и начинает улавливать мелкие детали и полутона. Но до тех пор не имеет особого значения, какой битрейт вы используете?

Так какой формат и битрейт вы должны выбрать для себя? Хватит ли вам 320 Кбит/с, или вам обязательно нужен Lossless формат?

Дело в том, что трудно услышать разницу между файлом без потерь и MP3-файлом 320 Кбит/с. Чтобы услышать разницу, вам понадобится серьезное высококачественное оборудование, хороший слух и определенный тип музыки (например, классическа или джаз).

Для подавляющего большинства людей, 320 Кбит/с более чем достаточно для прослушивания.

Что ещё нужно учесть?

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке
Музыка, записанная в формате Lossless, может быть полезна. Файлы, в формате Lossless более надежны в будущем, в том смысле, что вы всегда можете сжать их до Lossy формата, когда вам это понадобится, но вы не можете сделать наоборот и восстановить исходное CD качество из MP3 файла. Это, опять же, одна из фундаментальных проблем с онлайн-магазинами музыки: если вы создали огромную библиотеку музыки в iTunes и в один прекрасный день решили, что вам нужно больше битрейта, вам придется снова ее покупать, но только на этот раз в формате CD.

Когда это возможно, я всегда покупаю или копирую музыку в Lossless формате для целей резервного копирования.

Я понимаю, что аудиофилам, это как иголка под ногти. Как я уже говорил, все зависит от вас, вашего слуха и оборудования, которое у вас есть.

Сравните два трека, записанного в Lossless и Lossy форматах. Попробуйте несколько разных аудиоформатов, послушайте их некоторые время и наблюдайте, будет ли разница для вас или нет.

В худшем случае вы потратите несколько часов на прослушивание своей любимой музыки — не так страшно, правда? Наслаждайся этим!

Источник

Разница качества между mp3 и FLAC – 192Kbps или 320Kbps?

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыкеБольшинство меломанов, предпочитают музыку с высоким битрейтом. Но информации подкрепленной фактами на просторах сети очень мало, одни лишь мнения. Ниже я представляю вам график спектра одного и того же трека:

Не молодые меломаны могут возразить, что плохо слышат верхние высокие частоты, из-за возрастного изменения слуха. На тестах с прослушиванием чистого гармонического сигнала, в своих Sony MDR-XB950AP, я слышу максимальную частоту только на 16500 Гц (в других наушниках слышно лучше), но разницу в звучании треков с разным битрейтом «ощущаю» очень сильно =). Более того, эту разницу я слышу даже на смартфоне за 3000 рублей, в самых дешевых наушниках!

В примере на графике ниже видно, что разница между 192Kbps и 320Kbps существенна и еще существенней она по сравнению с Lossless форматом. Это те самые обертоны, которые делают высокие частоты «прозрачными», басы «мягкими» и все частоты «детальными». Четче звучат атаки, улучшается восприятие стерео и т.д. (перечислять можно долго).

В приведенном графике одно вертикальное деление, соответствует разнице амплитуды сигнала в 2 раза (3дБ).

Разница между 192Kbps, 320Kbps и FLAC:

что значит 320 кб с в музыке. Смотреть фото что значит 320 кб с в музыке. Смотреть картинку что значит 320 кб с в музыке. Картинка про что значит 320 кб с в музыке. Фото что значит 320 кб с в музыке

Надеюсь, что эта информация была для Вас полезна.

С уважением Тепляков Андрей Юрьевич

Источник

Рекомендации по использованию стандарта сжатия mp3

От редактора

Мы публикуем второе издание этой статьи, дополненное и переработанное. Многим нашим читателям изложенный здесь материал покажется слишком очевидным, другим — весьма спорным. Однако, для людей, только что открывших для себя существование магического мира MP3, данная статья должна принести неоценимую пользу и ответить на большинство возникших вопросов.

От автора

Как следует из названия, статья посвящена описанию некоторых тонкостей, которые возникают при использовании стандарта сжатия аудиоданных MPEG I/II Layer 3 (mp3). Данная работа не претендует на статус законченного исследования, включающего в себя тестирование кодеров или проигрывателей mp3. Это лишь попытка автора структурировать свои знания, а также отразить свой опыт знакомства с вышеупомянутым стандартом.

Способ подачи материала предполагает наличие у читателя базовых знаний по mp3, которые, впрочем, вы можете почерпнуть в любой момент из источников, указанных в разделе «Список ссылок».

Стратегические вопросы

Имеет ли смысл использовать сжатие с потерями вообще?

Давайте попытаемся обозначить границы применения mp3. Везде, где качество звука не должно в точности соответствовать оригиналу и где в будущем наверняка не потребуется серьезная обработка хранимых данных, использование mp3 (или другого формата сжатия с потерями) вполне допустимо. Не всякому захочется каждый час вставлять в CD привод новый музыкальный диск, если объем винчестера составляет десятки гигабайт. Куда как проще записать музыку в mp3 на винчестер или CD-ROM и слушать оттуда. Или воспользоваться портативным mp3 плеером, mp3-CD плеером, автомагнитолой с поддержкой mp3. А можно просто скачать mp3 из интернета на выбор.

В этом и следующем подразделах будут описаны случаи, когда применение сжатия с потерями недопустимо, а также предпринята попытка разобраться — почему?

Не имеет смысла делать архивы звуковых данных для их дальнейшей обработки (библиотеки сэмплов, фонотеки и т.п.) в mp3. Это касается и MiniDisk (там тоже используется сжатие с потерями), и других форматов: многие виды цифровой обработки влекут за собой слышимые искажения. Данное правило не зависит от используемого битрейта. Говоря о дальнейшей обработке звука я имею в виду нечто более серьезное, чем просто микширование или fade in/out, например flange, distortion, dynamic compression, reverberation, фильтрация шумов и даже использование эквалайзера… Скажем, в mp3 нельзя хранить сэмплы (для их хранения используют специальные форматы сжатия без потерь, например sfArk). Так как в случае кодирования с потерями нельзя восстановить утраченные на этапе кодирования данные, то в mp3 желательно сохранять только окончательные варианты звукозаписей.

Еще один аргумент: вы знаете как аудиодиск, перегнанный в mp3, записать обратно на аудиокомпакт-диск так, чтобы между треками не было ни пауз лишних, ни щелчков? Не знаете? Почитайте, скажем, www.r3mix.net. Морока та еще… Если вы хотите сказать: «А я вот делал — все ОК!» — конкретизируем задачу: музыка должна переходить без пауз из трека в трек, причем паузой считается не только промежуток в 1-2 секунды, но и маленькие отрезки тишины в единицы-десятки миллисекунд. Теоретически и в этом случае можно все сделать идеально слитно, но может так оказаться, что «овчинка не будет стоить выделки».

Какие существуют способы хранения звука без потерь?

Я храню фонотеку в wav-файлах (в PCM формате). Можно также использовать CD-DA; для него характерны большая совместимость, но меньшая точность считывания при проигрывании. Есть и другие варианты — обычное архивирование (ZIP, RAR) или специальные программы типа WavPack, Monkey’s Audio, RK Audio, FLAC, LPAC Archiver, Shorten. Однако работа с файлами, сжатыми подобным образом, чревата неприятными сюрпризами: wav (PCM) играют подавляющее большинство проигрывателей, а вот экзотику типа RKA… Известно о существовании плагина для RKA под WinAmp, но на WinAmp свет клином не сошелся: есть же люди, которые им не пользуются. Таким образом, один только WinAmp — это еще не совместимость (в широком смысле). А другие программы-проигрыватели? А аппаратные плееры? А mp3-CD плееры? Не знаю, как для вас, а для меня совместимость в указанном выше смысле очень важна. А использование только одной пары кодер/проигрыватель существенно ограничивает свободу. Например, для того чтобы дать послушать какой-то файл своим друзьям, нужно еще убеждать их в необходимости использовать новый проигрыватель.

Из каких соображений нужно исходить при выборе параметров сжатия?

По моему мнению, можно выделить два основных режима сжатия: «сохранение приемлемого уровня качества при достижении максимального сжатия» (например, для публикации в Сети) и «полное субъективное сохранение качества исходного материала при не самом большом сжатии» (для хранения и регулярного прослушивания). Стоит заметить, что пороговые битрейты для того и другого режимов индивидуальны. Для меня они составляют 128 и 256 кб/с соответственно. Безусловно, существует множество промежуточных вариантов: есть портативный плеер mp3 с плохонькими наушниками, которому достаточно 160 кб/с; в машине установлена магнитола с поддержкой mp3 и акустикой получше — тут потребуется, скажем, 192 кб/с. Таким образом, выбирая параметры сжатия, нужно прежде всего определить те задачи, для которых создаются mp3 файлы, и уже исходя из этого решить, какое соотношение между качеством звука и размером файла вас устроит. Следует также учитывать, что понятие качества звука у разных людей может сильно отличаться.

С точки зрения здравого смысла, не стоит беспокоить себя вопросами: «Какого же битрейта достаточно, чтобы никто не услышал разницу с CD-DA?» Ведь всё дело в том, что психоакустическая модель алгоритмов mp3 разрабатывалась под среднестатистического человека с его среднестатистическими ушами. Поэтому оценочные суждения по затронутому вопросу могут быть диаметрально противоположными. Для кого-то качество mp3@128 kbps, сделанного Xing’ом, ничуть не хуже Audio CD даже на отличной аппаратуре. Другой запросто отличает mp3@320 kbps от музыкального CD в любых слепых тестах. Отсюда просто нужно сделать правильные выводы. В первом случае человеку не нужно тратить много денег на качественную аудиотехнику, а во втором — можно только порадоваться за ее (его) тонкий слух. Таким образом, исходя из собственных потребностей Вам придется один раз поэкспериментировать, чтобы выяснить, каких параметров в дальнейшем стоит придерживаться.

Хранение wav-файлов позволит в случае изобретения некоего принципиально нового, усовершенствованного алгоритма (условно назовем его mp2000) перегнать в более качественный формат точные копии оригиналов, в то время как самих оригиналов может уже и не быть под рукой… Если помните, аналогичная ситуация возникла с началом победного шествия формата видеосжатия MPEG4.

Какой формат сжатия с потерями лучше использовать: mp3, LQT, WMA, MP+, ogg vorbis …

Следует отметить, что пока ни одна из перечисленных в заголовке альтернатив формату mp3 одновременно и по качеству, и совместимости к нему не приблизилась. Существуют форматы, которые уже сегодня обеспечивают качество сравнимое или даже лучшее, чем у mp3. Например LQT AAC, который часто называют mp4. Однако битрейт у него ограничен до 192 кб/с (за что его не любят ценители mp3 @ 256/320 kbps), и запросы к аппаратуре куда как серьезнее (последнее, правда, в век бурного развития вычислительной техники является проблемой временной). Тем не менее, думаю, вы согласитесь, что по совместимости с mp3 пока никому не сравниться.

Еще один реальный конкурент — ogg vorbis. Формат сейчас находится в стадии бета-тестирования, но, говорят, у него очень неплохие показатели и, следовательно, большой потенциал. В Сети уже обсуждают «плюсы» и «минусы» использования ogg и mp3, и сравнение часто оказывается не в пользу последнего.

Воспроизведение mp3

Этот раздел будет интересен даже тем, кто вовсе не собирается заниматься сжатием звуковых данных. Речь пойдёт о некоторых неочевидных моментах проигрывания уже готовых файлов.

Какой проигрыватель mp3 лучше?

Среди программных проигрывателей лучшими традиционно считаются сделанные на коде Fraunhofer: некоторые версии WinAmp’а, WinPlay, AudioActive, Microsoft Media Player… Код от Фраунгофера используется в WinAmp версий 1.5, 1.6, 2.13, 2.20, 2.21, 2.22, 2.666, 2.7 и более поздних; остальные версии оснащены собственным декодером от NullSoft, а копирайт Фраунгофера лишь соблюдение лицензионных требований. Также заслуживает упоминания X-Audio и все, что сделано на этом коде (C4, CoolPlay, MusicMatch Jukebox). Еще есть множество проигрывателей, использующих код ISO, самые удачные — MPG123, UltraPlayer и мой любимый Apollo (качество воспроизведения, конечно, не идеальное, но в целом он очень удобен). Существует даже плагин под WinAmp для декодирования mp3, построенный на основе MPG123. Широко известен проигрыватель NAD, базирующийся на коде ISO. Звук его считается одним из лучших, но беда в том, что он не понимает VBR. Все, что сделано на коде Xing (Xing player, FreeAmp), считается самым худшим вариантом: эти проигрыватели задирают высокие частоты, что сделано, по-видимому, для компенсации завала высоких частот кодерами Xing.

Что касается аппаратных проигрывателей mp3, то о их внутреннем устройстве по части применённых алгоритмов известно совсем мало. Но безусловно то, что алгоритмы в них используются те же, что и в программных проигрывателях. Некоторые содержат аппаратную реализацию алгоритма Fraunhofer в отдельном чипе. Другие проигрыватели имеют даже flash-микросхемы для обновления алгоритмов декодирования mp3. В любом случае нужно смотреть, на основе какого кода сделан проигрыватель. Считается, что Fraunhofer — это всегда хорошо, ISO и X-Audio — зависит от реализации, Xing — однозначно плохо.

Имеет ли смысл выбирать проигрыватель mp3 файлов в зависимости от используемого кодера?

Да. Как было написано выше, проигрыватели на базе Xing задирают высокие частоты, так как при сжатии кодеры на базе Xing эти частоты безбожно режут. В паре они компенсируют друг друга: mp3, сделанные Xing’ом, гораздо лучше звучат в исполнении Xing MPEG Player’а, чем Fraunhofer’a. Авторы LAME (см. следующий раздел) также советуют использовать именно LAME для декодирования сделанных ими mp3.

Безусловно, держать дома набор проигрывателей или даже декодеров (программ, которые могут только преобразовать mp3 в PCM wav файл) неудобно. Поэтому к таким крайним мерам я рекомендую прибегать только в особо ответственных случаях преобразования звука из mp3: запись на аудиокомпакт-диски, микширование, переупаковка другим кодером и т.п.

Как определить, каким кодером был создан mp3 файл?

Поскольку формат mp3 не предусматривает никаких подписей кодера в созданном файле, однозначно определить использовавшийся кодер очень сложно. Есть несколько примет, позволяющих с большей или меньшей степенью вероятности строить догадки: например, кодеры на основе Fraunhofer’а и ISO заполняют тишину разными значениями (акустически тишина не нарушается). Кодеры Xing первыми использовали технологию VBR. В такие файлы они вставляли свою подпись. Позже такую же подпись стал делать LAME (см. следующий раздел), чем, понятное дело, усложнил задачу определения использовавшегося кодера. Сегодня LAME ставит уже свою подпись.

Существуют программы, которые на основе известных признаков пытаются установить, каким кодером пользовались при создании mp3. Одна из таких программ — RenaTager. При ее использовании могут возникнуть проблемы: программа уже не модифицируется, в связи с чем неверно определяет новые версии кодеров. Возможно, такая функция скоро будет включена в альтернативный плагин под WinAmp для воспроизведения mp3 MAD. Я слышал еще о программе mp3GuessEnc, которая имеет интерфейс командной строки, и EncSpot, аналогичной программе с удобным оконным интерфейсом. Но со 100% вероятностью каким кодером был получен файл невозможно. Часто эти программы показывают, что один-два трека с компакт-диска сделаны другим кодером, хотя ведь диск был сжат одним кодером с одинаковыми параметрами.

К слову, стандарт id3v2 предусматривает поле, в котором указано название кодера.

Ламерам посвящается…

Чтобы читатель лучше понял, о чем пойдет речь, позволю себе привести выдержку из англо-русского словаря:

lame — [leim] — прил. 1) хромой, изувеченный; 2) неудачный, неправильный; 3) разг. простоватый, отсталый

Что такое лейм?

LAME (читается как «лейм») — это проект по созданию программного кодера mp3, основанный на принципах открытых исходных кодов. Название проекта расшифровывается как «Lame Ain’t a Mpeg Encoder», что означает «лейм — это не MPEG кодер».

Весь его код пишет группа програмистов-энтузиастов. За основу был взят свободно распространяемый в качестве приложения к стандарту MPEG демонстрационный код от ISO. Кодер динамично совершенствуется: новые версии выходят практически каждый день.

На мой взгляд, лейм заслуживает большего признания. Это отличный кодер, который имеет огромное количество настроек, позволяющих кодировать на любой вкус. Лейм поддерживает VBR, кодирование на битрейтах до 320 кб/с включительно, выбор режима кодирования стереосигнала, выбор частот среза фильтров ВЧ и НЧ и многое другое. Качество кодирования на высоких битрейтах всеми признано лучшим.

Чтобы обойти лицензионные ограничения автора стандарта MPEG Layer 3 и владельца патентов Fraunhofer IIS, лейм официально распространяют только в виде патча (исправление или замена нескольких файлов) для оригинального кода mp3 кодера от ISO. В соответствии с этими ограничениями автор или распространитель программ для работы с mp3 должен платить лицензионные отчисления вне зависимости от того, продается ли эта программа или распространяется свободно. Заявляя о нарушении своих прав, Fraunhofer добилась закрытия ряда интересных проектов в области mp3, например проигрывателя NAD, кодера mpegEnc.

Официальный сайт проекта LAME — lame.sourceforge.net.

Практически весь исходный код ISO подвергся доработке, поэтому для компиляции и сборки работающей версии лейма достаточно его исходных текстов. Учтите, на официальной странице нет готовых программ (чтобы Fraunhofer не могла придраться). О том, где их найти, вы узнаете в одном из следующих подразделов.

Лейм не имеет графической оболочки и управляется из командной строки. Где найти графические оболочки, созданные специально для этой программы, будет сказано ниже. Некоторые программы (например, для копирования музыки с аудиокомпакт-дисков) имеют возможность подключения внешнего mp3 кодера, в частности LAME. Список таких программ приведен на сайте лейма.

Какие версии лейма существуют? Какая версия новее, какая надежнее?

Самая последняя версия имеет типовое название alfa. Никто, включая авторов кодера, не может гарантировать отсутствие в ней ошибок. Поскольку обновление происходит очень часто, для однозначной идентификации версии кодера нужно указывать номер альфа-версии и дату внесения последних изменений в исходный код. Альфа-версии рекомендуется использовать только для тестирования новых возможностей лейма.

После того, как текущая версия пройдет стадию альфа-тестирования и исправления ошибок, появляется бета-версия. Иногда даже в ней встречаются серьезные огрехи (например — 3.67, если память не изменяет), и тогда выпускается новая, улучшенная бета-версия. Как правило, бета-версии работают много лучше и надежнее альфа-версий. Лично я предпочитаю подождать некоторое время (2 — 3 месяца), прежде чем начать использовать данную бета-версию.

В 1999 году координатор проекта лейм принял решение о регулярном выпуске stable (отлаженных) версий, отличающихся от текущих тем, что на протяжении длительного времени не подлежат содержательному обновлению (во избежание свежих ошибок, хотя исправление старых только приветствуется). Нынешняя stable — 3.70 (апрель 2000 года). Меня отговаривали от ее использования, потому что в 3.8х добавили ABR, улучшили качество (постоянная дилемма между надежностью и новыми возможностями).

Замечу, что последняя бета-версия — 3.87 — держится с сентября 2000 года. Это означает, что за все это время сколько-нибудь серьезных оплошностей не было замечено. И, для меня лично, этого достаточно, чтобы сделать свой выбор в пользу 3.87.

Лейм — это ISO код или нет?

Изначально лейм делался как патч именно для кода ISO. При модернизации кодера упор делался на исправление ошибок и совершенствование алгоритма. Но уже в 2000 году в версии, кажется, 3.6, было замечено, что весь код ISO изменен и лейм свободно компилируется без оригинальных исходников ISO. Так что сегодня лейм можно называть ISO-кодером только в историческом смысле, структура же его изменена настолько, что проще считать лейм самостоятельной разработкой. Причем разработкой качественной и перспективной: сейчас лейм уверенно конкурирует как по скорости, так и по качеству с аналогичными программами на основе кода от Fraunhofer.

Что лучше: LAME или Fraunhofer-based кодеры?

Одним нравится попадья, другим — свиной хрящик. Эта дискуссия сродни спорам о том, с какой стороны нужно разбивать яйцо. В августе 1999 года я в результате тестирования установил, что Fraunhofer-based кодеры имеют преимущество перед леймом на битрейтах в 160 кб/с и ниже. Лейм, соответственно, лучше при 192 кб/с и выше. Изменилось ли что-то с тех пор? Повсеместно наблюдаемая тенденция к использованию высоких битрейтов (от 160 и выше) и VBR может обеспечить LAME большое будущее.

ISO-based кодеры, а тем более кодеры на базе Xing использовать сегодня смысла не имеет. Лейм вобрал в себя все лучшее от ISO и ринулся догонять Fraunhofer. Кто-то считает, что уже догнал. А кто-то полагает, что лучше не спешить с выводами и использовать старый добрый Fraunhofer. Вспоминают о том, что во всех тестированиях на низких битрейтах (128 и ниже) Fraunhofer был лидером и уверенно обходил лейм, но забывают, что за прошедшее с тех пор время ситуация могла измениться.

Говорят, что версии лейма появляются чуть ли не каждый день потому, что в старых находят ошибки. Да, все так. У Фраунгофера тоже находят, но не исправляют годами — разве это лучше?

По крайней мере, VBR в лейме лучше, чем в Fraunhofer’е, хотя и тут он далек от идеала.

Где взять откомпилированный под Windows LAME?

На большинстве сайтов можно найти как stable-версии, так и последнюю beta, а иногда и alfa.

Есть ли для LAME оконные оболочки под Windows?

Есть, самые популярные — vbLamer и RazorLame. Есть ещё LAMEr, LAMEb, Lame GUI frontend. LameBatch — уже долгое время не модифицируется и, соответсвенно, не использует новые возможности лейма.

В качестве оболочки для лейма удобно также использовать программу для копирования данных с Audio-CD — ExactAudioCopy, WinDAC, AudioGrabber, CDeX…

Подготовка материала перед сжатием

В этот раздел вошли советы по подготовке аудиоматериала в цифровом виде к процессу сжатия. Как вы получите этот материал — в этой статье я рассматривать не буду.

Постоянная составляющая

В некоторых случаях (практически никогда на CD и фактически всегда при записи с линейного или микрофонного входа) сигнал имеет так называемую постоянную составляющую: колебания уровня сигнала происходят не относительно условного нуля (середины диапазона уровней сигнала), а относительно некоторого другого уровня. Настоятельно рекомендуется эту составляющую убирать перед кодированием, благо это умеет практически любой звуковой редактор (remove DC offset). Некоторые кодеры (например лейм), кодируя такие файлы, сильно искажают звук, так как их психоакустическая модель рассчитана на исходный сигнал без постоянной составляющей.

Надо ли понижать уровень файла?

Да, надо, если пиковый уровень исходного сигнала около 0 дБ, иначе при кодировании может произойти искажение сигнала. Использование сжатия с потерями подразумевает, что исходный сигнал будет восстановлен не точно, а приблизительно. Из-за этого, на участке с пиковой амплитудой вы имеете шанс получить превышение пикового уровня сигнала (0 дБ), что и повлечет за собой искажения. Количество таких искажений зависит от кодера и битрейта (чем выше битрейт, тем меньше искажений). В общем, только заниженный перед сжатием уровень исходного сигнала гарантирует (в какой-то мере) защиту от искажений.

На сколько понижать? Вопрос спорный. Нужно учитывать то, что при понижении уровня и передискретизации также будут возникать искажения исходного сигнала. Естественно, что искажения будут меньше при понижении уровня ровно в 2 раза, но это достаточно большое понижение громкости. Можно попробовать выбрать что-то кратное этому «вдвое». Скажем, снизить уровень на 25%. А кто-то, может быть, предпочтет целые числа по децибелам, скажем — 3,00 дБ.

Поскольку наличие искажений от превышения пикового уровня сигнала зависит от битрейта и кодера, приведу здесь наблюдения одного из моих знакомых: «при 320 + лейм нормально — 98%, а при 128 — 85-88% от максимального уровня (100% = 0dB)». Сам я с файлами, уровень сигнала которых приближался к 0 дБ, не экспериментировал.

Надо ли использовать нормализацию?

Как правило, нет. Существует принцип невмешательства в работу исполнителя и звукорежиссера. Если что-то звучит тише, значит, так задумано. Это все равно, что читать книгу с главной героиней-брюнеткой, но представлять ее себе блондинкой, потому что вам так больше нравится. Это будет уже не авторский замысел, а ваша вольная обработка.

Тем более неразумно выглядит нормализация под очень высокий уровень (часто 98% или даже 100%) — см. предыдущий подраздел.

Таким образом, нормализация при работе с материалом, полученным с аудио компакт-дисков, практически не нужна, а при работе с другими записями — только в случае очень уж низкого уровня сигнала и только для альбома целиком.

Замечания по поводу увеличения уровня в целое число раз справедливы и в данном случае, так как нормализация — это передискретизация с новым уровнем сигнала.

Тонкости процесса сжатия

В этом разделе описаны некоторые особенности процесса сжатия, как-то: выбор параметров кодера, битрейта и прочего.

Надо ли (в лейме) выключать психоакустику?

Думаю, нет. Лейм очень быстро развивается. В августе 1999 года я тестировал версию 3.24, нынешняя версия — 3.87. В той, старой, версии я действительно слышал разницу в звучании между файлами, сделанными со включенной психоакустикой и с выключенной. Последний вариант мне нравился больше. Но, с точки зрения теории кодирования mp3, это неверно. Психоакустика составляет неотъемлемую и достаточно важную часть алгоритма сжатия. Так что плохо реализованные алгоритмы психоакустики были ошибкой старых версий лейма. И ее, кстати, исправили. Попробуйте сравнить сами.

Есть, правда, одно «но».

Тонкая настройка психоакустики при сжатии

Как я уже говорил выше, психоакустика рассчитана на среднего человека и соответствует настройкам «по умолчанию» для проигрывателя. Из-за этого, подняв высокие частоты в эквалайзере, мы можем услышать искажение идеального, на первый взгляд, звучания мп3 файла. Вот что говорят по этому поводу на MP3 Forum’е:

Народ! Я, кажется, раз 20 писал про одно простое соображение. Повторюсь еще раз.

Иногда некоторые моменты психоакустики отключать надо. Вот, например, в лейме есть опция понижения ATH (Absolute threshold of hearing), т.е. абсолютный порог слышимости. Зачем кодировать звуки, которые мы не слышим, скажете вы? А вот зачем. Если человек будет слушать эту музыку через эквалайзер, то данные параметры (параметры психоакустической модели с стандартным ATH — АГ) можно считать неприменимыми. Т.е. стоит чуток поднять высоких частот, все огрехи mp3 как на ладони.

Ну почему об этом до сих пор никто не написал, а?

Только вот понижение ATH слишком уж «больно» отражается на битрейте в виде его сильного увеличения.

Какой режим кодирования стереосигнала лучше: stereo, joint stereo или dual channel?

Выбор режима кодирования стерео зависит от конкретной ситуации. С одной стороны, при использовании joint stereo на кодирование среднего канала выпадает больше половины битрейта при почти одинаковых правом и левом каналах, с другой стороны, кодер может оставить слишком мало места для кодирования разницы каналов и смазать стереоэффекты. В таком случае, казалось бы, предпочтительнее режим stereo, когда кодер кодирует каналы раздельно, но пропорция, в которой он делит битрейт для правого и левого каналов, может изменяться. А если на каком-то ответственном отрезке кодер сделает поток в одном из каналов чересчур маленьким? Словом, у каждого метода есть преимущества и недостатки — оптимальный выбор будет зависеть от типа записи.

Следует учесть, что некоторые записи содержат сдвиг фаз между каналами, что практически исключает возможность использования joint stereo. Правда, есть специальное ПО, которое находит и корректирует такой сдвиг, однако использование еще одной программы в процессе сжатия не делает этот самый процесс проще. Где взять такую программу, сказано в разделе «Список ссылок».

Лейм автоматически выбирает для каждого фрейма stereo или joint stereo (при желании вы можете запретить ему делать это: «-m s» — только stereo, «-m f» — только joint stereo). Я использую режим с автоматическим выбором «-m j».

Существует мнение, что кодеру нужно запрещать перераспределение потока между каналами стереозаписи, для того чтобы на каком-то ответственном отрезке кодер не сделал поток в одном из каналов чересчур маленьким. Режим, когда каждому каналу отдается ровно половина потока битов, называют dual channel. В лейме этот режим активируется ключом «-m d». Рекомендую использовать такой режим только при заведомо большом размере потока — битрейт в 256 кб/с и больше.

Использовать ли переменный битрейт (VBR)?

Проблема в том, что под VBR (Variable BitRate — переменный битрейт) нужна своя психоакустическая модель, которая и будет управлять изменением битрейта. Раньше кодеры использовали CBR (Constant BitRate — постоянный битрейт) и принцип «обеспечить максимальное качество, упаковывая данные в поток заранее заданной ширины». Переменный битрейт требует совершенно другого подхода: «обеспечить заданный уровень качества, используя поток минимальной ширины», поэтому алгоритмы сжатия для VBR нужно создавать практически с нуля. Более или менее приемлемым прообразом такого алгоритма обладает только лейм, как самый быстроразвивающийся кодер. Ни Ксинг, ни Фраунгофер качественной разработки VBR пока не представили. Их алгоритмы варьируют средний битрейт в пределах 10-15% от основного, что, по-видимому, является результатом попытки адаптировать алгоритмы CBR для использования с VBR (а ведь в старых алгоритмах вообще не было возможности изменить битрейт).

Проблема также состоит в том, что до сих пор не существует сколько-нибудь точной математической модели человеческого слуха. Поэтому разработка психоакустических алгоритмов ведется опытным путем — методом проб и ошибок. Сложность построения алгоритма, получающего на входе некий «уровень качества», заключается в том, что не до конца ясно, как этот уровень качества связан с прочими параметрами алгоритма, в частности с битрейтом. Хотя человеку, далекому от этой технологии, куда как проще оперировать с параметром, непосредственно задающим уровень качества сжатия, чем с некими внутренними параметрами алгоритма.

На этом фоне вполне логичным выглядит появление компромиссного варианта — ABR (Average BitRate — средний битрейт), реализованного в LAME. По сути, это VBR с элементами доработанного старого алгоритма кодирования CBR. Когда качество падает ниже некоторого порога, битрейт увеличивается, если кодируемый сигнал достаточно прост, битрейт уменьшается. В итоге мы получаем обычный файл с VBR потоком, где параметром является не некий абстрактный уровень качества, а заданный битрейт.

Следует отметить, что некоторые проигрыватели не умеют корректно воспроизводить VBR. Например, очень качественный проигрыватель NAD сильнейшим образом искажает звук таких файлов. Объясняется это тем, что, когда этот проигрыватель был создан, ни один из кодеров не использовал VBR. С аналогичной проблемой можно столкнуться при использовании некоторых аппаратных проигрывателей mp3.

И все-таки будущее за принципом, положенным в основу VBR. Осталось только дождаться достойной программной реализации алгоритмов, создающих VBR файлы.

Следует подробнее остановиться на следующей ситуации: при переключении битрейта между фреймами один фрагмент сложного участка может быть закодирован с большим битрейтом, другой — с меньшим, полученный в результате скачок — слышимый дефект звучания. Случай во многом напоминает рассмотренный выше с режимом стерео — вот поэтому-то любители dual channel всегда используют CBR.

Список ссылок

В этом разделе приведен список ссылок на тематически связанные с mp3 ресурсы интернета, которые, на мой взгляд, больше других заслуживают внимания. Некоторые из них содержат свои богатые списки ссылок, дублировать которые не имеет смысла.

Ставший уже классикой и использующийся как ФАК в ФИДО эхоконференции RU.MPEG «Обзор MP3» (в двух частях: часть 1, часть 2). В обзоре много ссылок на различные, связанные с mp3 сайты. Очень советую новичкам.

Техническая документация по стандарту сжатия mp3 — www.mp3-tech.org.

Официальный сайт проекта LAME — lame.sourceforge.net.

Сайт Дмитрия Куцанова (mitiok). Этот сайт можно назвать mp3-порталом: тут содержится много полезных программ для работы с mp3 и множество ссылок на другие ресурсы интернета по сжатию звука. Автор выкладывает откомпилированный для Windows лейм как в варианте exe-файла, так и dll-библиотеки (прилагаются ссылки на другие сайты с откомпилированными LAME). Здесь есть и программа для добавления/удаления wav RIFF заголовка, и программы для сжатия звука без потерь, и плагин под WinAmp от версии 2.22 (декодер с кодом Фраунгофера).

Сайт Сергея Сапелина. На этом сайте вы найдете небольшие, но весьма полезные авторские программы по работе с mp3, например: программу для выравнивания фаз в каналах wav-файла, программу для изменения громкости (и нормализации) mp3 файла без перепаковки и другие.

Сайт проекта Apollo (проигрыватель mp3, mp2, wav).

Программы для копирования данных с Audio-CD: ExactAudioCopy, WinDAC, AudioGrabber, CDeX. Настоятельно рекомендую использовать первую из упомянутых — ExactAudioCopy.

Что нового появилось за год в Сети по этой теме?

Много интересных материалов на русском языке по данной тематике появляется в разделе Мультимедиа на сайте iXBT, например:

Об авторе

Тем, кому не понравилась эта статья просьба дальше не читать. — прим. ред. 🙂

Я — студент Киевского политехнического, учусь на 5-ом курсе, специальность: информатика. Не являюсь специалистом в области цифрового звука, но о mp3 знаю достаточно много. В свое время учился 5 лет в музыкальной школе по классу фортепиано. Музыкальный слух — со слов моего бывшего учителя музыки — у меня есть. Слушать музыку люблю. Направления и стили не различаю — слушаю то, что нравится. Mp3 заинтересовался пару лет назад, а около года назад даже провел тестирование программ MPEG Layer 3 (MP3) кодеров. Интересуюсь новинками в данной области, являюсь участником эхоконференции ФИДО RU.MPEG.

Эта статья изначально задумывалась как дополнение к моему предыдущему материалу о тестировании программ MPEG Layer 3 (MP3) кодеров. В новой работе я постарался дать ответы на большинство заданных мне вопросов. Некоторые ответы помещены ниже.

Откуда взялась идея протестировать кодеры?

Пару лет назад я начал собирать свою фонотеку на CD-R в mp3, тогда-то и заинтересовался технологией кодирования. После проработки сотен килобайт информации из Сети, чтения статей, общения посредством E-mail с такими же энтузиастами, мне показалось, что информации для выбора кодера и битрейта по-прежнему мало. Вот тут созрело решение попробовать разобраться самому. Вообще-то, можно было бы вполне ограничиться несколькими кодерами на основе Fraunhofer’а и несколькими — от ISO. Отказаться от идеи использовать Ксинг меня убедили очень быстро, стоило разок послушать, что он делает на 320 кб/с… Я честно хотел найти хороший кодер на основе кода от Ксинга. Не получилось. 🙂

Встал вопрос: как тестировать? Была мысль вычесть из одного wav’а другой (wav, полученный из mp3, и wav с эталонного CD), но испугался проблем с offset. Из множества возможных вариантов тестирования я в конце концов выбрал сравнение АЧХ с усреднением по 30 секундам звукового фрагмента, что должно устранить искажения результатов, вызванные различием offset’ов. Фрагменты по 30 секунд были взяты из начала композиций, что должно показать работу кодера в большом динамическом диапазоне. Как я выбирал композиции, написано в исходной статье. Метод тот еще, конечно 🙂 Можете не рассказывать, что лучше использовать сонограмму и что усреднение не вполне приемлемо в таком тонком вопросе, как психоакустика. Знаю. Согласен на компромиссный вариант: метод усреднения не позволяет точно сравнить кодеры, но помогает выявить некоторые тенденции. То есть получить результат на качественном, а не на количественном уровне.

Следующий вопрос — АЧХ какого канала стереозаписи? Решил делать все: и правый, и левый и их среднее. А дальше уже дело техники.

Чем снимать АЧХ? Под рукой был CoolEdit. Пойдет? Вполне!

А что делать с тысячей графических файлов, с нарисованными АЧХ? Я написал программу, которая эти картинки сама обрабатывала. Тоже, кстати, интересная задачка — примитивное распознавание образов. По крайней мере, границы графика с точностью до пиксела неизвестны, цвет линии — тоже. Хорошо, что обработкой графики занимался компьютер, а не я.

Такую работу жалко было оставлять у себя на винчестере — хотелось показать людям.

Таким образом, единственная цель, которую я ставил перед собой — разобраться. А потом подумал: вдруг кому-то еще это будет интересно. Так родился отчет о тестировании программных mp3 кодеров

Намечается ли новое тестирование?

Честно говоря, сейчас я не считаю это необходимым. Я теперь не испытатель, а скорее аналитик: собираю информацию о чужих тестах, анализирую, делаю выводы.

Как ты сам кодируешь музыку?


Как со мной связаться?

Мой e-mail: krolyk@Hopka.kiev.ua. Если есть вопросы, не стесняйтесь, задавайте. Я отвечаю на все письма. Если вы участвуете в обсуждении этой статьи в каком-то форуме, сообщите, пожалуйста, мне об этом.

Вместо заключения

Я признателен всем, кто присылал критические замечания, предложения, пожелания. Особо хочу выделить постоянных участников MP3 Forum и автора этого проекта Михаила Федотова. Отдельной благодарности заслуживают Максим Лядов (maxim@ixbt.com) и Павел Соколов (pavel@ixbt.com), при участии которых был подготовлен данный материал.

Спасибо за внимание. Надеюсь, хотя бы часть из приведенной выше информации окажется полезной.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *