что значит flac lossless

Есть ли разница между FLAC и mp3? Разбираемся.

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

После конвертирования, загрузил два трека — mp3 и FLAC в бесплатную программу по редактированию звука Audacity. Верхний трек это FLAC, нижний — mp3. Как видно на скрине, верхние частоты выше 16.5 кГц у mp3 начинают срезаться (см. 3). Далее выставил параметры для вывода звука Windows WASAPI (см. 1). Этот интерфейс дает максимальное качество, минуя преобразования самой винды. Включил прослушивание и начал переключаться между обоими треками, кликая на кнопку «Соло» (см. 2). Она позволяет слушать только нужный трек, автоматически приглушая другой. Слушал я на домашней неплохой мультимедийной акустике Edifier Studio R2730DB через оптический вход, а также на наушниках Audio-Technica ATH-M50 с выводом по звуковой карте ASUS Xonar Essence STX.

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Так вот, тыкал я тыкал, но так и не услышал разницы в звучании. Были небольшие нюансы, но это скорее вопрос к параметрам кодирования. Но ни на частотном диапазоне, ни на глубине сцены разницы я не почувствовал.

Часто встречаю людей, которые утверждают, что слышат разницу между FLAC и mp3. Что-ж, возможно так и есть. Скорее всего, mp3 был пожат некачественно, оттого и разница ощутима. Еще есть научное мнение, что с возрастом человеческое ухо слышит хуже высокие частоты. Мне 40 лет, и возможно, я тоже уже потерял возможность для подобных сравнений. И если уж нет разницы на домашнем оборудовании, то я точно не услышу ее и в автомобиле. Поэтому, я cконвертировал нужную мне музыку для прослушивания в авто в формат mp3. Причина простая, у меня в ГУ установлена карта памяти на 64 Гб, и с FLAC это место быстро забьется. А mp3 позволит разместить в 2.5-3 раза больше.

Даю возможность читателям послушать и сравнить. Вот архив с двумя треками. А вот ссылка на сайт Audacity.

Источник

MP3, AAC, WAV, FLAC: рассказываем обо всех форматах аудиофайлов

Сохранить и прочитать потом —

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Организуя свою коллекцию цифровой музыки, можно утонуть в разнообразии форматов аудиофайлов. Почти каждый слышал об MP3, но что такое OGG, AIFF или MQA?

Если по прочтении списка у вас возникло подозрение, что все эти форматы для получения таких шикарных аббревиатур учились в разных университетах, мы поможем развеять его. В этом материале будет прояснена суть некоторых популярных музыкальных форматов, разница между ними и то, почему это важно знать.

Что бы вы ни слушали – MP3-файлы с низким битрейтом, чуть более качественные треки в AAC или Hi-Res-аудио во FLAC или WAV – настало время разобраться в том, что именно вы получаете в каждом случае и как выбрать оптимальный формат.

Давайте оценим плюсы и минусы каждого из них.

Краткий обзор форматов файлов и кодеков

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Чтобы не ходить вокруг да около, вначале мы приведем краткую памятку по всем форматам файлов и различиям между ними. Если захотите узнать больше, ниже вы найдете более подробное описание различий в размерах, качестве звука и совместимости.

AAC (не является форматом Hi-Res-аудио). Ставшая популярной благодаря Apple альтернатива формату MP3. Со сжатием и потерями, но с более высоким качеством звука. Используется для скачивания с iTunes и трансляции с Apple Music.

AIFF (Hi-Res). Альтернатива WAV от Apple с более полными метаданными. Не особенно популярный формат без сжатия и потерь с файлами большого размера.

DSD (Hi-Res). Однобитный формат, применяемый в Super Audio CD. Существует в вариантах с частотой дискретизации 2,8 МГц, 5,6 МГц и 11,2 МГц. Из-за использования кодека высокого качества в настоящее время не применяется для стриминга. Формат без сжатия.

FLAC (Hi-Res). Формат со сжатием без потерь с поддержкой частот дискретизации, совместимых с Hi-Res, и хранением метаданных; размер файлов вдвое меньше, чем у WAV. Благодаря отсутствию лицензионных отчислений считается лучшим форматом для скачивания и хранения альбомов в Hi-Res-аудио. Его главный недостаток – отсутствие поддержки устройствами Apple (и, следовательно, несовместимость с iTunes).

MP3 (не является форматом Hi-Res-аудио). Популярный формат со сжатием и потерями с малым размером файла и далеко не самым высоким качеством звучания. Удобен для хранения музыки на смартфонах и плеерах iPod.

MQA (Hi-Res). Формат со сжатием для хранения Hi-Res-файлов в более удобной для стриминга форме. Используется сервисом Tidal Masters для трансляций Hi-Res-аудио.

OGG (не является форматом Hi-Res-аудио). Иногда называется полным именем – Ogg Vorbis. Альтернатива MP3 и AAC с открытым кодом, не подпадающая под действие патентов. Этот формат с битрейтом 320 кбит/с используется в трансляциях Spotify.

WAV (Hi-Res). Стандартный формат, в котором записаны все CD. Отличное качество звука, но огромный размер файлов из-за отсутствия сжатия. Слабая поддержка метаданных (обложек, названий песен и исполнителей).

WMA Lossless (Hi-Res). Версия Windows Media Audio без сжатия, поддержку которой уже не часто можно встретить в смартфонах и планшетах.

Аудиофайлы со сжатием и без него

Вначале рассмотрим три категории, в которые можно сгруппировать все форматы аудиофайлов. Они определяются степенью сжатия данных и связанным с ним уровнем потерь качества звучания.

Если для сжатия аудио в вашем файле не применялся специальный алгоритм (или кодек), это приведет к двойному результату: во-первых, потерь качества звучания не будет, во-вторых, место на вашем жестком диске скоро закончится.

По своей сути запись в формате без сжатия полностью соответствует оригинальному аудиофайлу, в котором зафиксированы в цифровом представлении реальные звуковые сигналы.

WAV и AIFF можно назвать самыми популярными форматами аудиофайлов без сжатия. Оба они основаны на PCM (Pulse Code Modulation, импульсно-кодовой модуляции), широко известном механизме непосредственного преобразования аудиосигнала в цифровую форму. В WAV и в AIFF применяются схожие технологии, но методы хранения данных несколько различаются. В этих форматах можно записывать как файлы CD-качества, так и более высокого разрешения.

Формат WAV был разработан Microsoft и IBM, в силу чего применяется на платформах на базе Windows; он является стандартным форматом записи компакт-дисков.

Формат AIFF создан компанией Apple как альтернатива WAV; и хотя AIFF-файлы менее распространены, они обеспечивают более полную поддержку метаданных, позволяя хранить обложки альбомов, названия песен и тому подобную информацию.

Недостаток этих форматов – требование гигантских объемов памяти. Файлы CD-качества (16 бит, 44,1 кГц) занимают около 10 МБ дискового пространства на минуту звучания.

ALAC, FLAC, WMA Lossless: аудиоформаты без потерь

Все мы любим FLAC. Формат без потерь, файлы во FLAC (Free Lossless Audio Codec, бесплатный аудиокодек без потерь) по размеру почти вдвое меньше, чем в WAV или AIFF без сжатия с эквивалентной частотой дискретизации, однако в плане звучания никаких потерь качества не заметно. FLAC также поддерживает более высокое разрешение по сравнению с CD-качеством – до 32 бит и 192 кГц.

Помимо FLAC, есть и другие форматы без потерь – ALAC (Apple Lossless) и WMA Lossless (Windows Media Audio). Первый представляет собой отличную альтернативу для iOS и iTunes, хотя размер файлов чуть выше, чем у FLAC. Не все смартфоны и планшеты поддерживают его.

AAC и MP3: аудиоформаты с потерями

Кто не слышал про MP3? Все про него слышали. Этот самый распространенный аудиоформат удобен для хранения музыки на плеерах iPod или планшетах и поддерживается практически любыми устройствами. Однако для этого приходится жертвовать значительным объемом информации. Для того чтобы уменьшить размеры файлов на порядок по сравнению с записями в CD-качестве, необходимо отбросить значительный процент исходных данных, что приводит к потере качества звучания.

Битрейт, с которым записан MP3-файл, тоже влияет на качество звука. MP3 с битрейтом 128 кбит/с теряют больше информации, чем файлы с 320 кбит/с (это расшифровывается как «килобит в секунду», где каждый «бит», в сущности, представляет собой крохотный кусочек песни). Учитывая резкое снижение стоимости памяти, в наше время нет никаких причин слушать файлы с битрейтом 128 кбит/с; MP3 с 320 кбит/с имеют смысл при ограниченном объеме памяти, они также остаются стандартным форматом для скачивания файлов Интернет-магазинов.

Еще один формат с потерями, AAC (Advanced Audio Coding, усовершенствованное кодирование звука), также предполагает сжатие, как и MP3, но благодаря несколько более эффективным алгоритмам обеспечивает более качественный звук. AAC используется для скачивания с iTunes и трансляций с Apple Music (с битрейтом 256 кбит/с), а также в передачах с YouTube.

Формат Vorbis, нередко называемый Ogg Vorbis, чтобы подчеркнуть использование контейнера Ogg, представляет собой альтернативу MP3 и AAC с открытым кодом, не подпадающую под действие патентов. Этот формат с битрейтом 320 кбит/с используется в трансляциях Spotify.

Если вы планируете использовать форматы с потерей информации, учитывайте следующий факт: повышение числа «бит» обычно ведет к росту качества звучания, однако оно во многом зависит от эффективности кодека, с помощью которого выполняется преобразование файла. Если большая часть музыки в вашей коллекции закодирована с битрейтом 128 Кбит/с, то вы могли заметить, что, несмотря на принципиальное сходство звучания, из-за низкой эффективности кодека MP3-файлы, скорее всего, будут слушаться несколько хуже AAC или Ogg Vorbis.

Как насчет музыки в высоком разрешении?

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

В отличие от HD-видео, для аудио высокого разрешения пока не разработано универсального стандарта.

Если не вдаваться в подробности, под этим термином обычно понимаются записи с более высокой частотой дискретизации и/или разрядностью, чем у CD (т.е. 16 бит/44,1 кГц). Примерами Hi-Res-аудио могут служить файлы с параметрами 16 бит/96 кГц или 24 бит/192 кГц.

Благодаря наличию дополнительной аудиоинформации Hi-Res-файлы звучат намного лучше в сравнении с компрессированными файлами, теряющими эту информацию в процессе сжатия. Эти форматы требуют больше места на диске, но их качество определенно стоит таких затрат.

К Hi-Res-аудио относятся форматы без сжатия, такие как AIFF и WAV, а также без потерь – FLAC и ALAC. DSD (отчасти нишевый формат, применявшийся в Super Audio CD) также входит в категорию Hi-Res-аудио, но его поддерживает гораздо меньшее число устройств. Если говорить о стриминге, то такие сервисы, как Tidal Masters, используют упаковщик MQA, позволяющий передавать по сетям файлы в высоком разрешении с использованием минимально возможной полосы пропускания сигнала.

Что касается воспроизведения форматов Hi-Res-аудио, то сегодня его поддерживает уже немало устройств. 24-разрядные файлы способны проигрывать беспроводные колонки Denon HEOS, а также портативные музыкальные плееры премиум-класса – такие как Cowon Plenue D2 и Astell & Kern A&norma SR15.

Кроме того, с Hi-Res-аудио совместимы большинство флагманских моделей смартфонов под Android – например, удостоенный высших оценок Samsung Galaxy S10+ – однако прослушать их на новеньком iPhone вам сходу не удастся. Мы нашли способы обойти это ограничение, но нельзя забывать о том, что файлы Hi-Res-аудио пока еще не настолько компактны, как их аналоги в форматах с потерями.

Какой аудиоформат будет лучшим для вас?

Выбор формата зависит от того, что вас больше волнует – объем памяти или качество звучания – а также от того, с каким устройством вы намерены его использовать.

Популярность MP3 сложилась в эпоху, когда стоимость дискового пространства была очень высока. Сегодня смартфоны, музыкальные плееры и ноутбуки оснащаются памятью внушительного объема, так что есть смысл обратить внимание на форматы с качеством выше, чем у CD.

Если же вы решили архивировать свои аудиофайлы, FLAC или другой формат без потерь может стать неплохим вариантом. Они представляют собой удачный компромисс между уровнем сжатия и качеством звучания, позволяя слушать высококачественную цифровую музыку и сэкономить дисковое пространство. Только не забудьте проверить совместимость выбранного формата и имеющихся устройств.

Подготовлено по материалам портала «What Hi-Fi?», март 2020 г.

Источник

MP3 VS FLAC. Как услышать разницу?

Сохранить и прочитать потом —

Вместе с виниловыми пластинками и компакт-дисками наша фонотека всё чаще пополняется музыкальными файлами в МР3 и Flac. Многие считают эти два формата непримиримыми врагами, а кто-то уверен, что разница между ними невелика. Так ли это?

Пицца. Испечённая в настоящей дровяной печи, с лёгким запахом дымка, неповторимым вкусом двух сыров, сплавленных в единое целое. Этот ароматный хлебный блин, хрустящий по краям. Эта невероятно душистая начинка, одновременно играющая несколькими вкусами и запахами. Это праздник вкуса и сытности. Иногда так хочется пиццы, что берёшь обычный магазинный хлеб, тонко режешь, кладёшь сверху мелко порезанную ветчину, покрываешь сыром. И ставишь на пару минут в микроволновку. Конечно, этим можно наесться, но не будет того восторга, какой присутствует при поедании пиццы, приготовленной мастером.

Нет-нет, мы не собираемся печь фирменную пиццу или открывать итальянский ресторанчик. Этим наглядным примером мы показываем разницу между сжатым и несжатым форматами звука.

О форматах.

Немного истории. Формат MP3 (MPEG-1/2/2.5 Layer 3) появился в 1994 году. Помните те времена? О гигабайтах речь и не шла, сотни мегабайт стоили солидных денег, а многие ещё помнили легендарную фразу Билла Гейтса: «640 КБ памяти с избытком хватит любому компьютеру». И если достоверность этой фразы до сих пор подвергается сомнению, то уже в 94-м году никто не сомневался в том, что музыка будет распространяться через интернет, а файлы храниться на компьютере. Согласитесь, хранить всю свою фонотеку на жёстком диске и иметь возможность брать её с собой куда угодно – это отличная идея! Однако, на тот момент основным носителем «цифровой музыки» был CD.

Стандартный компакт-диск вмещает в себя 650 мегабайт или 74 минуты музыки с битрейтом 1411,2 кбит/с. Для того, чтобы сохранить в первозданном качестве с десяток альбомов в 94-м году требовалось иметь очень солидную сумму! Да и персональный компьютер стоил тогда немало, а основной задачей появившегося МР3 была возможность передавать звук через каналы с низкой пропускной способностью. По тем временам для передачи целого CD через интернет требовалось в лучшем случае несколько десятков часов. Поэтому перед разработчиками стояла задача сократить размер звукового файла насколько это возможно, избегая потерь при сжатии сигнала до минимума. Однако, технологии кодирования были ещё не совершенны, а процессоры не настолько быстры, поэтому было решено применить психоакустический метод, при котором теряется только часть звуковой информации. Например, все «тихие» звуки выше 17 кГц и все басы ниже 40 Гц. Разработчики установили несколько степеней сжатия таких файлов, взяв за основу измерения качества цифровой поток – чем больше информации передаётся в секунду времени, тем выше качество звука, но и больше размер файла. Максимальным битрейтом в МР3 принято считать 320 кбит/с, при котором звучание сбалансировано, а качество максимально близко к оригиналу.

И вот это самое «максимально близко» и не даёт покоя любителям хорошего звука до сих пор. Дело в том, что прослушивание музыки на качественной аппаратуре позволяет в полной мере почувствовать разницу между оригинальной записью и её MP3-версией даже при 320 кбит/с.

Положа руку на сердце, признаемся, что слушать музыку можно и при битрейте 64 кбит/с. Если хочется именно услышать любимую мелодию, то никакие преграды не страшны. Можно даже самому наиграть на ближайшем музыкальном инструменте, если есть навык, или послушать через динамик телефона. Однако, если хочется насладиться произведением, в котором будут сохранены все нюансы и заложенные эмоции, его интерпретацией звукорежиссёром и манерой игры исполнителей, то МР3 (как, собственно, и любой другой формат сжатия с потерями) не будет в радость, равно как и воспроизведение великолепно записанного и изданного CD на посредственном аппарате.

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

О том, как качественно воспроизвести сжатое аудио именно на высококлассном Hi-Fi задумались разработчики формата Flac. На самом деле FLAC (Free Lossless Audio Codec – «бесплатный аудиокодек для сжатия без потерь») появился всего лишь через 6 лет после МР3. Однако, технологии кодирования за это время ушли далеко вперёд, что позволило создать кодеки, сжимающие аудиосигнал без потерь. Конечно, сделать файл меньше, чем в МР3 не удалось, однако пользователи сейчас располагают на порядок более ёмкими хранилищами, поэтому пара сотен мегабайт на альбом – это сущая мелочь. Не правда ли?

Оба этих формата имеют довольно широкое распространение. Практически все операционные системы умеют воспроизводить их при помощи штатных или сторонних проигрывателей. МР3 поддерживает чуть ли не вся линейка звуковоспроизводящих устройств, в том числе и относящихся к классу High End. С Flac (и его аналогами) ситуация чуть иная – некоторые производители до сих пор упорно игнорируют этот способ сжатия. Как бы то ни было, у простого меломана всегда есть выбор между этими двумя форматами. Но, вместе с выбором появляются и вопросы, а услышит ли он разницу между Flac и МР3? Попробуем разобраться.

Мобильные устройства.

Для меломанов, предпочитающих прослушивание музыки на мобильных устройствах, разницы практически не будет. Современные смартфоны за редким исключениям оснащаются не самым качественным аудиотрактом. Тем более, если использовать штатные наушники-вкладыши или Bluetooth-колонку. В обоих случаях пропускная способность аудиотракта невелика, поэтому все записи будут бедны на микронюансы записи и динамику. Но! Производители постепенно изменяют эту ситуацию. Например, корейская компания LG наладила выпуск смартфона V20 со встроенным модулем Hi-Fi Quad DAC, имеющим декодеры для воспроизведения всех популярных аудиоформатов, в том числе аудиофильских и профессиональных. В комплекте со смартфоном поставляются высококачественные наушники Bang & Olufsen. Вот на этом устройстве разница между MP3 и Flac слышна достаточно хорошо. В остальных случаях меломану, желающему слушать музыку со своего телефона, пока что стоит присмотреться к внешнему специализированному ЦАП и наушникам. Например, линейка портативных усилителей для наушников FiiO со встроенным ЦАП вполне способна передать все нюансы записи во Flac, если её использовать вместе с хорошими накладными наушниками. Кстати, подойдут даже «вкладыши», но только не дешёвые, продающиеся на каждом углу, а произведённые серьёзными аудиобрендами.

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Альтернатива? Да, возможна. Это не многофункциональное устройство, а высококачественный портативный аудиоплеер. В таком аппарате, как правило, установлен качественный цифро-аналоговый преобразователь, а в аудиотракте используются отборные компоненты. И вся конструкция подчинена одной цели – высококачественному воспроизведению звука. Поэтому, кроме, собственно говоря, музыкального плеера, в корпусе нет ничего, что бы помешало отличить Flac от МР3.

Домашний Hi-Fi.

Здесь всё гораздо прозаичнее. Отличить качественную фонограмму от некачественной можно на любом современном компоненте аудиосистемы. Причем, чем дороже система, тем более ярко выраженными и неприятными будут звуковые артефакты, присущие сжатым с потерями композициям. И тем ярче, выразительнее будет исполнение при воспроизведении файлов со сжатием без потерь. Если вы легко и сразу замечаете разницу между воспроизведением Flac и MP3, то компоненты домашней системы у вас хорошие. Ещё одним камнем преткновения, не позволяющим ощутить её, является проигрыватель. Файлы можно воспроизводить, напрямую подключив жёсткий диск с ними к дисковому или мультимедийному плеерам, а также к ряду ресиверов и усилителей, оборудованных встроенным USB-медиапроигрывателем. Как правило, в низкокачественном аппарате экономят на всём, поэтому элементная база там подвергается всевозможным помехам от рядом работающих блоков, а цифро-аналоговый преобразователь обрабатывает поток не на самом высоком уровне, допуская массу ошибок. Всё это сказывается на итоговом аналоговом сигнале, который после всего этого уже невозможно восстановить. Как если бы вы закрыли свои колонки полотенцем или подушкой. Кто знает, какой был бы сигнал без неё? А значит, мы опять приходим к тому, что отличить МР3 и Flac на такой системе будет невозможно. Выход? Использовать в своей домашней Hi-Fi системы только качественные компоненты – от источника и усилителя до акустики и даже кабелей.

То, что сейчас практически вся музыка хранится дома в качестве файлов, которые можно послушать либо на домашней системе, либо взять с собой и послушать в пути, в отпуске, на занятиях или где-то ещё, это отлично. Это прогресс, с которым надо считаться. Однако, не стоит забывать о том, что от музыки мы в первую очередь получаем удовольствие. Как и от хорошей пиццы. И не советуем вам отказывать себе в этих удовольствиях. Они – это показатель качества жизни и источник нашего позитивного настроения и положительных эмоций.

Источник

Психоакустика, lossless и что еще я знаю об аудио-стандартах

Относительно недавно попалось мне на глаза хоть и студенческое, но все-таки, на мой взгляд, интересное видео из «Курилки Гутенберга» под названием «Психоакустика: звуковые иллюзии». Видео вдохновило меня порыться уже в своих студенческих конспектах и материалах…

Признаюсь честно, я не очень любил предмет Audio Coding, будучи студентом TU Ilmenau на программе Communication and Signal Processing — стресс и юношеский максимализм делали свое темное дело. Однако, со стороны чаще я слышал противоположную точку зрения: «Классный предмет, че ты жалуешься? Один из ваших лекторов — сам Карлхайнц Брандербург — лови момент!»

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
Один из главных разработчиков формата MP3, если вы не узнали, позирует в наушниках. (источник изображения)

По прошествии времени я, конечно, пересмотрел свой взгляд на данный предмет. Знание на стыке цифровой обработки сигналов, биологии, физики и вычислительной техники — это же круто! Одна тема уже упомянутой психоакустики чего только стоит.

И вот однажды мне пришла в голову очередная авантюрная мысль, и я сказал себе: «Почему бы не написать научно-популярную статью про аудиокодинг? Так сказать, «для самых маленьких» — для таких же студентов, коим был и я»?

Структура статьи

Перечислим темы, о которых будем говорить.

Что ж, для матерых знатоков темы вряд ли найдется что-то новое, вещи довольно базовые, однако я буду рад дополнениям и корректировкам в комментариях! Всем заглянувшим заранее спасибо!

Введение

Я думаю, ни для кого из интересовавшихся темой аудиостандартов не секрет, что существуют в Мире две большие (и непримиримые между собой) парадигмы развития этих самых стандартов. А именно:

За первыми закрепилось звание тяжеловесных стандартов для меломанов. За вторыми стоит многолетняя практика применения: начиная от некачественных подборок музыки на дисках для MP3-плееров, кончая современными (достаточно качественными) потоковыми сервисами прослушивания музыки.

Если в двух словах, то первые стараются максимально точно воспроизвести исходный аудио-файл, убирая лишь избыточность (см. redundancy), а вторые на основе целой теории о том, как человек воспринимает звук, стараются максимально сжать исходный аудио-файл при минимально возможных потерях качества.

А теперь предлагаю поговорить об обеих концепциях чуть подробнее.

Перцептивные кодеки

Начнем со второй группы кодеков, а именно с их обобщенной схемы:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
Рис. 1. Обобщенная структурная схема перцептивного кодирования.

Штука слегка специфичная, однако, людям работающим в сфере цифровой обработки сигналов, я думаю, знакомая. Нужен этот блок для того, чтобы разбить входной сигнал на диапазоны и через это иметь больше степеней свободы для компрессии.

Если кто-то интересуется тематикой могу предложить следующие ресурсы:

Это классика. Проходят данные темы обыкновенно в купе с азами теории информации, и потому по данной тематике есть целая база знаний из всевозможных семинаров на различных языках программирования (поэтому сегодня обсуждать подробно мы их не будем).

И вот по данному пункту хотелось бы поговорить более подробно. Ведь именно он и является основной точкой расхождения двух названных выше парадигм.

И начнем мы, так сказать, с самых основ — с биологии.

Анатомия — это ужас как интересно

Прежде чем говорить о том, как именно человек воспринимает звук, и какие математические модели под это можно подвести, поговорим о главном: что вообще позволяет человеку воспринимать звук?

Конечно же, слуховая система (auditory system)! А если быть точным, то преимущественно внутреннее и среднее ухо и их конкретные составляющие:

Рис. 2. Внутреннее строение человеческого уха.

Всё, вроде бы, интуитивно понятно, при условии некоторого багажа школьных знаний. Затруднение обычно вызывает только улитка: что значит эта заумная фраза: «индуцирует бегущие волны по длине базилярной мембраны»?

Как это ни парадоксально, но тут тоже всё достаточно просто. Во-первых, перечислим из чего состоит ушная улитка:

Барабанная перепонка передаёт звуковые колебания косточкам среднего уха; что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac losslessкосточки среднего уха передают колебания переимфе и эндолимфе; что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac losslessпод действием колебаний перелимфы и эндолимфы колеблется и базилярная мембрана; что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac losslessиз-за движений базилярной мембраны волосковые клетки вырабатывают сигналы, которые передаются нервным клеткам.

Подробнее предлагаю прочитать здесь и здесь.

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 3. Внутреннее строение человеческого уха: базилярная мембрана в «развернутом» виде (ссылка на источник иллюстрации).

Благодаря форме базилярной мембраны (сужается к основанию) и тому, что к разным участкам данной мембраны подсоединяются клетки, отвечающие за восприятие разных частот, ушная улитка — это нелинейная система с частотной избирательностью.

А что если посмотреть на ушную улитку глазами цифровой обработки сигналов?

С точки зрения ЦОС, ушная улитка — это банк полосовых фильтров. При этом фильтры сильно перекрывают друг друга.

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
Рис. 4. Отклики тона в разных местах базилярной мембраны [1, c. 63].

Что изображено на рисунке:

Добрые люди нарисовали уже и полезные структурные схемы:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 5. Часть схемы модели восприятия (см. PEMO Model), касающаяся базилярной мембраны.

Перекрывающиеся фильтры показаны, на мой взгляд, очень наглядно.

В какой-то момент знание об ушной улитке, как о банке фильтров, решили как-то уложить в простую и доступную модель. В ходе ряда аудиторных экспериментов [1, c.82-85] ученые определили, что:

у частотных групп, на которые базилярной мембраной разбивается аудио-сигнал, фиксированная ширина полосы;

ширина полосы частотной группы зависит от средней частоты группы нелинейно.

Более того, для удобства, договорились считать, что фильтры нашей слуховой системы прямоугольные.

Всё вышеперечисленное в конечном итоге было обобщено в понятие шкалы Барков — шкалы критических диапазонов частот (см. RWTHxCA101 — Critical bands), ширина которых нелинейно зависит от средней частоты:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
Рис. 6. Шкала Барков (источник).

Давайте, запомним этот факт, он нам еще пригодится.

Пока искал иллюстрации по шкале Барков наткнулся на это изображение:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
bark scale by spooninglive

Хорошо, теперь мы чуть лучше представляем, что за система позволяет нам слышать. Более того мы выяснили, что органы слуха — это нелинейная частотно-избирательная система. Мы даже выяснили как устроена ее избирательность с точки зрения ширины критических диапазонов.

Но мы пока не говорили, одинаково ли мы слышим те или иные частоты. Быть может, есть какие-то подходящие эксперименты?

Порог в тишине

Конечно же, такие эксперименты есть. Более того, проведены такие эксперименты уже давно. Например, Эберхард Цвикер описывает один из них следующим образом [1, c. 63]:

Перед испытуемым, регистрирующим порог слышимости, ставится задача изменять при помощи переключателя уровень звукового давления так, чтобы с уверенностью отмечались моменты едва заметного появления и исчезновения звука. При этом перо самописца вычеркивает на бумаге зигзагообразную полосу, состоящую из вертикальных штрихов, в пределах которой окажутся те значения давления, для которых нет уверенности, был ли слышен звук или нет.

В конечном итоге, собрали 100 таких замеров от людей обоих полов в возрасте 20-25 лет и посчитали усредненные значения.

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 7. Усредненные кривые порога слышимости для молодых испытуемых со здоровым слухом. [1, c. 64]

А потом медиана (кривая между 10% и 90% на рис. 7) была названа порогом слышимости (или «порогом в тишине«) и вошла в стандарты (в том числе и наш ГОСТ).

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 8. Порог слышимости в тишине (threshold in quiet, hearing threshold), уровень риска повреждения органов слуха (risk of damage), уровень болевых ощущений (threshold of pain) (источник). Да, боль не предупреждает об опасности, а просто констатирует факт негативного влияния на слух.

Под это есть даже специальная формула:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

где что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless— это, как нетрудно догадаться, частота в килогерцах.

Проговорим суть порога слышимости ещё раз: чтобы какой-либо звук мог быть услышан, он должен превысить значение «порога в тишине». То есть эволюция все расставила так, что мы почти гарантированно услышим звуки вблизи 2-4 кГц, однако, почти так же гарантированно не услышим слишком низкие и слишком высокие частоты.

Порог в тишине в том виде, в котором он представлен на рисунке 5, актуален как правило для усредненной группы именно молодых людей. С возрастом восприятие высоких частот меняется:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

В свое время этот факт, насколько я знаю, стал основой для тиражирования среди подростков ультразвукового сигнала вызова телефона: предполагалось, что взрослые (например, учителя) его слышать не будут, и поэтому не станут раздражаться на посторонние шумы. Ну, в годы моей молодости ничего, кроме «пыток» одноклассников раздражающим и назойливым звуком посреди урока со стороны кучки «пассионариев», эта идея не принесла…

Почему к данной кривой применяется словосочетание «в тишине»?

Потому что предполагается, что так люди воспринимают звук в отсутствии посторонних шумов. При появлении шума порог будет, как бы, «приподниматься». В случае широкополосного шума картина станет такой:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 8. Уровни порогов маскирования (термин обсудим ниже) белым шумом в зависимости от частоты тестового тона. Пунктиром отмечен уклон (slope) кривых на высоких частотах. [2, c. 62]

А в случае узкополосных шумов?

Маскинг (на пальцах)

В случае узкополосных шумов порог слышимости будет выглядеть так:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 9. Уровни, показывающие начало слышимости тестового тона, замаскированного тонами шириной критических диапазонов с центральными частотами 250 Гц, 1 кГц и 4 кГц и уровнем 60 дБ. [2, c. 64]

Быть может, моя следующая аналогия будет не совсем точной, но я вот смотрю на эту иллюстрацию и вижу, будто покрывало (порог слышимости) приподнимают снизу чем-то, вроде палки (тон) — и появляются скаты во все стороны (влияние на соседние частоты). И все, что под покрывалом, скрыто от наблюдателей. Замаскировано…

Этот феномен называют эффектом частотного маскирования (frequency masking). То есть шумы маскируют собой более слабые сигналы в частотной области.

Иными словами достаточно сильный тон влияет еще и на своих соседей. Выглядит это примерно так:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 10. Пример маскирования одного тона другим тоном более высокой частоты (источник).

То есть, иначе говоря, более сильный тон замаскировал своего более слабого соседа, и поэтому сосед перестал быть заметным для слуховой системы. Функция, которая определяет порог маскирования, называется функцией распространения (spreading function) и вычисляется на основе эмпирически полученных коэффициентов и шкалы Барков (формулы можно найти, например, в Википедии — см. Одновременная маскировка (Психоаккустика)).

Существует, к слову, и временное маскирование (маскирование во временной области): громкий сигнал маскирует собой как следующий за ним более слабый, так и предшествующий ему более слабый сигналы. Согласен, вторая часть утверждения звучит немного странно, но нужно все же держать в голове, что органы слуха и восприятия — это система со своей инерцией и задержками.

Возникает вопрос: зачем вообще тратить память на запись того, что в принципе не будет услышано?

Именно эта идея и стала базовой для перцептивных стандартов: удаляется не только избыточность на уровне эффективного кодирования, но и избыточность с точки зрения модели восприятия (irrelevance). Проводится такая «очистка» нерелевантных звуков на этапе квантования.

Подробно о процедуре квантования на основе психоаккустической модели можно прочитать здесь: Audio Coding Quantization and CodingMethods by Prof. Dr.-Ing. Karlheinz Brandenburg.

Суть состоит в том, что внутри каждого диапазона, полученного со входа банка фильтров, динамически вычисляется порог маскирования, и на его основе каждый отсчет квантуется и кодируется с таким шагом квантования, чтобы шум квантования оставался ниже некоторого допустимого порога.

А что же у lossless?

Если кратко, то данные форматы придерживаются двух основных принципов:

Структурная схема кодера выглядит так [3]:

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless
Рис. 11. Lossless-кодер.

Сначала аудио-сигнал разбивается на фреймы (кадры) в целях достижения изменяемости: работа осуществляется не со всем тяжеловесным исходником, а только с его частью — с фреймом (не слишком большим, но и не слишком малым).

Далее идет первый этап избавления от избыточности — декорреляция отсчетов (сэмплов) внутри фреймов. Звучит немного заумно, но на практике ничего сложного. Проследим на примере самой, пожалуй, распространенной реализации — на примере кодирование с предсказанием (на основе линейных фильтров):

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 12. Схема кодера с предсказанием.

Предиктор (предсказатель) высчитывает некоторое значение, предполагаемое на основе предыдущих отсчетов; исходя из него вычисляется ошибка предсказания e(n), и именно она сжимается дальше эффективными кодеками. За счет этого происходит некоторая экономия памяти без потери качества.

Здесь важно, чтобы кодер и декодер были абсолютно идентичными, вплоть до выбора метода округления (обычно выбирается стандарт из IEEE).

что значит flac lossless. Смотреть фото что значит flac lossless. Смотреть картинку что значит flac lossless. Картинка про что значит flac lossless. Фото что значит flac lossless

Рис. 13. Схема декодера с предсказанием.

Более подробно о предиктивном кодировании, а также о гибриде lossless с перцептивными подходами можно прочесть здесь: Prediction and Lossless Audio Coding Prof. Dr.-Ing. Karlheinz Brandenburg.

Вот такая лаконичная idea behind, в общем-то.

Мысли вслух (вместо послесловия)

Надеюсь смог хоть немного приоткрыть завесу идей, лежащих в основе. Рад буду вашим замечаниям и комментариям!

Слушайте хорошую музыку хорошего качества удобным для вас способом!

Литература

Цвикер Э., Фельдкеллер Р. Ухо как приемник информации //М.: Связь. – 1971.

Zwicker E., Fastl H. Psychoacoustics: Facts and models. – Springer Science & Business Media, 2013. – Т. 22.

M. Hans and R. W. Schafer, «Lossless compression of digital audio,» in IEEE Signal Processing Magazine, vol. 18, no. 4, pp. 21-32, July 2001.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *