Аудіо-формати - це різновиди файлів, призначені для зберігання цифрових аудіоданих в комп'ютерній системі. Бітова компонування аудіоданих (за винятком метаданих) називається форматом кодування аудіо та може бути нестиснутій або стислій. Стиск використовується для того, щоб зменшити розмір файлу, що часто поєднується з втратою якості звуку. Звук також може бути сирим бітовим потоком у форматі кодування аудіо, але зазвичай він вбудовується в формат аудіоданих з певним шаром зберігання.
Що вони собою являють?
Аудіофайл - це набір інформації, який складається з даних про частоту і амплітуду звуку, збережений для наступних програвань. Аудіо-формати можуть грати роль контейнера для необроблених даних, а також використовувати аудіокодеків. Найчастіше ці поняття змішують і плутають. Кодек виконує кодування і декодування необроблених аудіоданих, в той час як ці закодовані дані зазвичай зберігаються у файлі-контейнері. Незважаючи на те що більшість форматів звукових файлів підтримують тільки один тип даних кодування аудіо (створених з допомогою аудиокодера), формат мультимедійного контейнера (наприклад, Matroska або AVI) може підтримувати кілька типів аудіо - і відеоданих.
Різновиди за обсягом і якістю
Формати аудіо-файлів можуть бути виділені наступні групи: 1. Стиснені – такі як WAV, AIFF, AU або необроблені PCM без заголовків. 2. Формати зі стисненням без втрат – приміром, FLAC, AudioMonkey's (розширення файлу .ape), WavPack (розширення файлу .wv), TTA, ATRAC AdvancedLossless, ALAC (розширення імені файлу .m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (WMA без втрат) і Shorten (SHN). 3. Формати з компресією із втратами якості – наприклад, Opus, MP3 Vorbis, Musepack, AAC, ATRAC і Windows Media Audio Lossy (стислі WMA).
Основний тип
Одним з основних нестиснутих аудіоформатів є LPCM. По своїй суті він являє собою різновид PCM і подібний Digital Audio (формат аудіо CD-дисків). Він є різновидом, найбільш широко використовуваної низькорівневими API і цифроаналоговыми перетворювачами. Незважаючи на те що LPCM може зберігатися на комп'ютері у вигляді необробленого звукового формату, він зазвичай знаходиться в WAV файлі Windows або в .aiff на macOS.
WAV і AIFF
Цифровий аудіо AIFF заснований на форматі файлу обміну (IFF), а WAV - на аналогічній різновиди файлу обміну ресурсами (RIFF). WAV і AIFF призначені для зберігання широкого спектру аудіоформатів як без втрат якості, так і з втратами. Вони просто додають невеликий заголовок, що містить метадані, перед звукової складової, щоб позначити формат аудіо (наприклад, LPCM з конкретної частотою дискретизації, бітовою глибиною, порядковими номерами і кількістю каналів). Оскільки WAV і AIFF широко підтримуються і можуть зберігати LPCM, вони є придатними файловими форматами для зберігання та архівування оригінального запису.
Нове покоління
BWF (Broadcast Wave Format) - це стандартний аудіо, створений Європейським радіомовним союзом в якості наступника WAV. Він має масу поліпшень, серед яких можливість зберігати більш надійні метадані у файлі. Це основний формат запису, який використовується у багатьох професійних робочих станціях в телевізійній і кіноіндустрії. Файли BWF включають в себе стандартизовану мітку часу, яка дозволяє легко синхронізувати звук з окремим елементом зображення. Автономні багатодоріжкові рекордери AETA, Sound Devices, Zaxcom, HHB Communications Ltd, Fostex, Nagra, Aaton, і TASCAM завжди використовують BWF як бажаний формат.
Аудіоформати зі стиском і без
Така різновид зберігає дані в меншому обсязі без втрати інформації. Вихідні дані при цьому можуть бути відтворені з такої версії. Незжате аудіо-формати кодують звук і тишу з однаковою кількістю бітів в одиницю часу. Кодування хвилини абсолютної тиші створює файл такого ж розміру, як і хвилини музики. Проте в стислому форматі музика буде займати менший файл, ніж оригінальна запис, а тиша майже не буде займати місця.
Формати аудіо-файлів такого типу включають в себе FLAC, WavPack, AudioMonkey, ALAC (Apple Lossless). Вони забезпечують коефіцієнт стиснення близько 2:1 (тобто файли займають половину простору PCM). Розробка форматів стиснення без втрат спрямована на скорочення часу обробки при збереженні хорошої якості звуку.
Стислий аудіоформат з втратами
Це дозволяє ще більше зменшити розмір файлу, видаливши частина аудіоінформації і спростивши дані. Це, звичайно ж, призводить до того, що якість аудіо-форматів стає значно гірше. При цьому використовуються різні методи (частіше шляхом використання психоакустики, щоб видалити частини звуку, які найменш впливають на сприймається якість, і мінімізувати кількість чутного шуму, доданого під час процесу стиснення. Популярний MP3-формат, мабуть, виступає найвідомішим прикладом. Крім того, AAC, який можна знайти в iTunesMusicStore, також широко поширений. Більшість форматів пропонують різний діапазон ступенів стиснення, зазвичай вимірюється в бітовій швидкості. Чим нижче швидкість, тим менше файл, і тим значніше втрата якості.
Які формати відомі в даний час?
.3GP формат мультимедійного контейнера, який може містити власні формати AMR, AMR-WB або AMR-WB+, а також деякі відкриті різновиди. .AAC (Advanced Audio Coding) - заснований на стандартах MPEG-2 і MPEG-4. Файли AAC зазвичай являють собою контейнери ADTS або ADIF. .AAX (Audible.com) - формат аудіокниги, який представляє собою файл M4B із змінним бітрейтом (що забезпечує високу якість), зашифрований за допомогою DRM. MPB містить AAC - або ALAC-кодований звук в контейнері MPEG-4.
.AIFF - стандартний формат звукового файлу, який використовується Apple. Його можна вважати еквівалентом WAV. .AMR (AMR-NB) – тип аудіо, використовується в основному для запису мови. .APE (Ashland monkey's) – формат аудіо зі стисненням без втрати якості. .M4A аудіо в MPEG-4 використовуваний Apple для незахищеної музики, завантаженої з iTunes Music Store. Аудіо у файлі M4A зазвичай кодується AAC, хоча ALAC також може використовуватися без втрат якості. .M4P - Apple-версія AAC з патентованим керуванням цифровими правами, розроблена Apple для використання у музиці, завантаженої з iTunes Music Store. .MMF– вид аудіо від Samsung, який використовується в мелодії дзвінка. Він був розроблений Yamaha і являє собою формат мультимедійних даних. .MP3 -формат MPEG Layer III Audio. Це найпоширеніший вид звукового файлу, який використовується сьогодні. Також він відомий як MPEG-1 або MPEG-2 і являє собою своєрідний формат аудиокодирования для цифрового звуку. Він використовує форму стиснення даних з втратами для кодування інформації з застосуванням неточних наближень і відкидання часткових даних. Все це виконується з метою зменшення розмірів файлів, як правило, у 10 разів, порівняно з компакт-диском. При цьому зберігається якість звуку, порівнянне з несжатым. Порівняно з цифровим аудиокачеством CD, якість стиснення MP3 зазвичай досягає 75-95 % по зменшенню розміру. Таким чином, файли цього типу складають від 1/4 до 1/20 розміру вихідного цифрового аудіопотоку. Це важливо для забезпечення передачі і зберігання файлів, особливо в наші дні, коли обмін інформацією поширений дуже широко. Основою для такого порівняння є формат цифрового аудіо CD, який вимагає 1411200 біт/с. Зазвичай використовуваної налаштуванням кодування MP3 є CBR 128 кбит/з, в результаті виходить файл розміром 1/11 (= 9 %) від розміру вихідного файлу якості CD, тобто з 91 % стисненням. Стиснення MP3 з втратою працює, зменшуючи (або наближаючи) точність деяких частин безперервного звуку, які вважаються недоступними для слухового дозволу більшості людей. Цей метод зазвичай називають перцепционным кодуванням або «психоакустикой». Він використовує психоакустичні моделі для відкидання або зменшення точності компонентів, менш чутних для людського слуху, а потім записує решту інформацію ефективним чином.
.MPC (раніше відомий як MPEGplus, MPEG+ або MP+) - являє собою аудіокодек з відкритим вихідним кодом, спеціально оптимізований для прозорого стиснення стерео/аудіо з бітрейтом 160-180 Кбіт/с. Формат .OGG, .OGA, MOGG - вільний відкритий контейнерний тип, що підтримує безліч інших видів, найпопулярнішим з яких є аудіоформат Vorbis. Він пропонує стиснення, подібний до MP3 але менш популярне. VJGG (Multi-Track-Single-Logical-StreamOgg-Vorbis) є багатоканальним або многодорожечным файловим формат OGG. .WAV - стандартний формат файлу звукового файлу, який використовується в основному на ПК з ОС Windows. Зазвичай використовується для зберігання нестиснутих (PCM) звукових файлів якості CD, що означає, що вони можуть бути більшими за розміром - близько 10 МБ в хвилину. Ці файли можуть містити дані, закодовані за допомогою різних кодеків, для зменшення розміру (наприклад, переведення у формат GSM або MP3). WAV-файли використовують структуру RIFF. Цей формат найбільш добре зберігає якість файлів. .WMA - формат Microsoft Windows Media Audio. Розроблений з можливостями керування цифровими правами (DRM) для захисту від копіювання. Раніше був поширений так само широко, як формат OGG або MP3. .WV - формат, створений для відео у форматі HTML5.
Для аудіокниг
.AOT Audible.com - контейнер аудіокниги з низьким бітрейтом з DRM, який містить аудіо, закодоване як MP3 або ACELP-мовний кодек. .M4B - розширення аудіокниги/подкасту з кодуванням AAC або ALAC в контейнері MPEG-4. Обидва формати можуть містити метадані, включаючи маркери глав, зображення і гіперпосилання. Крім того, M4B допускає закладки (запам'ятовування останнього місця прослуховування), в той час як M4A цього не робить.
Розроблені для певної мети
.ACT - це стислий аудіоформат ADPCM до 8 кбіт/с. В ньому відбувається запис з більшості китайських MP3 - і MP4-плеєрів та диктофонів. .AU - стандартний формат звукового файлу, який використовується Sun, Unix і Java. Аудіо файлах AU може бути у вигляді PCM або ж стисненим за допомогою кодеків ?-law, a-law або G729. .AWB (AMR-WB) - аудіо, використовується в основному для мови, аналогічно специфікації ITU-T G. 722.2. .DCT – його використовує програмне забезпечення NCH. Це формат змінних кодеків, призначених для диктування. Він має інформацію заголовка диктування і може бути зашифрований (як того вимагають медичні закони приватності). Можна також сказати, що це пропрієтарний формат програмного забезпечення NCH. .DSS - файли Olympus DSS є власними форматами Olympus. Це досить старий і поганий кодек. GSM або MP3 як правило, краще, якщо їх дозволяє використовувати рекордер. Це дає можливість зберігати додаткові дані в заголовку файлу. .DVF - це власний формат Sony для стислих голосових файлів, зазвичай використовуваний диктофонами цієї компанії. .GSM - розроблений для використання в телефонії в Європі. Це кращий аудіо-формат для якісного звучання голосу по телефону. Хороший компроміс між розміром і якістю файлу. Також варто відзначити, що WAV-файли можуть бути закодовані за допомогою кодека GSM. .MSV - власний формат Sony для стислих голосових файлів Memory Stick.
Інтернет-формати
.FLAC формат файлу для Free Lossless Audio Codec, кодек стиснення аудіо без втрат якості. .IKLAX – це багатодоріжковий цифровий аудіо, що дозволяє виконувати різні дії з музичними даними, наприклад, при розмішуванні і компонуванні томів. .IVS - проприетарная версія з Digital Rights Management, розроблена компанією 3D Solar UK Ltd для використання в музиці, яка завантажується з музичного магазину Tronme, а також для інтерактивної музики і відеоплеєра. .OPUS (Internet Engineering Task Force) - формат стиснення аудіоданих з втратами якості, розроблений робочою групою Internet Engineering Task Force (IETF) і створений спеціально для інтерактивних додатків реального часу через інтернет. Представлений в якості відкритого типу, стандартизованого за допомогою RFC 6716 його еталонна реалізація надається у відповідності з ліцензією BSD на 3 розділи. .RA, .RM - формат Real Audio, призначений для потокової передачі звуку через інтернет. При цьому .RA дозволяє зберігати файли в автономному режимі на комп'ютері з усіма аудіоданими, що містяться в самому файлі. Програми для аудіо-форматів цього типу в даний час вважаються застарілими.
Найбільш рідкісні
.RAW, raw-файл може містити аудіо в будь-якому форматі, але зазвичай використовується з аудіоданими PCM. Він використовується рідко, за винятком технічних випробувань. .SLN – затверджений лінійний формат PCM, використовується Asterisk. До версії v.10 стандартними типами аудіо були 16-бітні Signed Linea. .Vox - найчастіше використовує кодек Dialogic ADPCM (Adaptive Differential Pulse Code Modulation). Подібно до інших форматів ADPCM, він стискає дані до 4 біт. Файли формату Vox подібні хвильовим файлів, за винятком того, що вони не містять інформації про самому файлі, тому формати відтворення аудіо можуть відрізнятися. Для цього знадобиться спочатку вказати частоту дискретизації кодека і кількість каналів.