Процесори :: Дънни платки :: Видео :: Мултимедия :: Носители :: Периферия
Комуникации :: Софтуер :: Технологии :: Links & Downloads :: Форум
 
 
Формати за цифрова музика: MP3 Pro
       

MP3 Pro и малко разсъждения на тема цифрова музика

През последните няколко години станахме свидетели на промяната в начина, по който се слуша, разпространява и разменя музиката, особено когато хората все повече и по-активно използват Интернет не само като източник на новини и информация, но и като среда за общуване и споделяне на притежаваните от тях файлове.

Въпреки усилията на звукозаписната индустрия, разпространението на цифрова музика през Интернет нито е спряло, нито дори е намаляло, дори напротив. Появяват се нови начини за размяна на музикални (и не само!) файлове, като мненията и на потребителите, но и на създателите на музиката относно свободното разпространение на цифрова компресирана музика са диаметрално противоположни, вариращи от исканията за глобална забрана до желанията за свободно разпространение по всякакъв начин.

Не случайно написах "цифрова компресирана музика", разпространявана в някой от форматите от типа на MP3, OGG Vorbis, WMA и т.н. има десетократно и повече пъти по-малък размер от "оригиналния" компресиран звуков файл, съдържащ digital audio, което, засега във времето на не толково бързите, но разпространени повсеместно интернет връзки, е от огромно значение.

От друга страна, компресираната музика, без значение по какъв алгоритъм на кой формат се компресира, какъв психоакустичен модел използва, в крайна сметка води до загуба на музикална информация. В много случаи, особено за хора, нямащи качествена апаратура или високи изисквания към пълното съответствие с оригиналната CD композиция, това е без значение. Но хора, претендиращи, че са меломани, надали биха съставили колекцията си с музикални произведения от компресирани дигитални копия. Точно това е едно от убежденията на защитниците и поддръжниците на свободно разпространение на компресираните музикални произведение-един истински меломан и ценител на качествения звук, след като се запознае с по-нискокачественото произведение, download-вано например по Интернет, след това ще си поръча, пак през Интернет, или пък ще си купи от специализиран магазин същото това произведение, но в "пълен" вариант.

Благодарение на цитираните от мен по-горе причини, пък и на множество неспоменати, но обсъждани широко във всички медии, през последните 2-3 години станахме свидетели на "победното" шествие на формата МР3 (MPEG layer 3) навсякъде по света, като напоследък, освен специализираните устройства за просвирване на файлове във формат МР3, използващи всевъзможен тип памет (МР3-плейъри, по-народному :) и поддръжка на ниво операционна система, наблюдаваме появата на нова генерация многофункционални устройства, способни и да просвирват цифрова музика-МР3/CD Audio плейъри за дома и колата, цифрови камери и мобилни телефони с МР3 поддръжка и т.н.

През 9-тте години, откакто съществува МР3 (разбира се, през първите няколко той е съществувал само в лабораториите), всички разработчици на компресиращи алгоритми, без значение дали използват или не психоакустичния модел, създаден от Fraunhofer Institute, са се стремили да постигнат такъв баланс между обема и качеството, че файлът да е по-малък а да звучи по-добре.

Затова софтуерите на някои разработчици, като LAME например, компресират музика по-качествено от гледна точка на получавания звук, отколкото, например печално известния, ултрабърз, но некачествен Xing.

Освен МР3, и други разработчици като Microsoft с формата си WMA, OGG Vorbis, създаден от група независими разработчици, и някои други, не успяли да се наложат, се опитват да се преборят с доминиращото положение на МР3. Ситуацията донякъде напомня борбата между форматите за компресия: ZIP, RAR, ACE...

През последната година все по-често се споменава форматът МР3 Pro, който се опитва да заеме мястото на "дядо" си МР3, предлагайки, според разработчиците му, по-високо качество при по-малък обем на файла. Точно този момент ще разгледаме в следващите по-долу редове.

МР3 Pro е създаден от малката частна компания CodingTechnologies през 1997 г, противно на често споменаваните в множество материали Fraunhofer Institute и Thomson Multimedia. Последните две компании, обаче, наистина имат участие в по-нататъшното придвижване на стандарта. Fraunhofer Institute го подкрепя и има сключени споразумения на високо ниво с Coding Technologies, a Thomson Multimedia, която, впрочем, е дала и името му-МР3 Pro, се занимава с популяризирането и лицензирането му, както досега се занимаваше със същите дейности, продвижвайки напред стандарта МР3.

МР3 Pro използва технология, наречена SBR-Spectral Band Replication. Стандартът допуска запис на 5.1 канала, подобно на OGG Vorbis, което става все по-актуално с широкото навлизане на DVD и многоканално звуково обкръжение в игрите.

Същността й се състои в следното: при компресията на звуковия поток (stream) се взима малко по-тесен участък от честотния спектър, за сметка на високите честоти, които се изрязват напълно. При възпроизвеждането на МР3 Pro файл (между другото, той също име разширение *.МР3) декодиращият алгоритъм възстановява липсващите високи честоти, използвайки информацията, записана във файла.

По този начин, един МР3 Pro файл съдържа два потока: единият, съдържащ ниските и част от средните честоти (някъде до 8-9 KHz) се компресира по стандартния MPEG LAYER3 начин (затова се твърди, че този формат е ограничено "обратно съвместим" със стария МР3), а другия поток съдържа информация за високочестотната част, която вече специализираният плейър за МР3 Pro формата следва да декодира и възпроизведе, и която един обикновен МР3 плейър няма да може. Затова композициите, записани в МР3 Pro формат при възпроизвеждане в МР3 плейър звучат глухо-просто той възпроизвежда първият, познат на него формат, съдържащ ниските и част от средните честоти. Имайте предвид, че при просвирване на МР3 Pro файл в плейър, поддържащ МР3 стойността на честотата на дискретизация се изобразява като 22KHz, a не катo 44100KHz.

Подробности за това, как точно е реализиран алгоритъма за компресия/декомпресия при стандарта МР3 Pro все още липсват, фирмата-разработчик по обясними причини ги запазва в дълбока тайна. Но, в крайна сметка, за обикновения потребител това е без значение. Той се интересува от това, какъв е обемът на компресирания файл при даден битрейт, какво е качеството на възпроизвеждане при този битрейт при МР3 Pro и аналогичен битрейт при конкурентните формати, дали има достатъчно софтуер и т.н. Затова, без да се отдаваме на техническите подробности, ще разгледаме точно тези "приоритетни" за потребителя аспекти на МР3 Pro.

СОФТУЕР

Започваме с осигуряването на компресирането и декомпресирането (възпроизвеждането) на композициите. Наличният за момента софтуер не може да се похвали с изобилие или със всестранна поддръжка от производителите на софтуер и хардуер, макар, че първите плайъри, поддържащи новият стандарт (и софтуерни, и хардуерни) са вече налице. Ситуацията наподобява положението около стандарта OGG Vorbis, която с течение на времето се промени, еволюирайки в интегрирана поддръжка на този стандарт в множество приложения (разбира се, още нищо не може да се сравни с поддръжката на МР3).

И така, една от първите компании, предложила МР3 Pro плейър е Thomson Multimedia, създавайки МР3 Pro Аudio Player. Освен, че позволява просвирването на МР3 Pro съдържание, тази програма съдържа и демо-версия на кодера, позволяващ компресирането на *.wav файлове с максимален битрейт 64 kbps (килобита/секунда). За тези, които като мен, са направили с общи усилия WinAmp най-използваният аудио-плейър в света на компютрите, в Интернет се разпространява свободно plug-in, подобен на този за OGG Vorbis, позволяващ просвирването на МР3 Pro. Текущата версия все още не е изчистена напълно от бъгове, но да се надяваме, че те ще бъдат поправени. Можете да я откриете на http://www.mp3prozone.com.

Най-облагодетелствани в момента са потребителите на софтуера за запис на дискове Nero Burning Rom, тъй като е в наличност динамичната библиотека *.dll за Nero 5.5.4.0, позволяваща да се използва набор от всевъзможни битрейтове, определящи степента на компресия, и да се настройват други параметри, като файл-източник може да се използват освен *.wav, така и *.MP3, *.vqf, *.AIF. За съжаление обаче, влизащата в комплекта на NERO версия на encoder-a позволява конвертирането само на 30 композиции, след което спира да работи (мисля, че всеки знае решението на проблема, да е жив необятният Интернет :-)).

ХАРДУЕР

За възпроизвеждането на МР3 Pro съдържание ще ви свърши работа всеки копютър, който е в състояние да възпроизведе МР3, т.е. всеки един правилно конфигуриран Р200 ММX би трябвало да се справи. Специални изисквания към операционната система и звуковата платка също няма и не би трябвало да има.

MP3 Pro, в интерес на истината, все пак има малко по-високи изисквания по отношение изчислителната мощ на процесора, поради повечето изчисления, в сравнение с MP3, които той трябва да извършва. Чувал съм, че MP3 могат да се възпроизвеждат на компютри с P90 процесор, но, за съжаление, не мога да го проверя лично поради липса на такъв процесор в нашата тестова лаборатория.

Методика на оценяване

Трябва да спомена, че оценяването на този или онзи звуков формат носи голям заряд субективизъм, освен всичко останало. Освен това, реализацията на психоакустичният модел за всеки един от форматите може да се различава чуствително дори и в две последователни версии на декодиращия/кодиращия софтуер, така че е възможно на даден етап от тестването лидерът да е един формат, а с излизането на нови библиотеки, определящи психоакустичният модел-друг. Затова при оценяването, освен чисто субективния критерий за оценка-качеството на чувания от мен звук съм включил и оценяване и по множество други критерии, използвани от мен и при оценката на други формати (например OGG Vorbis): скорост на кодиране, съответствие на амплитудно-честотната характеристика (АЧХ) на кодираната фонограма на оригиналната, получавана чрез наслагване на графиките, получени чрез професионалния софтуер Spectra Lab432 на компанията Sound Technology, използването на различни стилове музика (jazz, pop, classic) и т.н. както знаете може би, не всичко се компресира еднакво добре при един и същи битрейт или при използване на един и същи формат.

При тестването използвах последните достъпни в Интернет версии на кодиращи/декодиращи софтуери (кодеци) за съответният тип кодиращ алгоритъм (моля да ме извините за използваните английски термини, написани на български, но често няма еквивалентна добре звучаща обхватна дума на български език).

Тестова конфигурация:

Motherboard: Abit KT7a RAID
CPU: AMD Thunderbird 1200MHz/133
512 MB PC 133 SDRAM PQI 7.5 ms (2x256 MB)
Video card: Matrox Millenium G400 DualHead Max 32MB SGRAM
HDD: 40GB IBM 60GXP 7200 rpm/2MB, NTFS file system
SCSI: Adaptec AHA 2903 w/o BIOS
Sound: Creative Sound Blaster Live! CT 4780 Value

OS: Windows XP Pro

Озвучителна уредба:Technics SA - EH 750

Тестови композиции:

  • POP - Michael Jackson, 3:54.9
  • JAZZ - Ray Charles, 3:55.3
  • CLASSIC - Mozart, 6:52.1

След кодирането на всяка една от тях с приблизително съответстващ битрейт се оценяваше качеството на звука, размерът на файла, след което файлът с компресираната музика се преобразува обратно в *.wav файл, почиства се спомощтана звуков редактор и чак след това се сравняват АЧХ на композицията преди и след компресията.

Борейки се с желанието да напълня материала с множество таблици с резултатите от всяко едно измерване плюс множеството от графики, взех намерението да спестя на читателите дешифрирането на резултатите и ще изброя, дори с риск да са изредени много хаотично, моито заключения относно МР3 Pro и мястото му в съвременния дигитален свят.

Ако все пак ви обземе желание да видите как изглежда графиката на честотната характеристика на една музикална композиция, можете да хвърлите един поглед на спектрограмата на една композиция, зареждайки двете снимки (около 100 kB). В този пример в софтуера Spectra Lab432 на компанията Sound Technology са заредени последователно оригиналния *.wav файл на JAZZ-Ray Charles и след това *.wav версията на компресирания преди това оригинал. Дейността ми се свежда след това в сравняване на честотните характеристики на двете композиции, и то основно в високочестотната област, където се налага да се увеличава мащаба, както с вижда от втората снимка, за да се видят разликите.

И така, в "състезанието" участват най-добрите в момента формати: стария, но постоянно променящият се в добра посока МР3, и то главно благодарение на проекта LAME; качественият и също така еволюиращ в положителна посока OGG Vorbis и достатъчно младия, но силен МР3 Pro. Сравненията са направени в следните категории:

  1. МР3@128kpbs vs МР3 Pro@64kpbs vs OGG Vorbis@96kpbs vs WMA@64kpbs
  2. MP3@192kpbs vs МР3 Pro@96kpbs vs OGG Vorbis@128kpbs vs WMA@96kpbs

Ето първо една табличка с времената, необходими за компресирането на всяка една от композициите при различните алгоритми и битрейти:

  POP CLASSIC JAZZ
Продължителност в мин. 03:54,9 06:52,1 03:55,3
       
Време за създаване на MP3@128 26 43 29
Време за създаване на MP3@192 25 43 24
Време за създаване на MP3@256 23 39 23
       
Време за създаване на OGG@64 46 78 46
Време за създаване на OGG@96 47 81 47
       
Време за създаване на WMA@64 14 22 12
Време за създаване на WMA@96 14 22 12
       
Време за създаване на MP3 Pro@64 29 52 30
Време за създаване на MP3 Pro@96 31 54 29
       
Обем на *.wav файл (kB) 40478 71002 40545
       
Обем на файл MP3@128 3672 6441 3678
Обем на файл MP3@192 5508 9661 5517
Обем на файл MP3@256 7344 12881 7356
       
Обем на файл OGG@64 1908 2902 1512
Обем на файл OGG@96 2696 4282 2217
       
Обем на файл WMA@64 1860 3255 1860
Обем на файл WMA@96 2775 4866 2780
       
Обем на файл MP3 Pro@64 1837 3221 1840
Обем на файл MP3 Pro@96 2755 4866 2760

Ако предпочитате да сравнявате диаграми, ето същите стойности:

Ако се вгледате, веднага ще забележите добрите резултати на новия формат от гледна точка размер на файл, и лидиращата позиция на кодера на Microsoft от гледна точка на време, необходимо за кодирането на *.wav файла в неговия собствен формат, следван от MP3. Трето място заема MP3 Pro, а най-бавен си остава OGG Vorbis.

Ако сравним размерите на получените файлове (изключвайки MP3 поради двойно по-високия битрейт), ще забележим, че при еднакви битрейти размерите на получените файлове са горе-долу от един порядък, като лидерът тук е OGG Vorbis:

 

1. МР3@128kpbs vs МР3 Pro@64kpbs vs OGG Vorbis@96kpbs vs WMA@64kpbs

Този битрейт за мен, без значение на използвания алгоритъм, при нито един от "състезателите" не се доближава до така любимото на всички определение (near) CD Quality.

На първо място, защото всички участници в тестовете безмилостно режат високите честоти или ги заменят с някакво подобие на оригинала, което се вижда добре от АЧХ, но в интерес на истината невинаги се чува, особено при използването на некачествени компютърни озвучителни тела (макар, че аз и там долавям разлики). Практически всички участници се справят добре с ниските и средните честоти до около 8-10 KHz, при което няма различия във вида на АЧХ. При високите честоти нещата стоят по друг начин. WMA ги превръща в нещо, трудно познаваемо в сравнение с оригинала, особено при jazz-композицията, макар, че има разлика в положителна посока при новата версия на WMA кодера в сравнение с тази преди няколко месеца, когато изследвах формата OGG Vorbis.

С компресирането на POP композицията и четирите формата се справиха еднакво добре, т.е. на слух разликите в звученето бяха пренебрежително малки. Мога да добавя само малко повдигнатите високи честоти при формата MP3 Pro, които липсват в оригинала, но иначе MP3 Pro@64kpbs звучеше доста добре, въпреки двойно по-ниския от МР3 битрейт. OGG Vorbis като цяло повтаря резултатите от предишното едноименно изследване.

При този битрейт MP3 Pro пропуска честоти до около 16-17 KHz, което добре се вижда от диаграмите, получавани спомощтана SpectraLAB, МР3 с килохерц по-малко, а WMA е съвсем зле: до около 13.5-14 KHz. Е, все пак този битрейт не е предназначен за създаване на колекция от висококачествена, макар и компресирана музика. Главното му предназначение-съхранение на ПРИЕМЛИВО качество на музиката, максимално малък обем на файл, с което MP3 Pro, "героят" на този материал се справя доста добре. Разбира се, ако се абстрахираме от нещата, които той добавя в оригиналната композиция, опитвайки се да синтезира изрязаните при кодирането фрагменти от високочестотния спектър. Как го прави това компенсиране? За сега, докато не станат известни повече подробности около патентованата технология, няма да мога да дам 100% верен отговор.

Важният извод обаче, който може да се направи за MP3 Pro формата, без значение кой битрейт използвате е, че той добавя в композицията такива елементи (особено във високочестотната област), за които авторът на произведението дори и не подозира, което е един голям минус за този формат, макар, че, както споменах по-горе, по-леките композиции понякога звучат по-наситено от оригиналните за сметка на усилените и богати на хармоници високи честоти.

При компресирането на jazz и classic композициите и четирите формата не са на ниво при тези битрейти, което показва, че едни толкова сложни и богати на инструменти композиции не могат да бъдат точно предадени при нисък битрейт без значение, кой формат е използван за съхранение на цифровата музика.

2. MP3@192kpbs vs МР3 Pro@96kpbs vs OGG Vorbis@128kpbs vs WMA@96kpbs

Този битрейт е избран за разглеждане поради близостта му (за еталон взимаме МР3@192kpbs) към понятието "качествено компресирана музика", макар, че в случая можем да говорим само за първото стъпало на това понятие, и поради простата причина, че в encodera на NERO максималният възможен битрейт за MP3 Pro е точно 96 kbps.

При тези тестове всички формати горе-долу добре са се справили с предаването на оригиналния звук на РОР-композоцията, запазвайки обаче тенденциите за по-стеснен честотен диапазон при WMA и "бонус" високите при MP3 Pro. Най-точно възпроизведе високите OGG Vorbis, следван по петите от MP3, предал максимално точно целия честотен диапазон. Горната граница на честотния диапазон се е повдигнала до ниво 18-20 KHz про тези по-високи от предишния тест битрейт.

Да видим как стоят нещата при jazz-a и класиката... Пак резултат, подобен на предишният тест. Макар, че и четирите формата се оправят значително по-добре, явно и 96/192kpbs не са достатъчни за относително точното възпроизвеждане на оригиналния звук. Може да се каже, че този битрейт е подходящ за съхранение на музика от хора, нямащи големи изисквания към качеството на звука, но все пак слушащи музика на достатъчно качествени озвучителни тела или просвирвайки я през домашна уредба от не много висок клас.

Заключение

Лично аз на този етап нямам колебания дали новият формат е подходящ за съхранение на колекцията ми от цифрова музика (между другото, аз я компресирам в MP3 с LAME@256 kbps, очаквайки с нетърпение дните, когато OGG Vorbis се наложи :-)). Не бих съхранявал музиката в този формат поради няколко причини:

  • добавя липсващи в оригинала фрагменти
  • няма достатъчно количество софтуер
  • няма добри показатели при кодирането на сложни музикални композиции
  • Все още наборът от възможни bitrates е ограничен от 96 kbps, което е недостатъчно за коректното възпроизвеждане на по-слoжни композиции

От друга страна, съществува цяла армия потребители, които слушат музика на евтини колонки, свързани към компютъра. Те със сигурност не се интересуват от високи битрейтове, честоти над 12 kHz, динамиката на звука, кефициента на нелинейни изкривявания и останалите параметри, изграждащи понятието качествен звук. Точно тук идва на място голямото предимство на новия формат: малък обем на файла, подходящ за теглене от Интернет, архивиране и зареждане в преносими устройства за по-нататъшно прослушване, достатъчно добро качество на звука, пък и с цената на някои липсващи оригинални фрагменти и добавени нови, които не всеки може да чуе.

Точно тези предимства, в комплект с мощната поддръжка на колосите Fraunhofer Institute и Thomson Multimedia , могат да му осигурят добро бъдеще, но за определен кръг от задачи и определена категория хора. За сега стандартът не предвижда някаква защита от свободно копиране на композициите, но това може в един момент да бъде променено.

Линкове:

http://www.mp3prozone.com

http://www.codingtechnologies.com

Материалът е публикуван на: 23.11.2001 г.
Автор: инж. Сергей Миланов
адрес за кореспонденция
Начало на материала :: Процесори :: Дънни платки :: Видео :: Мултимедия :: Носители
Периферия :: Комуникации :: Софтуер :: Технологии :: Links & Downloads :: Форум
© 2001-2006 Macrolevel, Inc. Правила и условия.
При цитиране на материала линк към сайта и посочване на автора са задължителни.
За контакти използвайте адреса ни за електронна поща