Konkurenci MP3

O Mpeg I Layer 3, czyli mp3 słyszał chyba każdy. Format ten stworzony na potrzeby Motion Picture Expert Group (MPEG) przez Instytut Frauenhofera ( Frauenhofer-Institut fűr Integrierte Schaltungen) w Erlagen w Niemczech, spowodował istną rewolucję w sferze przesyłu danych dźwiękowych ( muzycznych) w internecie. Format ten jako standard został zaakceptowany przez komitet MPEG w 1992 r. i był najbardziej zaawansowanym sposobem zapisu danych muzycznych. Obecnie stworzono nowe algorytmy kompresji, które mogą wyprzeć z rynku słynny mp3. Mam tu na myśli trzy formaty ACC, MP4 oraz VQF.

 

VQF-Twin VQ - format został stworzony przez NTT (Nippon Telegraph and Telephone Corporation). Po raz pierwszy został zaprezentowany w połowie 1998 r. Zapewnia lepszą kompresję - do 40 %, w porównaniu do mp3, zachowując przy tym podobną jakość. Jak wiadomo standardowa kompresja mp3 odbywa się przy 128 Kb/s, w wyniku której otrzymuje się dźwięk bardzo zbliżony ( dla większości ludzi nie rozróżnialny) do wzorcowego nagrania pochodzącego z płyty CD, czyli WAV-a. Przy użyciu VQF taki dźwięk można uzyskać przy kompresji na 80- 96 kbps, ( stosunek 1:17,5 - 1:14,5 )co oznacza wspomniane zmniejszenie wielkości pliku dźwiękowego. Plik Mp3 przy 128 kpbs jest o połowę większy od pliku VQF kompresowanego na 80 kbps ( Mp3 - 4,5 MB  VQF - 2,9 MB). Oznacza to np. że na jednym krążku  CD-Rom można zapisać 15 godzin muzyki w formacie VQF przy kompresji 96 kbps, czyli uważanej jako lepszej pod względem jakościowym niż kompresja mp3 przy 128 kbps. Powróćmy jednak do jakości dźwięku. Testy porównawcze wykazały, iż jakość dźwięku VQF (kompesja 80-96 kbps) jest lepszy od standardowego mp3. Szczególnie jeśli odtwarzamy dynamiczną muzykę instrumentalną, o dużej zawartości wysokich tonów. Mp3 zapewnia bardziej równomierną ścieżkę przenoszenia dźwięku, z kolei przy VQF nie ma wyraźnego spadku w zakresie wysokich częstotliwości. Muzyka z pliku VQF jest nieco cichsza ( ok. 5 dB) od mp3, nie ma to jednak wpływy na jej jakość. Trzeba jednak pamiętać, że ktoś dysponujący doskonałym słuchem wykryje różnice między dźwiękiem wzorcowym (wav-em) a skompresowanym, nie zależnie od użytego formatu zapisu. Każdy sposób kompresji to kompromis pomiędzy wielkością pliku i jakością dźwięku ( chyba, że za wyjątkiem Perfect Clarity Audio - formatu nie powodującego jakiejkolwiek utraty jakości przy kompresji 5 krotnej). Aby skompresować muzykę na format Twin-VQ, będzie potrzebny koder VQF i odtwarzacz obsługujący ten format. Osobiście jako kodera użyłem Yamaha SoundVQ Encoder w wersji 2.60b2e (  www.vqf.com ) a odtwarzacza - Winampa z pluginem VQF ( plugin na www.vqf.com). Chcąc przekonwertować mp3 na VQF należy mp3 zdekompresować go najpierw do postaci Wav-u, np. Winampem. ( Options/Preferences/Plug-ins/Output zaznaczamy pozycję Nullsoft Disk Writer plug-in v1.0(x86), następnie w Configure zaznaczamy gdzie mają być zdekompresowane pliki mp3, następnie na Close, później na play w oknie głównym w ten sam sposób możemy zdekompresować plik VQF). W koderze Yamahy w oknie Source określamy lokalizację utworzonego wav-a , a w oknie Destination ścieżkę do miejsca gdzie plik VQF ma być zapisany. Podajemy tytuł , wykonawcę itp., aby zacząć kompresować klikamy na Start Encoding. Polecam kodowanie bezpośrednio z płyty CD, uniknie się w ten sposób utraty jakości spowodowanej podwójną kompresją sygnału audio. Mój WAV zajmował 43,7 MB po kompresji na mp3 (128 Kb/s) wynosił 4,14 MB a po kodowaniu na VQF ( 80 Kb/s) - 2,47 MB. Czas kompresji wyniósł 8 minut 31 sekund ( AMD K6-2 400) Co do jakości ... cóż nie jestem koneserem muzyki, nie wychwyciłem różnicy w jakości między tymi formatami ( piosenka poddana prze ze mnie kompresji to "White dove" grupy Scorpions)- musicie sami posłuchać. Zanim mp3 zostanie całkowicie, wyparte minie jeszcze trochę czasu, jednak już teraz warto zapoznać się z tym formatem kompresji ( z pośród prezentowanej trójki jego polecam wam szczególnie.), zwłaszcza jeżeli ktoś ma pokaźną kolekcję muzyki mp3 i chce zmniejszyć o ok. 60 % jej rozmiar na dysku nie tracąc przy tym na jakości.  

AAC - ( Advanced Audio Coding ) - jest to zaawansowany format kompresji sygnału audio, w którym komitet MPEG upatruje następcę dzisiejszego mp3. AAC stanowi część standardu MPEG II, utworzony został przez instytut Frauenhofera i amerykański koncern AT&T oraz firmy Sony i Dolby. Obecnie prace nad tym standardem nie są jeszcze ukończone Mimo tego można się spodziewać, że format ten oprócz dobrej jakości dźwięku będzie oferował kodowanie muzyki zabezpieczające prze nielegalnym kopiowaniem. AT&T uruchomiła serwis muzyczny a2b ( www.a2bmusic.com ), gdzie za opłatą klient ma dostęp do utworów muzycznych jakościowo zbliżonych do WAV, kodowanych na ACC. Nie dostępny jest program kodujący, który posiadałby certifikat. W 1998 r. udostępniono kody źródłowe ISO MPEG4. Szybko pojawiły się encodery i dekodery oraz odtwarzacz ACC. Niestety w związku z brakiem jednego standardu można się spotkać z kilkoma produktami niekompatybilnymi ze sobą. Najlepszą jakość oferuje encoder standardu Astrid/Quartex ( AAC Encoder). Pliki skompresowane tym encoderem można odtworzyć za pomocą Kjofol (obecnie dostępny Kjofol 2000 v.1), który wyłącznie obsługuje standard Astrid/Quartex. Nie dostępne są wtyczki do Winampa obsługujące ten standard. Kolejny standard, jako pierwszy wprowadził Homeboy. Dostępny jest zarówno encoder jak i odtwarzacz plików ACC ( tylko do standardu Homeboy) - BitAAC a także plugin do Winampa obsługujący tenże standard. Niestety dźwięk uzyskany przez zastosowanie encodera nie jest dobry jakościowo. Ustępuje jakością plikowi mp3 kodowanemu przy takiemu samemu stopniu kompresji. W sumie standard Homeboy-a jest nie udany, nie może konkurować z mp3. Trzecią normę wprowadził MBsoft. Coderem ( MBSoft AAC Encoder) tego producenta uzyskamy przyzwoitą jakość dźwięku ( porównywalną z mp3 lub lepszą) przy dużej kompresji. Pliki kodowane produktem Mbsoft-u można odtworzyć za pomocą Winampa z odpowiednim pluginem (AAC Decoder). Poza tym istnieje kilka programów kodujących i dekodujących napisanych przez indywidualnych programistów ( np. Advanced Audio Coder, fAAC). Czas potrzebny na skompresowanie Wav-u do formatu AAC jest różny i zależy od rodzaju użytego oprogramowania. Najlepsze jakościowo pliki kodowane programem Astrid/Quartex długo są kompresowane. Na P200MMX - 10 krotny czas utworu, na PII 450 - 5 -ciominutowy WAV koduje się ok. 10 min. Niestety nie mogłem u siebie kodować utworu coderem Astrid/Quartex - po skompresowaniu piosenki do pliku AAC, plik nie był wykrywany przez odtwarzcza - Kjofol 2000. Także przy ręcznym wskazaniu pliku, odtwarzacz nie odegrał go. Podobne trudności były z  Advanced Audio Coder v0.61. Ostatecznie plik AAC udało mi się stworzyć programem Mbsoftu - AAC Encoder v0.4. Proces kodowania 43,7 MB ( 290 sek.) pliku WAV przy kompresji 96 Kb/s  na AMD K6-2 400 trwał 23 minuty 26 sekund. W wyniku czego otrzymuje 2,97 MB plik AAC, o jakości takiej jak mp3 przy 128 Kb/s. Jednak biorąc pod uwagę czas kodowania, format ten wypada gorzej w porównaniu z mp3 czy VQF. Pamiętać należy że przce nad formatem ciągle trwają, więc końcowe efekty mogą być bardzo dobre. Aby skompresować Wav-a do postaci AAC coderem MBSoftu w oknie programy kliknać na Open input ( podajemy ścieżkę do WAV-a), następnie na Set Output ( podajemy miejsce zapisu pliku AAC), w Bitrate ustawiamy stopień kompresji ( 64, 96 lub 128 Kb/s) w Quality\Speed Settings wybieramy pozycję Normal , High quality ( jeśli zależy nam na jakości otrzymanej muzyki) lub High Speed ( szybka kompresja), klikamy na Start. Aby odtworzyć nowo utworzony plik należy zainstalować plugin do Winampa obsługujący standard MBSoft ( patrz wyżej)

  MP4 - format ten nie jest następcą dzisiejszego mp3. Mała amerykańska firma Global Music Outlet  producent oprogramowania wykupiła prawo do posługiwania się nazwą ( swoją drogą jeśli stać ją było na wykupienie nazwy to chyba nie jest całkiem "mała" ) i właśnie pod nazwą mp4 próbuje rozpowszechnić opracowany przez siebie format kompresji audio, który nie ma aprobaty komitetu MPEG. Charakterystyczną cechą tego formatu ( oprócz większej wydajności, ale o tym później) jest większa możliwość ochrony praw autorskich w sieci. Programy do tworzenia plików mp4 dostępne są tylko dla właścicieli praw autorskich danego utworu. Format MPEG4 Audio ( mpeg4 stosuje się również do kompresji video, obrazów statycznych) jest to zbiór norm określających kodowanie naturalnego oraz syntetycznego dźwięku. Norm tychże jest pięć:

-         SA (Structured Audio) -  umożliwia transmisje wysokiej jakości muzyki syntetycznej i efektów dźwiękowych.

-         TTSI (Text-to-Speech Interface)- umożliwia transmisje i synchronizacje z innymi                        formami dźwięku. Nie jest jeszcze określona żadna szczególna metoda TTS.

-         T/F (Time-Frequency) umożliwia skalowanie, kodowanie dźwięku o wysokiej jakości i szerokim paśmie od 24 kbps. Na 64 kbps na kanał jakość będzie 'przezroczysta', tzn. nie będzie można usłyszeć różnicy pomiędzy oryginałem i dźwiękiem przetworzonym. Kodek jest oparty o system MPEG-AAC, z ulepszeniami wziętymi z TWIN VQ, opisywanym powyżej. Otrzymany w ten sposób format pozwoli na o polowe lepsza kompresje w porównaniu z MP3, bez utraty jakości. Można wiec powiedzieć, że plikowi mp3 kompresowanemu na 128 Kb/s będzie odpowiadał mp4 kodowany przy kompresji 64 Kb/s. Stosowany dla osiągnięcia najwyższej jakości dźwięku.

-         CELP (Codebook-Excitation Linear Prediction) umożliwia kodowanie mowy na 6-24 kbps. Na 24 kbps mowa jest przenoszona w sposób szerokopasmowy i prawie bez żadnych zniekształceń, 6 kbps odpowiada jakości telefonicznej. Stosowany dla średnich przepustowości.

-         PARA (Parametric coding)  - przesyłanie muzyki i mowy przy kompresji 2 - 24 kbps. Będzie możliwe przesyłanie zrozumiałej mowy nawet poniżej 2 kb/s, czyli lepiej niż przy obecnym Real Audio. Stosowanych dla najniższych przepustowości.

MPEG4 oferuje także wyciszanie błędów oraz skalowalność, składającą się z :

.        1.Skalowalnosc prędkości przesyłania (bit rate scalability), pozwala na przekształcenie określonego strumienia bitów w strumień o niższej szybkości przesyłania, umożliwiając bezbłędna transmisje w zmiennych warunkach.
2. Skalowalność pasma przenoszenia, (bandwidth scalability), gdzie określone części strumienia bitów przesyłają odpowiednie fragmenty widma sygnału. W gorszych warunkach możliwe jest zawężenie przesyłanego widma, bez szkody dla zrozumiałości materiału.
3. Skalowalność złożoności enkodera (encoder complexity scalability), pozwala enkoderom o różnym stopniu złożoności na generowanie poprawnego oraz zgodnego z norma sygnału
4. Skalowalność złożoności dekodera (dekoder complexity scalability), pozwala na poprawne dekodowanie sygnału przez dekodery o różnym stopniu złożoności Najogólniej, jakość dźwięku zależy od stopnia złożoności enkodera i dekodera.
5. System korekcji błędów (error robustness) umożliwia dekoderowi korekcje lub ukrycie słyszalnych zniekształceń spowodowanych błędami w trakcie transmisji.

.        W MPEG4 jednym ze skalowanych formatów jest standard BASC (Bit Sliced Arithmetic Coding), sposób kodowania zbliżony jest do AAC, encoder różni się jedynie ulepszonym modułem odpowiedzialnym za dynamikę. Dzięki temu, przy zawężeniu pasma transmisji poniżej 40 kbps, pogorszenie jakości jest prawie niezauważalne. W praktyce, podczas transmisji encoder jest w stanie zmieniać pasmo od 16 do 64 kbps, z krokiem 1 kbps.

.        SAOL (Structured Audio Orchestra Language) definiuje "orkiestrę" za pomocą poszczególnych "instrumentów". "Instrument" jest to niewielka siec danych dla procesora sygnałowego, pozwalająca na emulacje naturalnego brzmienia instrumentu muzycznego.

.        SASL (Structured Audio Score Language) jest używany do tworzenia nowych efektów oraz zawiera informacje służące modyfikowaniu istniejącego dźwięku Pozwala na lepsza kontrole syntezy oraz bardziej naturalny efekt końcowy. W przypadku, gdy nie jest wymagana szczegółowa kontrola, do przesyłania danych o instrumentach może być wykorzystany protokół MIDI.

.        W formacie MPEG4 po raz pierwszy pojawia się także pojecie "obiektu audio". Najprościej można go zdefiniować jako słyszalna cześć docierającego do odbiorcy materiału dźwiękowego, zakodowana za pomocą pojedynczego strumienia bitów. Może to być np. glos jednego lub kilku mówców, dźwięk jednego lub kilku instrumentów lub tło akustyczne. Obiekty audio mogą być grupowane oraz miksowane, przy czym rozdzielenie pojedynczego obiektu na mniejsze składowe jest już dosyć trudne. Możliwości wykorzystania tego sposobu transmisji SA bardzo rozlegle:
- do odbiorcy, poprzez 5 kanałów przesyłany jest dźwięk z pięciu różnych instrumentów wchodzących w skład orkiestry. Odbiorca może np. wyłączyć jeden z instrumentów i grac razem z pozostałymi członkami zespołu.
- transmisja wydarzeń sportowych w kilku językach
- interaktywne filmy oraz aplikacje video, korzystające z obiektowego opisu sceny, np. w typowej sekwencji z filmu, rozgrywającej się na dworcu kolejowym, można wyróżnić kilka obiektów audio:
- rozmowa pomiędzy aktorami, najważniejszy element sceny
- tło akustyczne, np. gwar dworcowy oraz odgłosy nadjeżdżających pociągów
- zapowiedzi speakera o przyjazdach i odjazdach pociągów
- tło muzyczne (ścieżka dźwiękowa)

.        Każdy z obiektów dźwiękowych może być dowolnie modyfikowany, zależnie od potrzeb. W trudniejszych warunkach transmisji, możliwe jest ograniczenie pasma lub całkowite usuniecie obiektów nie mających wpływu na treść przekazu.
Format MPEG4 oferuje znacznie więcej niż jego poprzednicy: MPEG1 oraz MPEG2. Oprócz narzędzi umożliwiających kompresje i przesyłanie dźwięku naturalnego, wzbogacony został o możliwości syntezy dźwięku po stronie odbiorcy oraz skalowania przesyłanego strumienia bitów. Trwają także prace nad formatem MPEG7, który ma połączyć większość aplikacji multimedialnych w jedna całość. Pozwoli to na łatwe zarządzanie multimedialnymi zasobami Internetu: wyszukiwanie, sprzedaż lub udostępnianie utworów oraz filmów.

Z pośród opisywanych wyżej formatów kompresji muzyki polecam wam Twin VQ - mniejsza wielkość pliku przy takiej samej jakości co mp3, poza tym nie miałem żadnych trudności z kodowaniem/dekodowaniem muzyki do/z tego formatu. Również nie ma problemów z ich odtworzeniem. Istotną rolę ma także tutaj krótki czas kompresji.  AAC to format nad którym prace ciągle trwają, wykorzystywany jest on obecnie w radiofonii cyfrowej oraz przy satelitarnej transmisji danych. Z pośród 4 użytych przeze mnie encoderów tylko jeden działał ( MBSoftu). Brak standaryzowania spowodował, że chcąc odtworzyć piosenkę w formacie AAC musimy zaopatrzyć się w kilka odtwarzaczy lub kilka pluginów. Dopiero wtedy nie musimy się liczyć z sytuacją kiedy to plik ACC nie  chce być odtworzony przez playera którego posiadamy, pomimo, że program potrafi odtwarzać tego typu pliki.Piosenka bardzo długo się kompresuje do tego formatu. Większość  koderów działa w trybie znakowym ( na produkty Homeboya i  Astrid/Quartex istnieje graficzna nakładka). Jednak jak już wspomniałem, skoro formatem tym zajęła się organizacja MPEG to lada dzień możemy oczekiwać przyzwoitego algorytmu kompresji. Z kolei MP4 daje olbrzymie możliwości z dziedziny kompresji i przesyłu sygnału audio. Szkoda tylko, że jak na razie format ten może być odtworzony tylko na komputerach klasy IBM PC oraz, że programy kodujące nie są powszechnie dostępne ( natknąłem się w sieci na strony gdzie były informacje o encoderach mp4 jednak po sprawdzeniu okazało się, że są to codery bazujące na AAC, nie oferujące wszystkich zalet MPEG4). Od lutego 1999 Global Music sprzedaje piosenki w formacie MP4 ( www.globalmusic.com)  

Źródło:
www.iis.fhg.de
www.hitsquad.com
www.mp3.com.pl

Kryj Łukasz
xboy@poczta.wp.pl

 

 Copyright © 2000 PTiK. Wszystkie prawa zastrzeżone.
 Kopiowanie tekstów w całości lub we fragmentach bez zgody redakcji i autorów zabronione.