|
|
|
Konkurenci MP3
O Mpeg I Layer 3, czyli mp3 słyszał
chyba każdy. Format ten stworzony na potrzeby Motion Picture Expert Group (MPEG)
przez Instytut Frauenhofera ( Frauenhofer-Institut fűr Integrierte Schaltungen)
w Erlagen w Niemczech, spowodował istną rewolucję w sferze przesyłu danych dźwiękowych
( muzycznych) w internecie. Format ten jako standard został zaakceptowany przez
komitet MPEG w 1992 r. i był najbardziej zaawansowanym sposobem zapisu danych
muzycznych. Obecnie stworzono nowe algorytmy kompresji, które mogą wyprzeć z
rynku słynny mp3. Mam tu na myśli trzy formaty ACC, MP4 oraz VQF.
VQF-Twin VQ - format
został stworzony przez NTT (Nippon Telegraph and Telephone Corporation).
Po raz pierwszy został zaprezentowany w połowie 1998 r. Zapewnia lepszą
kompresję - do 40 %, w porównaniu do mp3, zachowując przy tym podobną jakość.
Jak wiadomo standardowa kompresja mp3 odbywa się przy 128 Kb/s, w wyniku której
otrzymuje się dźwięk bardzo zbliżony ( dla większości ludzi nie rozróżnialny)
do wzorcowego nagrania pochodzącego z płyty CD, czyli WAV-a. Przy użyciu VQF
taki dźwięk można uzyskać przy kompresji na 80- 96 kbps, ( stosunek 1:17,5 -
1:14,5 )co oznacza wspomniane zmniejszenie wielkości pliku dźwiękowego. Plik
Mp3 przy 128 kpbs jest o połowę większy od pliku VQF kompresowanego na 80
kbps ( Mp3 - 4,5 MB VQF - 2,9 MB).
Oznacza to np. że na jednym krążku CD-Rom
można zapisać 15 godzin muzyki w formacie VQF przy kompresji 96 kbps, czyli
uważanej jako lepszej pod względem jakościowym niż kompresja mp3 przy 128
kbps. Powróćmy jednak do jakości dźwięku. Testy porównawcze wykazały, iż
jakość dźwięku VQF (kompesja 80-96 kbps) jest lepszy od standardowego mp3.
Szczególnie jeśli odtwarzamy dynamiczną muzykę instrumentalną, o dużej
zawartości wysokich tonów. Mp3 zapewnia bardziej równomierną ścieżkę
przenoszenia dźwięku, z kolei przy VQF nie ma wyraźnego spadku w zakresie
wysokich częstotliwości. Muzyka z pliku VQF jest nieco cichsza ( ok. 5 dB) od
mp3, nie ma to jednak wpływy na jej jakość. Trzeba jednak pamiętać, że ktoś
dysponujący doskonałym słuchem wykryje różnice między dźwiękiem
wzorcowym (wav-em) a skompresowanym, nie zależnie od użytego formatu zapisu.
Każdy sposób kompresji to kompromis pomiędzy wielkością pliku i jakością
dźwięku ( chyba, że za wyjątkiem Perfect
Clarity Audio - formatu nie powodującego jakiejkolwiek utraty jakości przy
kompresji 5 krotnej).
Aby skompresować muzykę na format Twin-VQ, będzie potrzebny koder VQF i
odtwarzacz obsługujący ten format. Osobiście jako kodera użyłem Yamaha
SoundVQ Encoder w wersji 2.60b2e ( www.vqf.com
) a odtwarzacza - Winampa z pluginem VQF ( plugin na www.vqf.com).
Chcąc przekonwertować mp3 na VQF należy mp3 zdekompresować go najpierw do
postaci Wav-u, np. Winampem. ( Options/Preferences/Plug-ins/Output zaznaczamy
pozycję Nullsoft Disk Writer plug-in v1.0(x86), następnie w Configure
zaznaczamy gdzie mają być zdekompresowane pliki mp3, następnie na Close, później
na play w oknie głównym w ten sam sposób możemy zdekompresować plik VQF). W
koderze Yamahy w oknie Source określamy lokalizację utworzonego wav-a , a w
oknie Destination ścieżkę do miejsca gdzie plik VQF ma być zapisany.
Podajemy tytuł , wykonawcę itp., aby zacząć kompresować klikamy na Start
Encoding. Polecam kodowanie bezpośrednio z płyty CD, uniknie się w ten sposób
utraty jakości spowodowanej podwójną kompresją sygnału audio. Mój WAV
zajmował 43,7 MB po kompresji na mp3 (128 Kb/s) wynosił 4,14 MB a po kodowaniu
na VQF ( 80 Kb/s) - 2,47 MB. Czas kompresji wyniósł 8 minut 31 sekund ( AMD
K6-2 400) Co do jakości ... cóż nie jestem koneserem muzyki, nie wychwyciłem
różnicy w jakości między tymi formatami ( piosenka poddana prze ze mnie
kompresji to "White dove" grupy Scorpions)- musicie sami posłuchać.
Zanim mp3 zostanie całkowicie, wyparte minie jeszcze trochę czasu, jednak już
teraz warto zapoznać się z tym formatem kompresji ( z pośród prezentowanej
trójki jego polecam wam szczególnie.), zwłaszcza jeżeli ktoś ma pokaźną
kolekcję muzyki mp3 i chce zmniejszyć o ok. 60 % jej rozmiar na dysku nie tracąc
przy tym na jakości.
AAC
- ( Advanced Audio Coding ) -
jest to zaawansowany format kompresji sygnału audio, w którym komitet MPEG
upatruje następcę dzisiejszego mp3. AAC stanowi część standardu MPEG II,
utworzony został przez instytut Frauenhofera i amerykański koncern AT&T
oraz firmy Sony i Dolby. Obecnie prace nad tym standardem nie są jeszcze ukończone
Mimo tego można się spodziewać, że format ten oprócz dobrej jakości dźwięku
będzie oferował kodowanie muzyki zabezpieczające prze nielegalnym
kopiowaniem. AT&T uruchomiła serwis muzyczny a2b ( www.a2bmusic.com
), gdzie za opłatą klient ma dostęp do utworów muzycznych jakościowo zbliżonych
do WAV, kodowanych na ACC. Nie dostępny jest program kodujący, który posiadałby
certifikat. W 1998 r. udostępniono kody źródłowe ISO MPEG4. Szybko pojawiły
się encodery i dekodery oraz odtwarzacz ACC. Niestety w związku z brakiem
jednego standardu można się spotkać z kilkoma produktami niekompatybilnymi ze
sobą. Najlepszą jakość oferuje encoder standardu Astrid/Quartex ( AAC
Encoder). Pliki skompresowane tym encoderem można odtworzyć za pomocą Kjofol
(obecnie dostępny Kjofol 2000 v.1), który wyłącznie obsługuje standard
Astrid/Quartex. Nie dostępne są wtyczki do Winampa obsługujące ten standard.
Kolejny standard, jako pierwszy wprowadził Homeboy. Dostępny jest zarówno
encoder jak i odtwarzacz plików ACC ( tylko do standardu Homeboy) - BitAAC a
także plugin do Winampa obsługujący tenże standard. Niestety dźwięk
uzyskany przez zastosowanie encodera nie jest dobry jakościowo. Ustępuje jakością
plikowi mp3 kodowanemu przy takiemu samemu stopniu kompresji. W sumie standard
Homeboy-a jest nie udany, nie może konkurować z mp3. Trzecią normę wprowadził
MBsoft. Coderem ( MBSoft AAC Encoder) tego producenta uzyskamy przyzwoitą jakość
dźwięku ( porównywalną z mp3 lub lepszą) przy dużej kompresji. Pliki
kodowane produktem Mbsoft-u można odtworzyć za pomocą Winampa z odpowiednim
pluginem (AAC Decoder). Poza tym istnieje kilka programów kodujących i dekodujących
napisanych przez indywidualnych programistów ( np. Advanced
Audio Coder, fAAC). Czas
potrzebny na skompresowanie Wav-u do formatu AAC jest różny i zależy od
rodzaju użytego oprogramowania. Najlepsze jakościowo pliki kodowane programem
Astrid/Quartex długo są kompresowane. Na P200MMX - 10 krotny czas utworu, na
PII 450 - 5 -ciominutowy WAV koduje się ok. 10 min. Niestety nie mogłem u
siebie kodować utworu coderem Astrid/Quartex - po skompresowaniu piosenki do
pliku AAC, plik nie był wykrywany przez odtwarzcza - Kjofol 2000. Także przy ręcznym
wskazaniu pliku, odtwarzacz nie odegrał go. Podobne trudności były z
Advanced Audio Coder v0.61. Ostatecznie plik AAC udało mi się stworzyć
programem Mbsoftu - AAC Encoder v0.4. Proces kodowania 43,7 MB ( 290 sek.) pliku
WAV przy kompresji 96 Kb/s na AMD
K6-2 400 trwał 23 minuty 26 sekund. W wyniku czego otrzymuje 2,97 MB plik AAC,
o jakości takiej jak mp3 przy 128 Kb/s. Jednak biorąc pod uwagę czas
kodowania, format ten wypada gorzej w porównaniu z mp3 czy VQF. Pamiętać należy
że przce nad formatem ciągle trwają, więc końcowe efekty mogą być bardzo
dobre.
Aby skompresować Wav-a do postaci AAC coderem MBSoftu w oknie programy kliknać
na Open input ( podajemy ścieżkę do WAV-a), następnie na Set Output (
podajemy miejsce zapisu pliku AAC), w Bitrate ustawiamy stopień kompresji ( 64,
96 lub 128 Kb/s) w Quality\Speed Settings wybieramy pozycję Normal , High
quality ( jeśli zależy nam na jakości otrzymanej muzyki) lub High Speed (
szybka kompresja), klikamy na Start. Aby odtworzyć nowo utworzony plik należy
zainstalować plugin do Winampa obsługujący standard MBSoft ( patrz wyżej)
MP4 - format ten nie jest następcą
dzisiejszego mp3. Mała amerykańska firma Global Music Outlet
producent oprogramowania wykupiła prawo do posługiwania się nazwą (
swoją drogą jeśli stać ją było na wykupienie nazwy to chyba nie jest całkiem
"mała" ) i właśnie pod nazwą mp4 próbuje rozpowszechnić
opracowany przez siebie format kompresji audio, który nie ma aprobaty komitetu
MPEG. Charakterystyczną cechą tego formatu ( oprócz większej wydajności,
ale o tym później) jest większa możliwość ochrony praw autorskich w sieci.
Programy do tworzenia plików mp4 dostępne są tylko dla właścicieli praw
autorskich danego utworu. Format MPEG4 Audio ( mpeg4 stosuje się również do
kompresji video, obrazów statycznych) jest to zbiór norm określających
kodowanie naturalnego oraz syntetycznego dźwięku. Norm tychże jest pięć:
-
SA (Structured Audio) - umożliwia
transmisje wysokiej jakości muzyki syntetycznej i efektów dźwiękowych.
-
TTSI (Text-to-Speech Interface)- umożliwia transmisje i synchronizacje z
innymi
formami dźwięku. Nie jest jeszcze określona żadna szczególna metoda
TTS.
-
T/F (Time-Frequency) umożliwia skalowanie, kodowanie dźwięku o
wysokiej jakości i szerokim paśmie od 24 kbps. Na 64 kbps na kanał jakość będzie
'przezroczysta', tzn. nie będzie można usłyszeć różnicy pomiędzy oryginałem
i dźwiękiem przetworzonym. Kodek jest oparty o system MPEG-AAC, z ulepszeniami
wziętymi z TWIN VQ, opisywanym powyżej. Otrzymany w ten sposób format pozwoli
na o polowe lepsza kompresje w porównaniu z MP3, bez utraty jakości. Można
wiec powiedzieć, że plikowi mp3 kompresowanemu na 128 Kb/s będzie odpowiadał
mp4 kodowany przy kompresji 64 Kb/s. Stosowany dla osiągnięcia najwyższej
jakości dźwięku.
-
CELP (Codebook-Excitation Linear Prediction) umożliwia kodowanie
mowy na 6-24 kbps. Na 24 kbps mowa jest przenoszona w sposób szerokopasmowy i
prawie bez żadnych zniekształceń, 6 kbps odpowiada jakości telefonicznej.
Stosowany dla średnich przepustowości.
-
PARA (Parametric coding) -
przesyłanie muzyki i mowy przy kompresji 2 - 24 kbps. Będzie możliwe przesyłanie
zrozumiałej mowy nawet poniżej 2 kb/s, czyli lepiej niż przy obecnym Real
Audio. Stosowanych dla najniższych przepustowości.
MPEG4
oferuje także wyciszanie błędów oraz skalowalność, składającą się z :
.
1.Skalowalnosc prędkości
przesyłania (bit rate scalability), pozwala na przekształcenie określonego
strumienia bitów w strumień o niższej szybkości przesyłania, umożliwiając
bezbłędna transmisje w zmiennych warunkach.
2. Skalowalność pasma przenoszenia, (bandwidth scalability), gdzie określone
części strumienia bitów przesyłają odpowiednie fragmenty widma sygnału. W
gorszych warunkach możliwe jest zawężenie przesyłanego widma, bez szkody dla
zrozumiałości materiału.
3. Skalowalność złożoności enkodera (encoder complexity scalability),
pozwala enkoderom o różnym stopniu złożoności na generowanie poprawnego
oraz zgodnego z norma sygnału
4. Skalowalność złożoności dekodera (dekoder complexity scalability),
pozwala na poprawne dekodowanie sygnału przez dekodery o różnym stopniu złożoności
Najogólniej, jakość dźwięku zależy od stopnia złożoności enkodera i
dekodera.
5. System korekcji błędów (error robustness) umożliwia dekoderowi korekcje
lub ukrycie słyszalnych zniekształceń spowodowanych błędami w trakcie
transmisji.
.
W MPEG4 jednym ze
skalowanych formatów jest standard BASC (Bit Sliced Arithmetic Coding), sposób
kodowania zbliżony jest do AAC, encoder różni się jedynie ulepszonym modułem
odpowiedzialnym za dynamikę. Dzięki temu, przy zawężeniu pasma transmisji
poniżej 40 kbps, pogorszenie jakości jest prawie niezauważalne. W praktyce,
podczas transmisji encoder jest w stanie zmieniać pasmo od 16 do 64 kbps, z
krokiem 1 kbps.
.
SAOL (Structured Audio
Orchestra Language) definiuje "orkiestrę" za pomocą poszczególnych
"instrumentów". "Instrument" jest to niewielka siec danych
dla procesora sygnałowego, pozwalająca na emulacje naturalnego brzmienia
instrumentu muzycznego.
.
SASL (Structured Audio
Score Language) jest używany do tworzenia nowych efektów oraz zawiera
informacje służące modyfikowaniu istniejącego dźwięku Pozwala na lepsza
kontrole syntezy oraz bardziej naturalny efekt końcowy. W przypadku, gdy nie
jest wymagana szczegółowa kontrola, do przesyłania danych o instrumentach może
być wykorzystany protokół MIDI.
.
W formacie MPEG4 po raz
pierwszy pojawia się także pojecie "obiektu audio". Najprościej można
go zdefiniować jako słyszalna cześć docierającego do odbiorcy materiału dźwiękowego,
zakodowana za pomocą pojedynczego strumienia bitów. Może to być np. glos
jednego lub kilku mówców, dźwięk jednego lub kilku instrumentów lub tło
akustyczne. Obiekty audio mogą być grupowane oraz miksowane, przy czym
rozdzielenie pojedynczego obiektu na mniejsze składowe jest już dosyć trudne.
Możliwości wykorzystania tego sposobu transmisji SA bardzo rozlegle:
- do odbiorcy, poprzez 5 kanałów przesyłany jest dźwięk z pięciu różnych
instrumentów wchodzących w skład orkiestry. Odbiorca może np. wyłączyć
jeden z instrumentów i grac razem z pozostałymi członkami zespołu.
- transmisja wydarzeń sportowych w kilku językach
- interaktywne filmy oraz aplikacje video, korzystające z obiektowego opisu
sceny, np. w typowej sekwencji z filmu, rozgrywającej się na dworcu kolejowym,
można wyróżnić kilka obiektów audio:
- rozmowa pomiędzy aktorami, najważniejszy element sceny
- tło akustyczne, np. gwar dworcowy oraz odgłosy nadjeżdżających pociągów
- zapowiedzi speakera o przyjazdach i odjazdach pociągów
- tło muzyczne (ścieżka dźwiękowa)
.
Każdy z obiektów dźwiękowych może być dowolnie modyfikowany,
zależnie od potrzeb. W trudniejszych warunkach transmisji, możliwe jest
ograniczenie pasma lub całkowite usuniecie obiektów nie mających wpływu na
treść przekazu.
Format MPEG4 oferuje znacznie więcej niż jego poprzednicy: MPEG1 oraz MPEG2.
Oprócz narzędzi umożliwiających kompresje i przesyłanie dźwięku
naturalnego, wzbogacony został o możliwości syntezy dźwięku po stronie
odbiorcy oraz skalowania przesyłanego strumienia bitów. Trwają także prace
nad formatem MPEG7, który ma połączyć większość aplikacji multimedialnych
w jedna całość. Pozwoli to na łatwe zarządzanie multimedialnymi zasobami
Internetu: wyszukiwanie, sprzedaż lub udostępnianie utworów oraz filmów.
Z
pośród opisywanych wyżej formatów kompresji muzyki polecam wam Twin VQ -
mniejsza wielkość pliku przy takiej samej jakości co mp3, poza tym nie miałem
żadnych trudności z kodowaniem/dekodowaniem muzyki do/z tego formatu. Również
nie ma problemów z ich odtworzeniem. Istotną rolę ma także tutaj krótki
czas kompresji. AAC to format nad
którym prace ciągle trwają, wykorzystywany jest on obecnie w radiofonii
cyfrowej oraz przy satelitarnej transmisji danych. Z pośród 4 użytych przeze
mnie encoderów tylko jeden działał ( MBSoftu). Brak standaryzowania spowodował,
że chcąc odtworzyć piosenkę w formacie AAC musimy zaopatrzyć się w kilka
odtwarzaczy lub kilka pluginów. Dopiero wtedy nie musimy się liczyć z sytuacją
kiedy to plik ACC nie chce być
odtworzony przez playera którego posiadamy, pomimo, że program potrafi
odtwarzać tego typu pliki.Piosenka bardzo długo się kompresuje do tego
formatu. Większość koderów działa
w trybie znakowym ( na produkty Homeboya i
Astrid/Quartex istnieje
graficzna nakładka). Jednak jak już wspomniałem, skoro formatem tym zajęła
się organizacja MPEG to lada dzień możemy oczekiwać przyzwoitego algorytmu
kompresji. Z kolei MP4 daje olbrzymie możliwości z dziedziny kompresji i
przesyłu sygnału audio. Szkoda tylko, że jak na razie format ten może być
odtworzony tylko na komputerach klasy IBM PC oraz, że programy kodujące nie są
powszechnie dostępne ( natknąłem się w sieci na strony gdzie były
informacje o encoderach mp4 jednak po sprawdzeniu okazało się, że są to
codery bazujące na AAC, nie oferujące wszystkich zalet MPEG4). Od lutego 1999
Global Music sprzedaje piosenki w formacie MP4 ( www.globalmusic.com)
Źródło:
www.iis.fhg.de
www.hitsquad.com
www.mp3.com.pl
Kryj Łukasz
xboy@poczta.wp.pl
|