EiS - ulubiony kiosk
  Ustaw nas jako stronę startową  Dodaj nas do swych ulubionych stron  EiS News - kanał RSS  EiS Forum News - kanał RSS  EiS na  Facebook  EiS na  Facebook  EiS na  Soundcloud.com    
EiS Online - Index  
 





EiS - numery archiwalne

     W numerze 2004-08          Strona główna archiwum

EiS 2004-08
  TECHNOLOGIA 

Odnawianie starych nagrań (2)
Czy można zrobić to (jeszcze) lepiej?

Dr inż. Janusz Biliński


W ubiegłym miesiącu omówiliśmy podstawowe zasady na jakich oparto odnawianie starych nagrań (lub popra­wianie nowych, co wcale nie należy do rzadkości) oraz przybliżyliśmy teorię związaną z eliminowaniem trzasków. Czas na informacje dotyczące usuwania przydźwięku, szumu i korekcję fazy sygnału.

Przydźwięk jest częstym synonimem dla wielu rodzajów zakłóceń. Często określa się tym terminem zakłócenia indukowane przez instalacje oświetleniowe czy ich fazowe regulatory mocy ("ściemniacze"). Zakłócenia te często przyjmują kształt szpilek, leżących blisko jedna przy drugiej. Przy innych okazjach przydźwiękiem określany jest dźwięk generowany przez niewłaściwe połączenia elektryczne, ekranowanie czy uziemienia. Wszystkie te przyczyny prowadzą do wystąpienia niepowołanych sygnałów, takich jak prosty przydźwięk sieciowy czy też zakłócenie o licznych składowych harmonicznych.

Usuwanie przydźwięków
Jak już wspomniano, sygnał akustyczny może być przedstawiony w domenie czasu, gdzie przyjmuje postać fali, lub w domenie częstotliwości, gdzie widać zawartość spektrum sygnału. Obie te domeny w różny sposób odzwierciedlają tę samą informację. Najważniejszym problemem jest wybór tej domeny, która zapewni najefektywniejsze możliwości modyfikacji i edycji sygnału akustycznego dla ściśle określonego celu. Przydźwięk można usunąć, stosując obróbkę w domenie czasu (licząc się z trudnościami w jego identyfikacji), lub w domenie częstotliwości, gdzie analiza składowych harmonicznych pozwala na znacznie łatwiejszą jego identyfikację.
Historycznie rzecz biorąc, do eliminacji przydźwięków zwykle używano łańcuchów filtrów. Najprostszym rozwiązaniem był filtr górnoprzepustowy, minimalizujący poziom wszystkich częstotliwości leżących poniżej częstotliwości odcięcia. Taką filtrację często stosuje się w eliminacji przydźwięku sieciowego, bowiem jego częstotliwość podstawowa jest zawsze określona (50 lub 60Hz). Wadą tej metody jest także eliminacja części sygnału użytecznego, traktowanego przez filtr jako zakłócenie, co odbija się na jakości niskich tonów (basów).
Niektóre rodzaje przydźwięku czy "brzęczenia" posiadają spektrum harmonicznych osiągające wiele kHz, o znaczącym natężeniu w całym paśmie. W takim przypadku filtracja górnoprzepustowa jest nieodpowiednia. Bardziej zaawansowane podejście polega na użyciu filtru grzebieniowego (comb filter), nazywanego tak z racji podobieństwa charakterystyki do tego przedmiotu codziennego użytku.
Filtry te pozwalają na usunięcie składowych sygnału o częstotliwościach równo oddalonych od siebie. Ponadto, im węższe są "wierzchołki" grzebienia, tym bardziej precyzyjnie są usuwane składowe widma częstotliwości. Na pierwszy rzut oka metoda ta wydaje się idealna, lecz w praktyce tak nie jest. Po pierwsze, filtr posiada takie same cechy jak wszystkie filtry statyczne: dla określonych częstotliwości usuwane są zarówno składowe zakłócające jak i składowe sygnału źródłowego w tych miejscach spektrum. Po drugie, filtry grzebieniowe wprowadzają charakterystyczną "pudełkowatość" (boxiness), czyniącą oryginalne brzmienie odległym i niewyraźnym. Problem ten jest tym bardziej widoczny, im bardziej "precyzyjne" są wierzchołki filtru. Minimalizując efekty uboczne wprowadzone przez pierwszą cechę, jednocześnie podkreślamy tę drugą. Po?trzecie, częstotliwości zakłócające nie muszą być zasadniczo stałe - wierzchołki filtru nie zawsze będą położone właściwie w stosunku do składowych zakłóceń i efekt filtracji może być, najogólniej mówiąc, mierny.

Odszumianie
W świecie idealnego dźwięku nie ma kliknięć, trzasków, chrobotów, brumień czy przydźwięku i szumu, lecz nasza rzeczywistość nie jest tak doskonała jak chcemy. Na początek należy zdefiniować pojęcie szumu szerokopasmowego, pod którym to pojęciem kryją się efekty, w wyniku działania których powstaje suma (lub iloczyn) losowych wartości amplitudy w zakresie całego spektrum częstotliwości akustycznych. Dlatego nie uwzględnia się artefaktów o ograniczonym czasie działania, takich jak kliknięcia czy trzaski, bowiem są one usuwane przy pomocy innych metod niż przedstawionych w dalszej części tego omówienia.
Na początek należy obalić kilka mitów związanych z dwustronnymi procesami (dual-ended processes), których działanie polega na odpowiednim kodowaniu sygnału podczas nagrywania i dekodowaniu przy jego odtwarzaniu. Procesy takie ograniczają kumulację dodatkowego szumu analogowej taśmy magnetycznej, lecz nie usuwają istniejącego szumu w sygnale. Inaczej mówiąc, ograniczają one ilość szumu dodawanego do sygnału w procesie nagrania i odtworzenia taśmy.
Proces jednostronny (single-ended process) usuwa szum z sygnału użytecznego bezpośrednio przed nagraniem go na taśmę. Jest też często wykorzystywany przy odtwarzaniu, gdzie poprawia stosunek sygnału do szumu nie wpływając na sygnał w sposób nieodwracalny. Można w bardzo dużym uproszczeniu porównać system jednostronny do układu regulacji poziomu głośności dźwięku, który działa efektywnie przy usuwaniu szumu, nie zmieniając stosunku sygnału do szumu i nie wprowadzając żadnych efektów ubocznych. Nie ma szumu, nie ma sygnału.
Z uwagi na fakt, że szum szerokopasmowy jest najbardziej widoczny w zakresie wyższych częstotliwości, pierwszym historycznym etapem w rozwoju było zastosowanie filtru dolnoprzepustowego, który usuwa część sygnału powyżej swojej częstotliwości odcięcia. Niestety, redukuje się wówczas poziom szumu i w takim samym stopniu poziom sygnału użytecznego. Filtr dolnoprzepustowy usunie szum ze starych nagrań pochodzących z płyt 78obr/min., które prawie wcale nie zawierają wysokich częstotliwości, lecz tylko kosztem właściwego nagrania.
Filtry dynamiczne są urządzeniami, których wartość częstotliwości odcięcia zmienia się dynamicznie proporcjonalnie do charakteru sygnału. W praktyce oznacza to, że usuwanie wyższych częstotliwości ma miejsce przy braku sygnału, lecz pozostają one nienaruszone, gdy szum jest maskowany przez oryginalne wysokie tony. Urządzenia tego typu mają ograniczone możliwości z uwagi na fakt, że usuwają częstotliwości tylko powyżej swojej częstotliwości odcięcia, która sama w sobie niedokładnie odpowiada najwyższym częstotliwościom sygnału oryginalnego. Ponadto, w zwykle prostych filtrach nachylenie zbocza charakterystyki filtru wynosi 12 lub 24dB/okt., co powoduje, że nie wszystkie składowe szumu są usuwane. Dodatkową cechą negatywną jest szybkość filtracji, przez co występuje "zaokrąglenie" transjentów i stępienie sygnały źródłowego.
Rodzi się wówczas pytanie - w jaki sposób zmieniać poziom zamiast wpływać na odpowiedź częstotliwościową sygnału? Należy przy tym wziąć pod uwagę fakt, że gdy szum posiada względnie stałą amplitudę i jest obecny w całym nagraniu, a amplituda sygnału użytecznego przyjmuje wartość poniżej wartości szumu, wówczas można przyjąć, że nie ma sygnału źródłowego. O ile istnieje szereg słabych punktów tej argumentacji, to wynika z nich sugestia urządzenia, które może wyeliminować pewną część szumu - mowa tu o bramce szumu. Bramka szumu wykrywa spadek poziomu sygnału poniżej ustawionego progu i odpowiednio wycisza (wycina) sygnał. Istnieją liczne usprawnienia tej idei, stosowane w celu wyeliminowania niepożądanych efektów ubocznych, lecz zasada pozostaje taka sama. Niestety, "otwarta" bramka nie usuwa szumu.
Innym urządzeniem jest ekspander. W odróżnieniu od bramki szumu redukuje progresywnie wzmocnienie w sposób określony przez użytkownika. Na przykład, jeżeli poziom sygnału spada o 3dB poniżej ustalonego progu, wówczas ekspander może obniżyć poziom sygnału o 6dB lub 12dB (w zależności od współczynnika). Niestety, względna różnica pomiędzy bramką i ekspanderem nie jest zbyt duża.
Ekspander wielopasmowy (multi-band expander) rozdziela spektrum sygnału akustycznego na szereg pasm, traktując każde z nich jako sygnał indywidualny. Jednostki wielopasmowe nie potrafią odróżnić sygnału użytecznego od szumu. Przyjmują niewłaściwe założenie, że jeżeli poziom sygnału całkowitego osiąga poziom szumu, wówczas jest obecny w sygnale wyłącznie szum. W konsekwencji nawet najbardziej skomplikowane i rozbudowane ekspandery usuwają sygnał oryginalny. Ponadto słaba separacja filtrów pasmowych (typowo 6 lub 12dB/oktawę) znacząco obniża osiągi ekspandera. Konsekwencją jest utrata wysokich tonów, utrata pogłosu otoczenia i degradacja agresywnych (twardych) transjentów. Niektóre kompresory łączą w sobie kombinację filtracji dynamicznej, ekspansji a nawet kompresji i efektu exciter. Efekty te maja za zadanie ukrycie efektów ubocznych procesów redukcji szumu. Jednak zawsze jest to tylko częściowy sukces.

Odszumianie w domenie cyfrowej
Wszystkie te dotychczas opisane procesy są procesami "współczynnikowymi", to znaczy, iż dla danej częstotliwości usunięcie części szumu oznacza także usunięcie takiej samej części sygnału właściwego. W przypadku pracy w domenie cyfrowej przy zastosowaniu DSP możliwy jest podział na setki pasm i bardzo precyzyjne usunięcie szumu z wybranego pasma. Brzmi to niezwykle pięknie i zachęcająco, lecz jak zwykle diabeł tkwi w szczegółach. Spektrum szumu (próbka akustyczna) może być uzyskane w pasażu bez muzyki, a jeżeli będzie niedokładne wówczas pojawią się niepożądane i nieprzyjemne efekty uboczne. Załóżmy jednak, że próbka szumu została pobrana idealnie, można wówczas oczekiwać, że usunięcie szumu będzie bardzo efektywne, a efekty uboczne znikome lub żadne. Lecz doświadczenie obróbki cyfrowej pokazuje, że cyfrowy podział spektrum powoduje, że sygnał staje się "suchy" i "tępy" z licznymi artefaktami. Jest to spowodowane faktem, że próbka szumu jest "migawką" przebiegu losowego, będąca wzorcem tylko dla tego miejsca, skąd pochodzi. Szum podlega zmianom i fluktuacjom, a algorytm opracowuje wynik na podstawie nieodpowiednich danych.
Wiele firm i niezależnych twórców programów opracowało usprawnienia, mające na celu eliminację zjawisk negatywnych. Cytowany już wcześniej Cedar w procesie odszumiania dokonuje aktualizacji profilu szumu (próbki) okresowo, co 1024 próbki. Pozwala to na dynamiczne śledzenie zmienności szumu. Chroni to także przed kompresją nadchodzących transjentów i pozwala na rozróżnienie między rzeczywistym (prawdziwym) szumem i na przykład, pogłosem w sygnale oryginalnym. Pozostałe cechy pomagają w uniknięciu licznych problemów prostego podziału spektralnego, umożliwiając usunięcie szumu bez niszczącego wpływu na sygnał źródłowy.
Algorytm ten wymaga stosunkowo złożonego interfejsu użytkownika i nie występuje jako samodzielny program. Pomijając wymóg posiadania i aktualizacji próbki spektralnej szumu można ten interfejs znacząco uprościć, lecz wówczas algorytm wymaga możliwości autonomicznego określenia składu szumu. Rozwiązanie takie przyjęto w systemie Cedar DH-2 i DHX. Są to indywidualne moduły, samodzielnie analizujące składowe szumu i usuwające szum przy minimalnej ingerencji ze strony użytkownika. System Cedar Cambridge posiada rozbudowane moduły do usuwania szumu. Są to Broadband Noise Reduction NR-4, Dehiss oraz Dialogue Noise Suppression DNS.

Korekcja fazy
Odrębnym zagadnieniem jest korekcja fazy. W systemie Cedar pierwszym urządzeniem tego typu był korektor fazy/czasu pracujący w środowisku DOS. Był on przeznaczony dla rozgłośni radiowych i stacji telewizyjnych, dla których istotnym zagadnieniem było zapewnienie zgodności przekazu z trybem monofonicznym. Nazwa modułu była myląca dla użytkowników, bowiem urządzenie to nie korygowało błędów fazowych w ramach sygnału, a jedynie błędy czasowe (timing errors). Następna generacja oprogramowania była zastosowana w serii modułów sprzętowych Cedar 2 w urządzeniu Azimuth Corrector AZ-1. Podobnie i w tym przypadku, nazwa nie w pełni odpowiadała możliwościom urządzenia. Użycia nazwy "azymut" sugeruje, że błędy powstają wyłącznie przy zapisie taśmowym. W rzeczywistości błędy czasowe powstają podczas niezgodności czasowej odtwarzania ścieżek nagrania. W mniejszym stopniu można spotkać się z tym zjawiskiem przy nieliniowej pozycji igły głowicy gramofonowej. Przesunięcie fazowe reprodukowanych kanałów wnosi niepożądane efekty w postaci wygaszenia (zsumowania sygnałów w przeciwfazie) lub wzmocnienia (suma sygnałów w fazie) wybranych częstotliwości lub części pasma, negatywnie wpływając na wierność odtwarzania. W domenie cyfrowej widok spektrum przypomina szerokopasmowy filtr grzebieniowy, którego wierzchołki są oddalone od siebie o wielkość błędu czasowego. Nagranie odtworzone z błędami czasowymi może być uboższe w wysokie tony, może mieć zamulony bas, problemy z kompatybilnością monofoniczną, jak i niejasny obraz planu stereofonicznego. Co gorsza, jeżeli błąd czasowy nie jest stały, wówczas jest słyszalny jest efekt "flangingu", wywołany zmiennością położenia wierzchołków ("zębów") umownego filtru grzebieniowego. Inżynierowie dźwięku wykorzystują szereg procesorów, by ukryć te niedostatki: korektory graficzne i parametryczne, enhancery stereo, procesory dynamiki i pogłosu. Jednak żadne z tych urządzeń nie dochodzi do istoty problemu - małych, lecz?znaczących błędów synchronizacji odtwarzanych kanałów.
W urządzeniach firmy Cedar wykorzystano inne podejście do eliminacji zjawisk tego typu. W pierwszym etapie procesu następuje identyfikacja składowych monofonicznych w nagraniu stereo i następuje pomiar różnicy czasowej pomiędzy kanałami. W przypadku wykrycia błędu system odtwarza właściwe położenie sygnału na osi czasu. Pomiary czasowe są dokonywane z częstotliwością prawie 50Hz, zaś zmiana położenia próbki sygnału jest dokonywana dynamicznie w czasie rzeczywistym. Szum próbkowania i "szpilki" cyfrowe są eliminowane w procesie regeneracji, który pracuje z dokładnością lepszą niż 1% wartości próbki. Na wejściu urządzenia znajduje się blok filtrów, eliminujący możliwość błędnego działania urządzenia przy małej ilości lub braku składowych monofonicznych. Ułatwieniem dla użytkownika jest możliwość pracy w trybie automatycznym lub manualnym.
Metoda taka posiada jeszcze jedną zaletę. Przy przegrywaniu nagrań monofonicznych na sprzęcie stereofonicznym (gramofon, magnetofon) uzyskuje się dwa sygnały monofoniczne. Każdy z nich zawiera sygnał źródłowy i szum. Przy eliminacji błędów czasowych i zsumowaniu kanałów uzyskuje się sygnał, w którym poziom sygnału źródłowego jest o 6dB wyższy niż przedtem, zaś poziom szumu jest wyższy tylko o 3dB (co jest konsekwencją losowego charakteru szumu). W efekcie tej operacji stosunek wartości sygnału do szumu zwiększa się o 3dB zanim zostanie przeprowadzona pierwsza z operacji odszumiania.

Podsumowanie
Przedstawione powyżej rozważania, obok pewnej niezbędnej dawki rozważań teoretycznych, pokazują jak daleko zaszły rozwiązania systemów profesjonalnych. Nie należy jednak wpadać w rozpacz, że pozostają one poza zasięgiem Czytelników. W warunkach domowych bardzo dobre rezultaty dają narzędzia dostępne jako wtyczki VST i DX, opisywane na łamach EiS. Dla zastosowań profesjonalnych służą inne narzędzia.
W praktyce przy procesie odnawiania nagrań każdy będzie musiał znaleźć samodzielnie odpowiedź na filozoficzne pytanie: jak daleko posunąć się w rekonstrukcji? Czy koniecznie należy usunąć wszystkie zakłócenia i pozostawić materiał sterylnie czysty? Czy atmosfera starego nagrania będzie obdarzona właściwym klimatem? Tu zwykle przychodzi z pomocą wymiana poglądów z właścicielem materiału źródłowego. Stare nagrania z reguły są bardzo rzadko odsłuchiwane, by dodatkowo nie degradować jakości nośnika. Nagrania te i ich klimaty nieustannie "grają w duszy" u ich wielbicieli, a wyobrażenie o nich odbiega niejednokrotnie od tego, co odtwarzają monitory bliskiego pola. Co więcej, niejednokrotnie słuchacze wiedzą lepiej, jak powinien brzmieć głos wokalisty, gitary, perkusji. Każdy "opraw­ca dźwięku" musi być wtedy przygotowany na liczne narzekania, pomówienia, ataki, sugestie porażającej głuchoty, gruboskórności akustycznej, przyspawania strzemiączka do kowadełka i bliskiego kontaktu ze słoniem, bowiem efekt końcowy nie jest taki, jaki być powinien. Można pokusić się o unowocześnienie nagrań, choćby przez zastosowanie kompresji i podniesienie poziomu głośności. Meloman zawsze chętnie odbierze kilka różnych kopii i będzie je z upojeniem i w upojeniu wzajemnie porównywał. Wynik końcowy może odbiegać od oryginału, ale będzie lepiej akceptowany przez odbiorcę. Celem procesu jest nie tylko konserwacja zabytków, zachowanie czystej formy, lecz sprawienie duchowej przyjemności słuchaczowi, czego sobie i Czytelnikom życzy autor niniejszego materiału.

Do potrzeb artykułu wykorzystano materiały firmy Cedar (www.cedar-audio.com) udostępnione przez oficjalnego dystrybutora na terenie Polski, Dave s.c. (tel. 022 826-49-12, dave@dave.com.pl).


     


     Drukuj artykuł       drukuj artykuł

     W numerze 2004-08          Strona główna archiwum