Optymalny kodek audio i odpowiedni format / opcja nagrywania głosu w małych i dużych salach wykładowych

Microsoft OneNote dostarczany z pakietem Office2010 bardzo dobrze nadaje się do oprogramowania do robienia notatek. Zawiera funkcję nagrywania audio / wideo lub tylko audio. Opcje w programie dla kodeków to a) Windows Media Audio 9, b) Windows Media Audio 9.2, oraz c) Windows Media Audio 10 Professional. Zwłaszcza w przypadku tego ostatniego kodeka, wiele dostępne są formaty, od <0kbps, 8kHz, mono CBR>, do <320 kbps, 44 khz, stereo (a > CBR>. Wydaje się, że są podzielone na dwie kategorie: (A / V) i nie-A / V (cokolwiek to znaczy, nie wiem), a następnie zgodnie z ich kHz, a następnie z kbps. Wrzucone są również opcje stereo, mono i tzw.

Dzięki podstawowemu zrozumieniu tych pojęć można się domyślić, że 320 kb / s 48 kHz CBR jest przesadą dla tej filozofii użytkowania, a 0 kb / s 9 kHz, mono CBR pozostawia wiele do życzenia w jakości, szczególnie w przypadku dysków twardych o pojemności 1 TB w tych dniach. Jednak odpowiedź na pytanie, który format najlepiej pasowałby do tej filozofii użytkowania, jest kolejnym pytaniem, które może wymagać innego poziomu wiedzy niż większość ludzi. Można zastosować podejście „spróbuj i zobacz”, ale to pytanie wydaje się dobrze pasować do administratora, który nie chce już publikować postów.

Tak więc moje pytanie brzmi: Która kombinacja kodeków / formatów byłaby najlepiej dostosowana do filozofii użycia nagrań dźwiękowych do notatek w dużej lub małej sali wykładowej. To mogą być dwa pytania; czy określony kodek byłby pożądany w niektórych rozmiarach pomieszczeń?

p.s. podpytanie: Co w profesjonalnym kodeku Windows Media Audio 10 określa format (A / V)?

microsoft-onenote bitrate wma jhstuckey
źródło

Czy kiedykolwiek odkryłeś różnicę między formatami A / V i nie-A / V WMA 10?

Brian Cauthon

Szybkość transmisji to, jak dobrze dźwięk może być przybliżony przez określoną ilość danych. Zbyt niskie przepływności wprowadzają zniekształcony głos, dziwne artefakty i nienaturalne, wygładzone transjenty (krótkie dźwięki jak litera T). Wyższe przepływności będą lepiej pasowały do oryginalnej treści, ale potencjalnie bezużyteczne, jeśli korzyści nie będą wyraźnie słyszalne (przesada). Zmienna szybkość transmisji zawsze zapewnia lepszą jakość tej stałej przepływności CBR przy tej samej określonej przepływności, ponieważ koder koncentruje więcej wysiłku (danych) na najtrudniejszych do zakodowania częściach.

Szybkość transmisji połączeń: Integralność dźwięku .

Próbna stawka wpływa na możliwe widmo częstotliwości, które może mieć plik audio. Typowa wartość to 44 kHz, ponieważ praktycznie obejmuje cały zakres słyszalny (0-22 kHz). Zmniejszając częstotliwość próbkowania, upuszczasz wyższe częstotliwości, które nie będą już kodowane, dzięki czemu łatwiej będzie zakodować to, co zostało, z lepszą integralnością. Zmniejszenie częstotliwości próbkowania może jednak zmienić szum tła występujący w większości nagrań, co może powodować niepożądane efekty uboczne (ostrzejszy szum) i ostatecznie sybilant wydaje („s” dźwięki) lub zwykłą bez życia - nawet przy bardzo wysokich przepływnościach. Obniżenie częstotliwości próbkowania może być bardzo skutecznym kompromisem przy pracy z bardzo niskimi przepływnościami; Protokoły telefonii VoIP są tego doskonałym przykładem.

Wybierz częstotliwość próbkowania Bogactwo audio .

Stereo: jeśli twój dźwięk jest głównie mono, jak mowa, marnujesz połowę przepustowości, kodując go jako stereo (chyba że jest to wspólny stereo, ale to już inna historia).

Z muzyką myślę, że jest to powszechna wiedza, że 128kbps 44,1 kHz stereo z MP3 jest punktem krytycznym, w którym degradacja muzyki jest odczuwalna przez prawie każdego, a jednocześnie jest możliwa do słuchania. Ponieważ mowa jest łatwiejsza do kodowania niż muzyka, myślę, że jej monofoniczny odpowiednik -MP3 64 kb / s 44,1 kHz - stanowi świetny punkt wyjścia z dużą jakością do większości celów, a jednocześnie nie jest przesadą.

Wreszcie Windows Media Audio ma być znacznie bardziej wydajny niż MP3. Można więc łatwo zrównoważyć te punkty odniesienia o 25-40% (np. WMA 40kbps powinno być podobne do MP3 64kbps). Najwyraźniej WMA Professionnal ma być lepszy niż WMA 9 zmniejszenie liczby opcji kodowania o niskiej przepływności że WMA9 ma i automatycznie używa najlepszej metody dla większości treści. Jeśli więc nie musisz odtwarzać go na urządzeniach obsługujących tylko WMA9, jest to prawdopodobnie lepsza opcja.

Mam nadzieję, że stamtąd uda ci się podążać w górę (lub w dół).

mtone
źródło

Optymalny kodek audio i odpowiedni format / opcja nagrywania głosu w małych i dużych salach wykładowych

Odpowiedzi: