Jak kodować dźwięk za pomocą kodeka Opus?

30

Kodek audio Opus wygląda na najlepszą rzecz do kompresji dźwięku. Niedawno stał się obsługiwany w najnowszych odtwarzaczach ffmpeg i VLC. Jednak nie ma dokumentacji, która mogłaby znaleźć kodowanie multimediów. Czy ktoś może skierować mnie do wspomnianych dokumentów, najlepiej ze szczegółami dotyczącymi flag i użycia ffmpeg? Mam dużo audiobooków, które zajmują o wiele za dużo miejsca, a Opus wygląda na idealny format do ich przechowywania.

MrDrMcCoy
źródło
1
Nie wspomniałeś o swoim systemie operacyjnym.
llogan,

Odpowiedzi:

39
ffmpeg -i <input> -c:a libopus -b:a bitrate <output>

Szybkość transmisji można podać jak -b:a 96Kdla 96 kBit / s.

Dokumentacja ffmpeg zawiera listę opcji i opisów dla libopus. Tutaj możesz ustawić -vbropcje lub inne -compression_level.

Upewnij się, że skompilowałeś ffmpeg --enable-libopus!

Adam Chance
źródło
To jest świetne! Nauczyłem się kodować za pomocą ffmpeg, ale nie wiedziałem o flagach -vbr i --compression_level. Właśnie tego szukałem!
MrDrMcCoy,
6
To mi pomogło. NB, vbr oni compression_level 10są domyślne i prawdopodobnie może zostać pominięty. ffmpeg.org/ffmpeg-codecs.html#Option-Mapping
Joshua Huber
1
Rzeczywiście są to wartości domyślne i w większości przypadków nie trzeba ich modyfikować. Zauważ też, że bitrate jest w bitach / s, a nie w zwykłych kbitach / s. Domyślna szybkość transmisji wynosi 96000 (96 kbitów / s), co jest (oczywiście zapewne) dobrą wartością. Przykładowe polecenie do podsumowania:ffmpeg -i input.flac -acodec libopus -b:a 128000 output.opus
Gras Double
Oto jak użyć parametru „application” -application voip. Jako nowy użytkownik ffmpeg miałem trochę trudności ze znalezieniem właściwej składni.
tuxayo
15
  1. Pobierz narzędzia Opus

  2. Kodować:
    opusenc --bitrate 64 What_A_Feeling.wav What_A_Feeling_64.opus

  3. Dekodowanie: (do odtwarzania w dowolnym odtwarzaczu multimedialnym, przydatne, jeśli Twój odtwarzacz multimedialny nie obsługuje jeszcze opus):
    opusdec What_A_Feeling_64.opus What_A_Feeling_opus64.wav

(What_A_Feeling to nazwa piosenki)

Szczegółowe opcje wyświetlane podczas opusencsamodzielnego działania:

Usage: opusenc [options] input_file output_file.opus

Encodes input_file using Opus.
It can read the WAV, AIFF, FLAC, Ogg/FLAC, or raw files.

General options:
 -h, --help         This help
 -V, --version      Version information
 --quiet            Quiet mode

input_file can be:
  filename.wav      file
  -                 stdin

output_file can be:
  filename.opus     compressed file
  -                 stdout

Encoding options:
 --bitrate n.nnn    Target bitrate in kbit/sec (6-256/channel)
 --vbr              Use variable bitrate encoding (default)
 --cvbr             Use constrained variable bitrate encoding
 --hard-cbr         Use hard constant bitrate encoding
 --comp n           Encoding complexity (0-10, default: 10 (slowest))
 --framesize n      Maximum frame size in milliseconds
                      (2.5, 5, 10, 20, 40, 60, default: 20)
 --expect-loss      Percentage packet loss to expect (default: 0)
 --downmix-mono     Downmix to mono
 --downmix-stereo   Downmix to stereo (if >2 channels)
 --max-delay n      Maximum container delay in milliseconds
                      (0-1000, default: 1000)

Diagnostic options:
 --serial n         Forces a specific stream serial number
 --save-range file  Saves check values for every frame to a file
 --set-ctl-int x=y  Pass the encoder control x with value y (advanced)
                      Preface with s: to direct the ctl to multistream s
                      This may be used multiple times

Metadata options:
 --comment          Add the given string as an extra comment
                      This may be used multiple times
 --artist           Author of this track
 --title            Title for this track
 --album            Album or collection this track belongs to
 --date             Date for this track
 --genre            Genre for this track
 --picture          Album art for this track
                      More than one --picture option can be specified.
                      Either a FILENAME for the picture file or a more
                      complete SPECIFICATION form can be used. The
                      SPECIFICATION is a string whose parts are
                      separated by | (pipe) characters. Some parts may
                      be left empty to invoke default values. A
                      FILENAME is just shorthand for "||||FILENAME".
                      The format of SPECIFICATION is

                      [TYPE]|[MIME-TYPE]|[DESCRIPTION]|[WIDTHxHEIGHT
                      xDEPTH[/COLORS]]|FILENAME

                      TYPE is an optional number from one of:
                      0: Other
                      1: 32x32 pixel 'file icon' (PNG only)
                      2: Other file icon
                      3: Cover (front)
                      4: Cover (back)
                      5: Leaflet page
                      6: Media (e.g., label side of a CD)
                      7: Lead artist/lead performer/soloist
                      8: Artist/performer
                      9: Conductor
                      10: Band/Orchestra
                      11: Composer
                      12: Lyricist/text writer
                      13: Recording location
                      14: During recording
                      15: During performance
                      16: Movie/video screen capture
                      17: A bright colored fish
                      18: Illustration
                      19: Band/artist logotype
                      20: Publisher/studio logotype

                      The default is 3 (front cover). There may only be
                      one picture each of type 1 and 2 in a file.

                      MIME-TYPE is optional. If left blank, it will be
                      detected from the file. For best compatibility
                      with players, use pictures with a MIME-TYPE of
                      image/jpeg or image/png. The MIME-TYPE can also
                      be --> to mean that FILENAME is actually a URL to
                      an image, though this use is discouraged. The
                      file at the URL will not be fetched. The URL
                      itself is stored in the metadata.

                      DESCRIPTION is optional. The default is an empty
                      string.

                      The next part specifies the resolution and color
                      information. If the MIME-TYPE is image/jpeg,
                      image/png, or image/gif, you can usually leave
                      this empty and they can be detected from the
                      file. Otherwise, you must specify the width in
                      pixels, height in pixels, and color depth in
                      bits-per-pixel. If the image has indexed colors
                      you should also specify the number of colors
                      used. If possible, these are checked against the
                      file for accuracy.

                      FILENAME is the path to the picture file to be
                      imported, or the URL if the MIME-TYPE is -->.
 --padding n        Extra bytes to reserve for metadata (default: 512)
 --discard-comments Don't keep metadata when transcoding
 --discard-pictures Don't keep pictures when transcoding

Input options:
 --raw              Raw input
 --raw-bits n       Set bits/sample for raw input (default: 16)
 --raw-rate n       Set sampling rate for raw input (default: 48000)
 --raw-chan n       Set number of channels for raw input (default: 2)
 --raw-endianness n 1 for bigendian, 0 for little (defaults to 0)
 --ignorelength     Always ignore the datalength in Wave headers
Alexey Eromenko
źródło
Dzięki, ale liczyłem na coś bardziej szczegółowego. Czy są dostępne opcje zmiennej przepływności? Jakie inne flagi mogę przekazać, aby zoptymalizować strumień audio?
MrDrMcCoy,
1
@nakedhitman --vbrOpcja jest domyślna. Zobacz stronę man dla opusenc. Możesz także kodować za pomocą ffmpeg, ale należy go skompilować --enable-libopuspo zainstalowaniu libopus .
llogan 9.12.12
Aby uzyskać pomysł (nie konwersję wsadową), taka wersja online może być pomocna. W przypadku, gdy planuje się konwersję całej kolekcji, opusinfo (także część opus-tools) może powiedzieć, czy wybrane narzędzie do kodowania działa dobrze.
Rainer Rillke,
3

Najlepsze komendy kodeków Opus w DOS / Windows Command to:

W przypadku lib 1.3 najmniejszy rozmiar pliku (jakość taśmy):

Opusenc a.wav a.opus --bitrate 24 --framesize 40 --discard-comments --discard-pictures

Będziesz:

a - przy 24 kbitach nadal ma wyjście dźwiękowe 16 kHz (32 kHz stereo), przy bardzo małym rozmiarze. Każde mniejsze wyjście Sonic spadnie do 11 kHz

b- Zwiększ rozmiar ramki (zapisz kilka bitów danych (około 6%), bez zauważalnej utraty jakości)

c- Odrzuć niepotrzebne informacje z TAGU i zakryj zdjęcia, które tylko powiększą rozmiar pliku.

W przypadku lib 1.3, streaming (prawie jakość CD) używa '--bitrate 52' zamiast '24'.

Domyślnie w 1.2 jest to 48 kbitów, ale przy 52 w 1.3, przy „rozmiar ramki” ustawionej na 40, rozmiar pliku jest równy, ale słyszalnych jest znacznie mniej artefaktów.

52 kbity z rozmiarem ramki 40, jest prawdopodobnie jakościowo równy 160 kb / s MP3, przy rozmiarze mniejszym niż 1/3; podczas gdy 48 kbitów w wersji 1.2 to 128 kbitów MP3 lub tylko 2,5 razy mniejszy rozmiar.

Aby uzyskać niemal identyczną jakość, potrzebujesz od 80 do 96 kbitów. Prawie nigdy tego nie używam, ponieważ chcę, aby mój dźwięk był jak najmniejszy.

Ponad 96 kbitów nadaje się tylko do edycji i nie słychać różnicy między plikiem oryginalnym a plikiem zakodowanym w Opusie.

Biorąc to pod uwagę, nie wiem jeszcze, jak to wszystko działa w systemie Linux.

ProDigit
źródło
Mam błąd podczas próby że jeden zarówno na Linux i Windows: Unrecognized option '-framesize'. Error splitting the argument list: Option not found. Wersja ffmpeg to 4.0.2
sukhmel