Jaka jest ogólna ogólna zasada dotycząca rozmiarów plików (w KB, MB, GB itp.)? [Zamknięte]

3

Zwykle mam problemy z intuicyjnym zrozumieniem, ile naprawdę mogę przechowywać, gdy ktoś mówi, że pewien produkt z takiej a takiej firmy pozwoli ci przechowywać piosenki o wartości 80 GB, podczas gdy inny daje 160 GB i tak dalej. Liczby stojące same sobie wydają się tak abstrakcyjne, a dla mnie wydają się, że można je zmierzyć tylko względem siebie!

Zastanawiałem się tylko, czy istnieją jakieś „ogólne zasady” dla różnych plików, takich jak plik tekstowy, plik mp3, mały plik Word, wideo, e-mail itp. Rozumiem, że nawet w ramach określonego typu, wszystkie są różne, ale czy istnieje ogólna, rozsądna liczba, która jest zwykle używana do ich opisu?

Plik tekstowy - ?
plik mp3 -?
mały plik Word -?
itp

A przynajmniej, czy istnieje szybki sposób na przybliżenie go dla każdego konkretnego napotkanego przypadku?

Mroczny Templariusz
źródło

Odpowiedzi:

4
  • W przypadku plików tekstowych zależy to od kodowania. Jeśli użyjesz ASCII, będzie to 1 bajt / char . Jeśli użyjesz UTF-8, będzie to zależeć od konkretnych znaków, od 1 do 4 bajtów / znak . Ale dotyczy to głównie języków wschodnioazjatyckich z dużą ilością znaków. Jeśli konwertujesz plik ASCII (tylko alfabet łaciński) na UTF-8, różnica w rozmiarze pliku powinna być minimalna.

  • W przypadku plików MP3 tak naprawdę zależy to od kodowania. Jeśli masz pliki MP3 o wysokiej przepływności, zajmie to o wiele więcej miejsca niż coś o niskiej przepływności. Możesz jednak oszacować z grubsza 5 MB / plik .

  • Pliki Word zależą od formatu .doc vs .docx. W przybliżeniu szacuje się, że Word ma prawdopodobnie 10 KB / stronę , z wyjątkiem przypadków wklejenia do nich zdjęć (trudne do przewidzenia rozmiaru).

Pamiętaj także o różnicy między przedrostkami dziesiętnymi SI a binarnymi przedrostkami IEC: 1 kilobajt (KB) = 10 ^ 3 = 1000 bajtów dla SI, 1 kibibajt (KiB) = 2 ^ 10 = 1024 bajtów. Chociaż nie powinni, większość producentów dysków twardych miesza to na swoją korzyść.

srunni
źródło
Dzięki. Jestem po prostu ciekawa, ale dlaczego istnieją różne kodowania postaci? Dlaczego nie można po prostu trzymać się standardu?
Dark Templar
1
@JacobHayden: To dlatego, że nie wszyscy mówią po angielsku. . .
surfasb
@JacobHayden: UTF-8 to nowoczesny standard. ASCII jest dziedzictwem, które pozostało z czasów, gdy informatyka ograniczała się głównie do krajów anglojęzycznych, więc aby zaoszczędzić miejsce (co wtedy było rzadkością), dostępny był tylko alfabet łaciński, cyfry arabskie i niektóre znaki interpunkcyjne.
srunni
2

Problem polega na tym, że wszystkie odpowiedzi zależą od ilości danych w pliku, tj. Dwa razy więcej stron tekstu w pliku tekstowym podwoi rozmiar pliku.

  • W przypadku plików tekstowych, które mam wokół, jest to około 2kB na stronę .
  • plik mp3 zależy od długości i stopnia kompresji. W przypadku pliku 128 kb / s (takiego jak te unoszące się w sieciach P2P) jest to około 1 MB na minutę , więc utwór o długości 3 minut wynosi 3 MB. W przypadku rzeczy wyższej jakości, takich jak to, co kupujesz w iTunes lub Amazon (256 kb / s), jest to 2 MB na minutę, więc ten sam 3-minutowy utwór to 6 MB.
  • Plik Word zależy w dużej mierze od tego, co w nim umieścisz. Plik .doc na jednej stronie z normalnym formatowaniem (tj. Akapity, nagłówki i inne rzeczy) ma około 26 kB plus 4 kB na stronę , podczas gdy w przypadku .docx rozmiar to około 10 kB plus 3 kB na stronę . Jeśli dodasz zdjęcia, taki rozmiar oczywiście się powiększy.
Pan Alpha
źródło