Wizualnie i słyszalnie jednoznaczny podzbiór alfabetu łacińskiego?

13

Wyobraź sobie, że dajesz komuś kartę z kodem „5SBDO0”.

W niektórych czcionkach trudno jest wizualnie odróżnić literę „S” od cyfry pięć (jak w przypadku cyfry zero i litery „O”).

Czytając kod na głos, odróżnienie „B” od „D” może być trudne, wymagając wymówienia „B jak u chłopca”, „D jak u psa” lub użycia zamiast tego „ alfabetu fonetycznego ”.

Jaki jest największy podzbiór liter i cyfr, który w większości przypadków będzie wyglądał jednoznacznie wizualnie i będzie brzmiał jednoznacznie, gdy będzie czytany na głos?


Tło:

Chcemy wygenerować krótki ciąg znaków, który może zakodować jak najwięcej wartości, jednocześnie zachowując łatwość komunikacji.

Wyobraź sobie, że masz ciąg 6 znaków, „123456”. W bazie 10 może to kodować wartości 10 ^ 6.

W zapisie szesnastkowym „1B23DF” możesz zakodować 16 ^ 6 wartości w tej samej liczbie znaków, ale może to brzmieć dwuznacznie, gdy odczytywane na głos. („B” vs. „D”)

Podobnie dla dowolnego ciągu N znaków otrzymujesz (rozmiar alfabetu) ^ N wartości.

Ciąg jest ograniczony do długości około sześciu znaków, ponieważ chce się łatwo zmieścić w pojemności pamięci roboczej człowieka .

Dlatego, aby znaleźć maksymalną liczbę wartości, które możemy zakodować, musimy znaleźć ten największy jednoznaczny zestaw liter / cyfr. Nie ma powodu, dla którego nie możemy brać pod uwagę liter GZ i niektórych typowych znaków interpunkcyjnych, ale nie chcę ręcznie porównywać parami „czy G brzmi jak A?”, „Czy G brzmi jak B?”, „Czy Sam G brzmi jak „C”. Jak wiemy, byłoby to O (n ^ 2) praca lingwistyczna do zrobienia =) ...

elliot42
źródło
6
Zauważ, że litery, które są wymawiane podobnie, mogą się znacznie różnić między językami ...
Michael Borgwardt,
Poza tym, co dokładnie jest łaciński alfabet?
MSalters
Zobacz także moją odpowiedź w powiązanym pytaniu StackOverflow.
MSalters
Dla wizualnego rozróżnienia, Baza 32 jest standardowym kodowaniem, które ogranicza podobieństwa symboli.
barjak
@MSalters „Łaciński skrypt” to pomysł lingwistyczny, dla naszych celów mam na myśli po prostu „wybierz z podzbioru łacińskiego skryptu, który jest skodyfikowany w Unicode”, np. En.wikipedia.org/wiki/ISO/IEC_8859-1
elliot42

Odpowiedzi:

15

Powinieneś podzielić zestaw alfanumeryczny na grupy według wizualnego podobieństwa i wybrać „najbardziej kultowego” przedstawiciela z każdej grupy. Jest to nieco subiektywne, chociaż można na nim przeprowadzić testy użytkowników. Dokonane wybory zależą również od tego, czy dane zostaną wydrukowane, czy odręcznie. Na przykład:

  • { O , 0 , Q , D }

  • { I , L , 1 }

  • { B , 8 }

  • { Z , 2 }

  • { S , 5 }

  • { 7 , T }

  • { U , V , Y }

Podobnie dziel znaki na podobieństwa fonetyczne wymowy ich nazw:

  • { A [ʔeɪ], 8 [ʔeɪ (ʔ / t)]}
    = zaczyna się od [ʔeɪ]

  • { P [pi:], B [bi:], V [vi:], D [di:], T [ti:], E [ʔi:]}
    = stop / fricative + [i:]

  • { G [ʤi:], C [si:], Z [zi:], 3 [θɹi:]}
    = fricative / affricate (klaster) + [i:]

  • { M [ɛm], N [ɛn]}
    = [ɛ] + nosowy

  • { S [ɛs], F [ɛf], X [ɛks]}
    = [ɛ] + fricative / affricate

  • { I [ʔaɪ], Y [waɪ], 5 [faɪv], 9 [naɪn]}
    = spółgłoska + [aɪ] + (spółgłoska)

  • { Q [kjʉ:], U [jʉ:], 2 [t (j) ʉ:]}
    = spółgłoska + [(j) ʉ:]

Nie są to oczywiście jedyne możliwe przegrody, tylko to, co przychodzi mi teraz na myśl. Niezależnie od tego powinny one wystarczyć do rozpoczęcia dalszych testów. Nie są one również poparte żadnymi profesjonalnymi źródłami - cytuję tylko moje hobbystyczne doświadczenie w typografii i fonetyce.

Jon Purdy
źródło
3
Na początek z podobieństwem słuchowym zapoznaj się z komunikacją radiową, taką jak instrukcje operacyjne kontroli ruchu lotniczego (gdzie komunikacja ustna musi być poprawnie zinterpretowana, aby ludzie umierali) oraz Ham Radio. Na przykład 5 i 9 są łatwe do pomieszania, stąd też
wymawia się je
@mattnz: Dzięki, zapomniałem 5 i 9. Jakość dźwięku jest również dużym czynnikiem: radia, telefony, nagrania studyjne i komunikacja osobista stwarzają własne, unikalne problemy.
Jon Purdy
1
Technicznie rzecz biorąc, to „niner”, cztery to „fower”.
Patrick Hughes
3

Możesz użyć Mechanical Turk, aby prawdziwi ludzie ocenili wszystkie 26 ^ 2 par liter pod względem fonetycznym i wizualnym. Zaletą jest to, że w ten sposób można nawet uzyskać dane dla różnych języków ojczystych.

Michael Borgwardt
źródło
1

W języku angielskim algorytmy soundex i metaphone kodują, które dźwięki są niejednoznaczne. Soundex jest prawdopodobnie zbyt prosty, ale Metaphone zawiera kilka dobrych punktów. Czy chcesz sekwencję „OU”? Można to wymówić na wiele sposobów, ponieważ zdanie to się kończy;)

MSalters
źródło