Uczę się algebraicznej teorii parsowania. Moim pierwszym problemem jest zidentyfikowanie przykładów semieralnych, które są specyficzne dla formalnej teorii języka. Oto próba skonstruowania dwóch przykładów.
1 Biorąc pod uwagę gramatykę CNF, elementy semeryzacji są zestawami symboli terminalnych i nieterminalnych z operacjami:
i) Mnożenie , łączenie dwóch zestawów parami zgodnie z regułą CYK. Na przykład podana gramatyka CNF
s: p p | q r
t: p q
u: q q
następnie
ii) Dodawanie jest ustalane zjednoczeniem, np
Niestety, mnożenie nie jest skojarzone.
2 Elementy drugiego semestru to zbiory nie symboli, ale reguły gramatyczne [niekoniecznie w CNF] zmienione pozycją. Operacje są
i) Mnożenie , łączenie wszystkich pasujących par elementów zgodnie z regułą Earley complete. Na przykład podana gramatyka CNF
s: p q r
r: s t | u
następnie
ii) Dodawanie jest ponownie ustalonym związkiem, np
Ten przykład jest również wadliwy.
Semery z elementami będącymi zestawami reguł gramatycznych, a mnożenie będące podstawieniem reguł wydaje się działać dobrze. Jest to jednak algebra relacji w przebraniu. Rzeczywiście, spójrzmy na każdą regułę gramatyczną jako klasę równoważności - zestaw par słów składających się z liter terminalnych i nieterminalnych związanych z zastosowaniem reguły, np.
Zatem rozpoznanie słowa w gramatyce jest łańcuchem relacji relacyjnych, np
(Ten monomial przypomina semierowanie wielomianu parsera z rozprawy doktorskiej Josha Goodmana; jednakże, powtórzmy, że konstruowanie nowych półprzewodników przez wzięcie wielomianów i macierzy nie jest w tym przypadku naszym zainteresowaniem).
Pozostaje więc pytanie: czy nazywanie języków formalnych na alfabet jedyny przykład?
źródło
Odpowiedzi:
Istnieje wiele semirings związanych z teorią języka. Przede wszystkim Boolean semiring. Następnie dowolna klasa języków zamknięta w ramach skończonej unii i produktu (konkatenacji) jest podzespołem semirowania wszystkich języków. Na przykład języki wymierne (= zwykłe) tworzą semiry. Zobacz także powiązane pojęcie algebry Kleene'a .
Thek × k macierze w ciągu semiringu tworzą semiring. W szczególności macierze powyżej semestru boolowskiego kodują niedeterministyczne automaty skończone i macierze w nieco większym semiringu{ - ∞ , 0 , 1 } kodować przejścia automatu Büchi. Macierze w ciągu semiery są używane do charakteryzowania serii wymiernych .
Te tropikalne semirings , w szczególności( N ∪ { + ∞ } , min , + ) i ( N ∪ { - ∞ } , maks. , + ) odgrywać znaczącą rolę w teorii automatów. Doprowadziły również do nowej gałęzi matematyki, tropikalnej geometrii .
źródło
Zabawa z Semirings: funkcjonalna perła na nadużyciu algebry liniowej
Efektywna analiza i dzielenie i parsowanie języków bezkontekstowych
źródło
Myślę, że możesz wymyślić więcej pół-pierścieni zgodnie z zasadami Earleya. Weź prognozę. Możesz utworzyć operator binarnyS.⊗p , kT.= S∪ ⋃ ( Y: ∙ γ , k) $ tak, że związek jest ponad wszystkimi odpowiednimi przepisami. Następnie algorytm najpierw oblicza pierwszy zestaw stanu Earleya jako nieskończony, ale ostatecznie powtarzający się (tak skończony) produkt w operatorze:
źródło