Rozważmy język składający się ze wszystkich ciągów -lettera nad tak aby żadne dwie litery nie były równe:L k - d i s t i n c t
L k - d i s t i n c t : = { w = σ 1 σ 2 . . . σ k ∣ ∀ i ∈ [ k ] : σ i ∈ Σ and ∀ j ≠ i : σ j ≠ σ i }
Ten język jest skończony i dlatego regularny. W szczególności, jeśli , to \ left | L_ {k-odrębny} \ right | = \ binom {n} {k} k! .| Σ | = n
Jaki jest najmniejszy niedeterministyczny automat skończony, który akceptuje ten język?
Obecnie mam następujące luźne górne i dolne granice:
Najmniejszy NFA, jaki mogę zbudować, ma 4 k ( 1 + o ( 1 ) ) ⋅ p o l y l o g ( n )
4k(1+o(1))⋅polylog(n) .Poniższy lemat implikuje dolną granicę stanów 2 tys
2k :
Niech L ⊆ Σ ∗
L⊆Σ∗ będzie zwykłym językiem. Załóżmy, że istnieje nn par P = { ( x i , w i ) ∣ 1 ≤ i ≤ n }P={(xi,wi)∣1≤i≤n} takich, że x i ⋅ w j ∈ Lxi⋅wj∈L wtedy i tylko wtedy, gdy i = ji=j . Wtedy każdy NFA akceptujący L ma co najmniej n stanów.
- Kolejną (trywialną) dolną granicą jest l o g
log ( nk )(nk) , który jest logiem wielkości najmniejszego DFA dla języka.
Interesują mnie również NFA, które akceptują tylko stały ułamek ( 0 < ϵ < 1
Edycja: Właśnie rozpocząłem nagrodę, która zawierała błąd w tekście.
Miałem na myśli, że możemy założyć k = p o l y l o g ( n )
Edycja2:
Nagroda wkrótce się skończy, więc jeśli ktoś jest zainteresowany łatwiejszym sposobem jej zdobycia, rozważ następujący język:
L ( r , k ) - d i s t i n c t : = { w : w
(tj. L(1,k)−distinct=Lk−distinct
Podobna konstrukcja jak w komentarzach daje automat wielkości O(ek⋅2k⋅log(1+r)⋅poly(n))
Czy można to poprawić? Jaka jest najlepsza dolna granica dla tego języka?
Odpowiedzi:
To nie jest odpowiedź, ale metoda, która moim zdaniem pozostawiłaby lepszą dolną granicę. Przetnijmy problem po litery są odczytywane. Oznacza rodzinę zestawy elementem od oraz rodzina zestawów elementem za . Oznacz stany, które można osiągnąć po odczytaniu elementów (w dowolnej kolejności) przez oraz stany, z których stan akceptacyjny można osiągnąć po odczytaniu elementów (w dowolnej kolejności) przez . Potrzebujemy tego wtedy i tylko wtedyaa aa [n][n] AA b=k−ab=k−a [n][n] BB AA SASA BB TBTB SA∩TB≠∅SA∩TB≠∅ A∩B=∅A∩B=∅ . To już stanowi dolną granicę dla wymaganej liczby stanów i myślę, że może dać coś nietrywialnego.
Ten problem zasadniczo wymaga dolnej granicy liczby wierzchołków hipergraphu, którego wykres liniowy jest (częściowo) znany. Podobne problemy były badane np. Przez Bollobasa i istnieje kilka znanych metod dowodowych, które mogą być przydatne.
Aktualizacja 2014.03.24: W rzeczywistości, jeśli powyższy hipergraph można zrealizować na wierzchołkach , wówczas otrzymujemy również niedeterministyczny protokół złożoności komunikacji o długości dla zestawu rozłączności z zestawami danych wejściowych o wielkości i (w rzeczywistości dwa problemy są równoważne). Wąskim gardłem jest oczywiście, gdy , w tym celu mogłem znaleźć tylko w książce i Noama: potwierdzony przez standardowy argument probabilistyczny. Niestety nie mogłem (jeszcze) znaleźć wystarczająco dobrych dolnych granic tego problemu, ale zakładając, że powyższe jest ostre, dałoby to dolną granicęss logslogs a b a = b = k / 2 N 1 ( D I S J a ) ≤ log ( 2 k log e ( na b a=b=k/2 a ) )Ω(2klogn)N1(DISJa)≤log(2kloge(na)) Ω(2klogn) ujednolicając dwie dolne granice, o których wspomniałeś.
źródło
Trwają prace:
Próbuję udowodnić dolną granicę . Oto pytanie, które jestem pewien, że dałoby taką dolną granicę: znajdź minimum tak aby istniała funkcja który zachowuje rozłączność, tzn. Że iff . Jestem prawie pewien, że dolna granica prawie natychmiast oznaczałaby dolną granicę dla naszego problemu. grubsza odpowiada zestawowi węzłów, do których NFA może się dostać po odczytaniu pierwszych symboli wejścia, gdy zestaw tych4 k t f : { S ⊆ [ n ] , | S | = k / 2 } → { 0 , 1 } t S 1 ∩ S 2 = ∅ f ( S 1 ) ∩ f ( S 2 ) = ∅ t ≥ 2 k 2 2 k = 4 k f ( S )k / 2 k / 2symboli .S.
Myślę, że rozwiązanie tego pytania może być już znane, albo w literaturze dotyczącej złożoności komunikacji (szczególnie w artykułach dotyczących problemu rozłączności; być może pomocne będą niektóre argumenty rang matrycowych) lub w literaturze na temat kodowania (np. Jak ta ).
źródło