Kolejne sekwencje

11

Wprowadzenie

W tym wyzwaniu Twoim zadaniem jest znalezienie uogólnionych podciągów ciągów. Podsekwencje niekoniecznie są ciągłe i mogą również „owijać” sznurek, przechodząc poza jego koniec i rozpoczynając od początku. Będziesz jednak chciał zminimalizować liczbę owinięć.

Bardziej formalnie, niech ui vbyć dowolne dwa ciągi i k ≥ 0liczbą całkowitą. Mówimy, że ujest kpakowania, dozowania podciąg z v, jeśli istnieją wyraźne wskaźniki , takie, że , i co najwyżej indeksów zaspokoić . Oznacza to, że można go znaleźć w środku , przechodząc od lewej do prawej, wybierając po drodze niektóre z jego postaci i owijając się w większości przypadków (równoważnie, wykonując co najwyżej przemiatanie ). Zauważ, że żadna postać nie może być wybrana więcej niż jeden raz, nawet po zawinięciu, a podsekwencje owijania są dokładnie zwykłymi podsekwencjami, które wszyscy znamy.i1, i2, ..., ilen(u)u == v[i1] v[i2] ... v[ilen(u)]kijij > ij+1uvkk+1v0

Zadanie

Twoje wejścia są dwa niepuste ciągi alfanumeryczne ui v, a wyjście jest najmniejsza liczba całkowita ktakie, że ujest kpakowania, dozowania podciąg v. Jeżeli takiego nie kma, wynik powinien wynosić -1.

Przykład

Rozważ dane wejściowe u := xyzyxzzxyxi v := yxzzazzyxxxyz. Jeśli zaczniemy szukać bohaterów uw vzachłanny sposób, obejrzymy się 3 razy:

 yxzzazzyxxxyz
>─x─────y────z┐
┌─────────────┘
└y───────x────┐
┌─────────────┘
└──zz─────x─y─┐
┌─────────────┘
└──────────x──>

Zatem poprawne wyjście wynosi co najwyżej 3. Zwróć uwagę, jak lewy znak xjest wybierany jeden raz, a następnie ignorowany przy drugim przeciągnięciu, ponieważ nie można go ponownie użyć. Istnieje jednak krótsza metoda z tylko 2 obejściami:

 yxzzazzyxxxyz
>──────────xyz┐
┌─────────────┘
└yxzz────x────┐
┌─────────────┘
└───────y─x───>

Okazuje się, że jedno zawinięcie (czyli dwa wyciągnięcia po ścieżce) nie wystarczy, więc poprawne wyjście to 2.

Zasady i bonusy

Możesz napisać funkcję lub pełny program, a także, w razie potrzeby, zmienić kolejność wejść. Wygrywa najniższa liczba bajtów, a standardowe luki są niedozwolone.

Istnieje premia w wysokości -10% za obliczenie wszystkich przypadków testowych w sumie poniżej 10 sekund. Będę testować niejasne przypadki na moim komputerze; moja referencyjna implementacja w Pythonie zajmuje około 0,6 sekundy. Mam 7-letniego laptopa z dwurdzeniowym procesorem 1,86 GHz, który warto wziąć pod uwagę.

Przypadki testowe

"me" "moe" -> 0
"meet" "metro" -> -1
"ababa" "abaab" -> 1
"abaab" "baabaa" -> 1
"1c1C1C2B" "1111CCCcB2" -> 3
"reverse" "reserved" -> 2
"abcdefg" "gfedcba" -> 6
"xyzyxzzxyx" "yxzzazzyxxxyz" -> 2
"aasdffdaasdf" "asdfddasdfsdaafsds" -> 2
Zgarb
źródło
1
Czy byłoby to również prawidłowe rozwiązanie dla tego przykładu? To chciwe podejście.
orlp
@orlp Nie jest poprawny, ponieważ pierwszy xjest używany w trzech różnych zakresach. Można go użyć tylko raz.
Zgarb
Ach, rozumiem teraz.
orlp

Odpowiedzi:

4

Pyth, 34 bajty

Mh+Smssm>.ukC,[email protected]_1

Definiuje to funkcję g, która przyjmuje dwa ciągi jako parametr. Wypróbuj online: Pyth Compiler / Executor

Ten kod jest bardzo nieefektywny. Ma złożoność czasową i pamięćową len(v)!/(len(v)-len(u))!. Nie jest w stanie rozwiązać dłuższych przypadków testowych w czasie krótszym niż 10 sekund. (Prawdopodobnie nastąpi awaria, ponieważ zabraknie pamięci.)

M                                    define g(G, H): return _
                          .PUHlG        all permutations of [0, 1, ..., len(H)-1] of length len(G)
                 fqGsm@HkT              filter the permutations which form the string G
    mssm>.ukC,dtd                       compute the number of wraps for each of the remaining permutations
  +S                            _1      sort the numbers and append -1
 h                                      return the first element
Jakube
źródło
4

Haskell, 160 * 0,9 = 144 bajtów

a#(-1)=a
a#b=min a b
f y=w(y++" ")0$length y
w _ n _[]=n
w(c:d)n o g@(a:b)|n>o=(-1)|a==c=z#w y n z g|c==' '=w y(n+1)o g|1<2=w y n o g where z=w d n o b;y=d++[c]

Czas dla wszystkich przypadków testowych (uwaga: argumenty są odwracane):

*Main> map (uncurry f) [
             ("moe", "me"),
             ("metro", "meet"),
             ("abaab", "ababa"),
             ("baabaa", "abaab"),
             ("1111CCCcB2", "1c1C1C2B"),
             ("reserved", "reverse"),
             ("gfedcba", "abcdefg"),
             ("yxzzazzyxxxyz", "xyzyxzzxyx"),
             ("asdfddasdfsdaafsds", "aasdffdaasdf")]
[0,-1,1,1,3,2,6,2,2]
(0.08 secs, 25794240 bytes)

Jak to działa (wersja skrócona): prosta brutalna siła, która wymaga minimum użycia pasującej postaci i pominięcia jej. Zatrzymuję wyszukiwanie, gdy albo skończę (zwracam liczbę cykli), albo gdy wykonałem cykl więcej niż minimum (do tej pory -1).

Zaoszczędziłem dużo bajtów w porównaniu do mojej pierwszej wersji, głównie dlatego, że przełączyłem się z pełnego programu na funkcję.

Z kilkoma komentarzami i odpowiednimi odstępami gra w golfa Haskell jest dość czytelna:

-- a minimum function that ignores a -1 in the right argument to prevent
-- "not solvable" cases in parts of the recursive search to dominate low numbers
-- of solvable parts. If the case isn't solvabale at all, both arguments are
-- -1 and are carried on.
a # (-1) = a
a # b    = min a b

-- the main function f calls the worker funktion w with arguments
-- * the string to search in (STSI), appended by a space to detect cycles
-- * the number of cycles so far
-- * the minimum of cycles needed so far, starting with the length of STSI
-- * the string to search for (STSF) (partial applied away and therefore invisible)
f y = w (y++" ") 0 (length y)

-- the worker function 
w _ n _ [] = n          -- base case: if STSF is empty the work is done and the 
                        -- number of cycles is returned

w (c:d) n o g@(a:b)     -- "c" is first char of STSI, "d" the rest
                        -- "n" number of cycles, "o" minimum of cycles so far
                        -- "g" is the whole STSF, "a" the 1st char, "b" the rest
  | n>o    = (-1)             -- if current cycle is more than a previous result,
                              -- indicate failure
  | a==c   = z # w y n z g    -- if there's a character match, take the min of
                              -- using it and skipping it
  | c==' ' = w y (n+1) o g    -- cycle detected, repeat and adjust n
  | 1<2    = w y n o g        -- otherwise try next char in STSI

  where                 -- just some golfing: short names for common subexpressions
  z = w d n o b;        -- number of cycles if a matching char is used
  y = d ++ [c]          -- rotated STSI

Dla odniesienia: stara wersja, pełny program, 187 bajtów

main=interact$show.f.lines
a#(-1)=a
a#b=min a b
f[x,y]=w x(y++" ")0 0
w[]_ n _=n
w g@(a:b)(c:d)n m|a==c=w b d n 1#y|c==' '&&m==1=w g(d++" ")(n+1)0|c==' '=(-1)|1<2=y where y=w g(d++[c])n m
nimi
źródło
@Zgarb: przerobiłem moje rozwiązanie. Jest teraz szybszy i krótszy.
nimi
Działa w 0,6 sekundy po interpretacji, 0,01 sekundy po kompilacji.
Zgarb
2

JavaScript (ES6) 174 (193–10%)

Wyszukiwanie rekurencyjne, podobnie jak odpowiedź @ nimi, z zachowaniem minimalnej liczby owinięć. Przestrzeń rozwiązań jest duża (przede wszystkim dla ostatniego przykładu), ale skrócenie wyszukiwania przy aktualnie znalezionej min utrzymuje czas na niskim poziomie. Edycja 1 Dodaj brakującą skrzynkę testową, nieco skrócona Edytuj 2 Nie ma potrzeby przekazywania parametrów, jest naprawiona

K=(w,s,x)=>
  ~-(R=(r,l,p=0,q=1,z=w[p],i=0)=>
  {
    if(z&&!(q>x)){
      if(~(r+l).indexOf(z))
        for(t=l?R(l+r,'',p,q+1):x;x<t?0:x=t,i=~r.indexOf(z,-i);)
          t=R(r.slice(-i),l+r.slice(0,~i),p+1,q);
      q=x
    }
    return q
  })(s,'')

Nie golfił

K=(word, astring)=>
{
  var minWraps // undefined at first. All numeric comparison with undefined give false 
  var R=(right, left, pos, wraps)=>
  {
    var cur = word[pos]
    var i,t;
    if (! cur) // when all chars of word are managed
      return wraps;
    if (wraps > minWraps) // over the minimum wrap count already found, stop search
      return wraps; 
    if ( (right+left).indexOf(cur) < 0 ) // if the current char is not found in the remaining part of the string
      return minWraps; // return the current min, could still be undefined (that means 'no way')
    if ( left ) // if there is a left part, try a wrapping search with the current char
    {
      t = R(left+right, '', pos, wraps+1)
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    // find all occurrences of current char in the remaining part
    // for each occurrence, start a recursive search for the next char
    for(i = 0; (i = right.indexOf(cur, i)) >= 0; i++)
    {
      var passed = right.slice(0,i) // the passed chars go in the left part
      var rest = right.slice(i+1) 
      t = R(rest, left+passed, pos+1, wraps) // try next char in the remaining part, no wrap
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    return minWraps
  }
  var result = R(astring, '', 0, 1) // start with right=string and left empty
  return ~-result; // decrement. convert undefined to -1
}

Przetestuj w konsoli Firefox / FireBug

time=~new Date;
[['me','moe']
,['meet','metro']
,['ababa','abaab']
,['abaab','baabaa']
,['1c1C1C2B','1111CCCcB2']
,['reverse','reserved']
,['abcdefg','gfedcba']
,['xyzyxzzxyx','yxzzazzyxxxyz']
,['aasdffdaasdf','asdfddasdfsdaafsds']]
.forEach(s=>console.log(s,r=K(...s)))
time-=~new Date

Dane wyjściowe (ostatni wiersz to czas wykonania w ms)

[„me”, „moe”] 0
[„meet”, „metro”] -1
[„ababa”, „abaab”] 1
[„abaab”, „baabaa”] 1
[„1c1C1C2B”, „1111CCCcB2”] 3
[„reverse”, „zastrzeżone”] 2
[„abcdefg”, „gfedcba”] 6
[„xyzyxzzxyx”, „yxzzazzyxxxyz”] 2
[„aasdffdaasdf”, „asdfddasdfsdaafsds”] 2
116

edc65
źródło
Testowany z Firebug, działa w 175ms na moim komputerze.
Zgarb
@Zgarb jest więc miejsce na ulepszenia: postaram się spowolnić i skrócić
edc65