Znajdź dziwną postać we wzorze

20

Wejście

Pierwszy wiersz będzie pewnym ciągiem powtarzanym dowolną liczbę razy. Na przykład, może to być abcabcabcabc, [];[];[];itp mogą być odcięte; na przykład: 1231231231. Zawsze znajdź najkrótszy ciąg; Na przykład, jeśli linia jest 22222, to ciąg jest 2, nie 22lub 22222czy cokolwiek innego. Ciąg zawsze będzie powtarzany co najmniej 2 razy.

Wszystkie kolejne wiersze będą wzorami przesuniętymi o dowolną liczbę. Może to być na przykład:

abcabcabc
cabcabcab
bcabcabca

(przesunięty o 1) lub może to być:

abcdefabcdefabcdefabc
cdefabcdefabcdefabcde
efabcdefabcdefabcdefa

(przesunięty o 4).

Jeden ze znaków na wejściu będzie niepoprawny. (Gwarantujemy, że nie będzie w pierwszym wierszu.) Na przykład w tym danych wejściowych:

a=1a=1a=1
=1a=1a=1a
1a=11=1a=
a=1a=1a=1
=1a=1a=1a

1na linii 3 jest dziwne jeden.

Wynik

Musisz wyprowadzić (od zera, zaczynając od lewego górnego) współrzędne nieparzystej. Na przykład w powyższym wejściu odpowiednie wyjście to 4,2. Możesz także wyprowadzać dane wyjściowe 4 2, a "4""2"nawet [[4],[2]], nawet w dowolnym innym formacie, pod warunkiem, że wiesz, jaki powinien być wynik.

Przypadki testowe

Wejście:

codegolfcodegolfco
egolfcodegolfcodeg
lfcodegolfcodegoff
odegolfcodegolfcod
golfcodegolfcodego
fcodegolfcodegolfc

Wynik: 16,2

Wejście:

][[][][[][][[][][[][][[
[][][[][][[][][[][][[][
[][[][][[][][[][][[][][
[[][][[]]][[][][[][][[]

Wynik: 8,3

Wejście:

...
. .
...

Wynik: 1,1

Wejście:

ababa
babab
ababb
babab

Wynik: 4,2

Udać się!

Klamka
źródło
Jakie znaki mogą być zawarte w ciągu? ASCII do druku? ASCII? Unicode?
Dennis
@Dennis Po prostu do wydruku ASCII (można to zasadniczo założyć dla każdego wyzwania zawierającego łańcuchy; w przeciwnym razie musielibyśmy określić to dla prawie każdego wyzwania: P)
Klamka
Zgadłem. Myślę o podejściu, które wymagałoby nieużywanego char, więc pomyślałem, że zapytam.
Dennis
Czy powinniśmy sprawdzić taki przypadek: abc/cab/abc- i wydrukować 0 2tutaj?
user2846289,
@VadimR Nie, ponieważ tylko jeden znak będzie błędny.
Klamka

Odpowiedzi:

7

Bash Perl, 231 229 218 178 164 166 138 106 106 74 bajtów

/^(((.*).*)\2+)\3$/;$_.=$1x2;$.--,die$+[1]if/^(.*)(.)(.*)
.*\1(?!\2).\3/

Skrypt wymaga użycia -nprzełącznika, który odpowiada za dwa bajty.

Pomysł dołączenia dwóch kopii wszystkich pełnych powtórzeń wzorca wziął się z odpowiedzi MT0 .

W przeciwieństwie do wszystkich innych odpowiedzi, podejście to próbuje wyodrębnić wzór bieżącej linii wejściowej w każdej iteracji; nie powiedzie się na linii zawierającej znak nieparzysty (i zamiast tego użyje wzoru z poprzedniej linii). Odbywa się to w celu uwzględnienia ekstrakcji wzorca w pętli, co pozwala zaoszczędzić kilka bajtów.

Wersja bez golfa

#!/usr/bin/perl -n

# The `-n' switch makes Perl execute the entire script once for each input line, just like
# wrapping `while(<>){…}' around the script would do.

/^(((.*).*)\2+)\3$/;

# This regular expression matches if `((.*).*)' - accessible via the backreference `\2' -
# is repeated at least once, followed by a single repetition of `\3" - zero or more of the
# leftmost characters of `\2' - followed by the end of line. This means `\1' will contain
# all full repetitions of the pattern. Even in the next loop, the contents of `\1' will be
# available in the variable `$1'.

$_.=$1x2;

# Append two copies of `$1' to the current line. For the line, containing the odd
# character, the regular expression will not have matched and the pattern of the previous
# line will get appended.
#
# Since the pattern is repeated at least two full times, the partial pattern repetition at
# the end of the previous line will be shorter than the string before it. This means that
# the entire line will the shorter than 1.5 times the full repetitions of the pattern, 
# making the two copies of the full repetitions of the pattern at least three times as 
# long as the input lines.

$.-- , die $+[1] if

# If the regular expression below matches, do the following:
#
#   1. Decrement the variable `$.', which contains the input line number.
#
#      This is done to obtain zero-based coordinates.
#
#   2. Print `$+[1]' - the position of the last character of the first subpattern of the
#      regular expression - plus some additional information to STDERR and exit.
#
#      Notably, `die' prints the (decremented) current line number.

/^(.*)(.)(.*)
.*\1(?!\2).\3/;

# `(.*)(.)(.*)', enclosed by `^' and a newline, divides the current input line into three
# parts, which will be accesible via the backreferences `\1' to `\3'. Note that `\2'
# contains a single character.
#
# `.*\1(?!\2).\3' matches the current input line, except for the single character between
# `\1' and `\3' which has to be different from that in `\2', at any position of the line
# containing the pattern repetitions. Since this line is at least thrice as long as
# `\1(?!\2).\3', it will be matched regardless of by how many characters the line has been
# rotated.

Przykład

Do przypadku testowego

codegolfcodegolfco
egolfcodegolfcodeg
lfcodegolfcodegoff
odegolfcodegolfcod
golfcodegolfcodego
fcodegolfcodegolfc

wyjście z wersji golfowej jest

16 at script.pl line 1, <> line 2.

co oznacza, że ​​nieparzysty znak ma współrzędne 16,2.

To rażąco nadużywane wykorzystuje liberalny format wyjściowy.

Tuż przed wyjściem zawartość niektórych zmiennych specjalnych Perla to:

$_  = lfcodegolfcodegoff\ncodegolfcodegolfcodegolfcodegolf
$1  = lfcodegolfcodego
$2  = f
$3  = f

( $nzawiera dopasowanie wzorca dostępnego poprzez odnośnik wsteczny \n).

Dennis
źródło
Sprytne łapanie jednostki odpowiedzi. Można go zoptymalizować o jeden bajt:^((.*?)(.*?))(?=\1+\2$)
Heiko Oberdiek
Zmieniłem język, którego używają popularne dzieci. Prawdopodobnie można go pograć w golfa; to mój pierwszy skrypt w Perlu od ponad dekady ...
Dennis
2
... i spóźniłeś się ponad dziesięć lat, jeśli uważasz, że to perl jest tym, czego używają popularne dzieci
ardnew
ta odpowiedź nie zyskuje miłości, na którą zasługuje. wygląda mi na zwycięzcę @Doorknob
nowy
8

Perl, 212 191 181 168 bajtów

$_=<>;/^(((.*?)(.*?))\2+)\3$/;$x=$1x4;while(<>){chop;$x=~/\Q$_\E/&&next;for$i(0..y///c-1){for$r(split//,$x){$b=$_;$b=~s/(.{$i})./$1$r/;$x=~/\Q$b\E/&&die$i,$",$.-1,$/}}}
  • Ta wersja wykorzystuje zoptymalizowaną sztuczkę do łapania jednostki odpowiedzi, nauczył się w odpowiedzi Dennisa .
  • Optymalizacja przy użyciu właściwości polegającej na tym, że wszystkie linie mają równe długości.
  • Koniec linii jest również potrzebny dla ostatniej linii, w przeciwnym razie chompzamiast tego chopnależy użyć.
  • Dodano optymalizacje komentarza ardnew .

Stara wersja, 212 bajtów:

$_=<>;chop;/^(.+?)\1+(??{".{0,".(-1+length$1).'}'})$/;$;=$1;while(<>){$x=$;x length;chop;$x=~/\Q$_\E/&&next;for$i(0..-1+length$_){for$r(split//,$;){$b=$_;$b=~s/(.{$i})./$1$r/;$x=~/\Q$b\E/&&exit print$i,$",$.-1}}}

Wersja bez golfa:

$_ = <>;  # read first line
/^(((.*?)(.*?))\2+)\3$/;
# The repeat unit \2 consists of \3 and \4,
# and the start part \2 can be added at the end (as partial or even full unit).
$x = $1 x 4; # $x is long enough to cover each following line

# Old version:
# /^(.+?)\1+(??{ ".{0," . (-1 + length $1) . '}' })$/;
# $a = $1; # $a is the repeat unit.
# The unit is caught by a non-greedy pattern (.+?) that is
# repeated at least once: \1+
# The remaining characters must be less than the unit length.
# The unit length is known at run-time, therefore a "postponed"
# regular expression is used for the remainder.

# process the following lines until the error is found
while (<>) {
    # old version:
    # $x = $a x length;
    # $x contains the repeated string unit, by at least one unit longer
    # than the string in the current line
    chop; # remove line end of current line
    $x =~ /\Q$_\E/ && next;
          # go to next line, if current string is a substring of the repeated units;
          # \Q...\E prevents the interpretation of special characters
    # now each string position $x is checked, if it contains the wrong character:
    for $i (0 .. y///c - 1) {  # y///c yields the length of $_
        for $r (split //, $x) { #/ (old version uses $a)
            # replace the character at position $i with a
            # character from the repeat unit
            $b = $_;
            $b =~ s/(.{$i})./$1$r/;
            $x =~ /\Q$b\E/
               && die $i, $", $. - 1, $/;
               # $" sets a space and the newline is added by $/;
               # the newline prevents "die" from outputting line numbers
        }
    }
}
Heiko Oberdiek
źródło
Świetne rozwiązanie i komentarze, muszę nauczyć się więcej
wyrażeń
1
pierwszy chopjest niepotrzebny - należy go usunąć. finał exit printmożna zastąpić die(dodaj, ,$/aby ukryć dodatkowe rzeczy (w razie potrzeby)). również length$_można zastąpićy///c
ardnew
@ardnew: Wielkie dzięki, usunąłem pierwszy chop, ponieważ $dopasowania przed znakiem nowej linii na końcu łańcucha. Ukrywanie dodatkowych rzeczy dieza pomocą dodanego nowego wiersza wydaje mi się konieczne. y///cJest także znacznie krótszy niż length$_i jeden bajt krótszy niż lengthbez niepotrzebnego $_.
Heiko Oberdiek
1
@ardnew: Zapomniałem o gadatliwości die . Zawiera nawet wypisuje numer linii! Użyję tego w mojej następnej aktualizacji.
Dennis
3

C, 187 bajtów

Ograniczenia

  • Nie używaj ciągów wejściowych dłuższych niż 98 znaków :)

Wersja golfowa

char s[99],z[99],*k,p,i,I,o,a;c(){for(i=0;k[i]==s[(i+o)%p];i++);return k[i];}main(){for(gets(k=s);c(p++););for(;!(o=o>p&&printf("%d,%d\n",I,a))&&gets(k=z);a++)while(o++<p&&c())I=I<i?i:I;}

Wersja bez golfa

char s[99],z[99],*k,p,i,I,o,a;

c()
{
    for(i=0
       ;k[i]==s[(i+o)%p]
       ;i++)
       ;
    return k[i];
}

main()
{
    for(gets(k=s);c(p++);)
         ;
    for(;!(o=o>p&&printf("%d,%d\n",I,a)) && gets(k=z);a++)
           while(o++ < p && c())
            I=I<i?i:I;
}
asr
źródło
2

Python, 303 292

r=raw_input
R=range
s=r()
l=len(s)
m=1
g=s[:[all((lambda x:x[1:]==x[:-1])(s[n::k])for n in R(k))for k in R(1,l)].index(True)+1]*l*2
while 1:
 t=r()
 z=[map(lambda p:p[0]==p[1],zip(t,g[n:l+n]))for n in R(l)]
 any(all(y)for y in z)or exit("%d,%d"%(max(map(lambda b:b.index(False),z)),m))
 m+=1

Wejście przechodzi przez standardowe wejście. Wyjaśnię to, jeśli będzie jakieś zapotrzebowanie, ale i tak nie wygląda na to, że wygram.

Fraxtil
źródło
1

Perl, 157 154

Edycja : -3 dzięki sugestii ardnew.

<>=~/^(((.*?).*?)\2+)\3$/;$p=$2;$n=$+[1];while(<>){s/.{$n}/$&$&/;/(\Q$p\E)+/g;$s=$p;1while/./g*$s=~/\G\Q$&/g;print$n>--($m=pos)?$m:$m-$n,$",$.-1,$/if pos}

Zajęło mi to trochę czasu (włączanie i wyłączanie, oczywiście, nie 5 dni ;-)), a pomysł na algorytm był początkowo nieuchwytny (choć czułem, że tam był), ale w końcu (i nagle) wszystko stało się jasne.

Jeśli długość łańcucha jest wielokrotnością długości wzoru, a nawet jeśli łańcuch nie zaczyna się od początku wzoru, łańcuch konkatenujący ze sobą wytworzy wzór zamiast konkatenacji (wyobraź sobie nieskończone powtarzanie słowa na okrągłej wstążce - miejsce spawanie nie jest ważne). Pomysł polega więc na przycięciu linii do wielu jednostek długości i połączeniu z nią oryginału. Wynik, nawet w przypadku łańcucha zawierającego niewłaściwy znak, gwarantuje dopasowanie do wzorca co najmniej raz. Odtąd łatwo jest znaleźć pozycję obrażającej się postaci.

Pierwsza linia jest bezwstydnie zapożyczona z odpowiedzi Heiko Oberdiek :-)

<>=~/^(((.*?).*?)\2+)\3$/;      # Read first line, find the repeating unit
$p=$2;                          # and length of whole number of units.
$n=$+[1];                       # Store as $p and $n.
while(<>){                      # Repeat for each line.
    s/.{$n}/$&$&/;              # Extract first $n chars and
                                # append original line to them.
    /(\Q$p\E)+/g;               # Match until failure (not necessarily from the
                                # beginning - doesn't matter).
    $s=$p;                      # This is just to reset global match position
                                # for $s (which is $p) - we could do without $s,
                                # $p.=''; but it's one char longer.
                                # From here, whole pattern doesn't match -
    1while/./g*$s=~/\G\Q$&/g;   # check by single char.
                                # Extract next char (if possible), match to 
                                # appropriate position in a pattern (position 
                                # maintained by \G assertion and g modifier).
                                # We either exhaust the string (then pos is 
                                # undefined and this was not the string we're
                                # looking for) or find offending char position.

    print$n>--($m=pos)?$m:$m-$n,$",$.-1,$/if pos
}
użytkownik 2846289
źródło
1
dobra robota. myślę, że można zastąpić /.{$n}/;$_=$&.$_;zs/.{$n}/$&$&/;
ardnew
1

JavaScript (ES6) - 147 133 136 znaków

s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Oczekuje, że łańcuch, który ma zostać przetestowany, znajduje się w zmiennej si przekazuje wynik do konsoli.

var repetitionRE = /^(((.*).*)\2+)\3\n/;
                                        // Regular expression to find repeating sequence
                                        // without any trailing sub-string of the sequence.
var sequence = repetitionRE.exec(s)[1]; // Find the sequence string.
s.split('\n')                           // Split the input into an array.
 .map(
   ( row, index ) =>                    // Anonymous function using ES6 arrow syntax
   {
     var testStr = row + '᛫'+ sequence + sequence;
                                        // Concatenate the current row, a character which won't
                                        // appear in the input and two copies of the repetitions
                                        // of the sequence from the first line.
     var match = /^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(testStr);
                                        // Left of the ᛫ finds sub-matches for a single
                                        // character and the sub-strings before and after.
                                        // Right of the ᛫ looks for any number of characters
                                        // then the before and after sub-matches with a
                                        // different character between.
      if ( match )
       console.log( match[1].length, index );
                                        // Output the index of the non-matching character
                                        // and the row.
   }         
 );

Przypadek testowy 1

s="codegolfcodegolfco\negolfcodegolfcodeg\nlfcodegolfcodegoff\nodegolfcodegolfcod\ngolfcodegolfcodego\nfcodegolfcodegolfc"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Wyjścia

16 2

Przypadek testowy 2

s="][[][][[][][[][][[][][[\n[][][[][][[][][[][][[][\n[][[][][[][][[][][[][][\n[[][][[]]][[][][[][][[]"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Wyjścia

8 3

Przypadek testowy 3

s="...\n. .\n..."
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Wyjścia

1 1

Przypadek testowy 4

s="ababa\nbabab\nababb\nbabab"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Wyjścia

4 2

Przypadek testowy 5

s="xyxy\nyyxy"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Wyjścia

0 1

Przypadek testowy 6

s="ababaababa\nababaaaaba"
s.split('\n').map((x,i)=>(v=/^(.*)(.)(.*)᛫.*\1(?!\2).\3/.exec(x+'᛫'+(a=/^(((.*).*)\2+)\3\n/.exec(s)[1])+a))&&console.log(v[1].length,i))

Wyjścia

6 1
MT0
źródło
Niestety takie podejście zawodzi, jeśli np s="xyxy\nyyxy". Dla drugiej linii match[4]będzie yy; powinno być po prostu y.
Dennis
Przerobiono i skrócono o 14 znaków.
MT0
Bardzo dobrze! W pewnym momencie próbowałem tego samego drugiego wyrażenia regularnego, ale dwukrotnie dodałem minimalny wzorzec zamiast maksymalnego (i dlatego nie powiodło się). Jeden drobny problem: Pierwsze wyrażenie regularne zgłosi ababwzór ababaababa; musisz użyć ^…$.
Dennis
/^…\n/działa lub/^…$/m
MT0
1
Może nie potrzebować wiodącego ^(przynajmniej nie dla żadnego z 6 przypadków testowych, które wymieniłem - ale prawdopodobnie istnieje przeciwny przykład, w którym to zrobił, więc zostawiłem go).
MT0,