Zaimplementuj skracacz URL

12

Adresy URL stają się zbyt długie. Musisz więc zaimplementować algorytm, aby skrócić adres URL.

ja. Struktura adresu URL

Adres URL składa się z 2 głównych części: domeny i ścieżki . Domena jest częścią adresu URL przed pierwszym ukośnikiem. Możesz założyć, że adres URL nie zawiera protokołu. Ścieżka to wszystko inne.

ii. Domena

Domeną URL będzie coś takiego: xkcd.com meta.codegolf.stackexcchhannnge.cooom. Każda część jest oddzielona okresem, np. W blag.xkcd.comczęści są „blag”, „xkcd” i „com”. Oto, co z tym zrobisz:

  • Jeśli zawiera więcej niż dwie części, odłóż dwie ostatnie na bok i połącz pierwszą literę pozostałych części.

  • Następnie połącz to z pierwszą literą do części od drugiej do ostatniej.

  • Dodaj kropkę oraz drugą i trzecią literę części od drugiej do ostatniej.

  • Odrzuć ostatnią część.

iii. Ścieżka

Ścieżka będzie jak: /questions/2140/ /1407/. Tak jak poprzednio, „części” są oddzielone ukośnikami. Dla każdej części ścieżki wykonaj:

  • Dodaj ukośnik

  • Jeśli jest w całości wykonany z dziesięciu cyfr podstawy, zinterpretuj go jako liczbę i przekonwertuj na liczbę całkowitą base-36.

  • W przeciwnym razie dodaj pierwszą literę części.

Na końcu dodaj ukośnik.

iv. Misc.

  • To jest , więc wygrywa najkrótszy kod.
  • Ścieżka może być pusta, ale adres URL zawsze kończy się ukośnikiem.
  • Nie będzie to protokół (np http://, file:///)
  • W domenie nigdy nie będzie mniej niż dwie części.
  • Obowiązują standardowe luki.

Przykłady

W: xkcd.com/72/
Out:x.kc/20/

W: math.stackexchange.com/a/2231/
Out:ms.ta/a/1pz/

W: hello.org/somecoolcodeintrepreteriijjkk?code=3g3fzsdg32,g2/
Out:h.el/s/

ev3commander
źródło
Czy w ostatnim przykładzie ścieżka nie kończy się na, kka wszystko, co zaczyna się od, ?jest ciągiem zapytania, który nie powinien kończyć się ukośnikiem? Również nie wszystkie adresy URL kończą się ukośnikiem /, np www.something.com/path. Czy jest to nieistotne dla celów tego wyzwania?
inserttusernamehere
To nie ma znaczenia.
ev3commander

Odpowiedzi:

0

Pyth, 93 85 bajtów

Lsm@+jkUTGdjb36J<zxz\/KP>zhxz\/=cJ\.pss[mhd<J_2hePJ\.<tePJ2\/;=cK\/sm+?-djkUThdysd\/K

Ręcznie skompilowany do pseudokodu pythonowego:

                z = input()                     # raw, unevaluated
                G = "abcdefghijklmnopqrstuvwxyz"
                k = ""
                T = 10
L               def y(b):                       # define y as base10to36
 sm                 join(map(lambda d:
  @+jkUTGd            (join(range(T),interleave=k)+G)[d],
                                                # the join(..)+G makes "0...9a...z"
  jb36                 convert(b,36)            # returns a list of digit values in base10
J<zxz\/         J = z[:z.index("\/")]           # domain portion
KP>zhxz\/       K = z[1+z.index("\/"):][:-1]    # path portion
=cJ\.           J = J.split(".")                # splits domain into parts
pss[            no_newline_print(join(join[     # 1 join yields a list, the other a string
 mhd<J_2            map(lambda d:d[0],J[:-2]),
 hePJ               J[:-1][-1][1],
 \.                 ".",
 <tePJ2             J[:-1][-1][1:][:2],
 \/                 "\/"
;               ])
=cK\/           K = K.split("\/")
sm              print(join(map(lambda d:
 +?-djkUThdysd\/    "\/"+(d[0] if filterOut(d,join(range(T),interleave=k)) else y(int(d))),
                    # the filter will turn pure number into empty string, which is False
 K                  K)))

Wreszcie rozkosz kończy się ...

busukxuan
źródło
4

JavaScript (ES6), 149 bajtów

u=>u.split`/`.map((p,i)=>i?/^\d+$/.test(p)?(+p).toString(36):p[0]:(d=p.split`.`).slice(0,-1).map((s,j)=>s[l=j,0]).join``+"."+d[l].slice(1,3)).join`/`

Wyjaśnienie

Uczyniłem to niezależnym od rozwiązania @ Neil, ale ostatecznie wyglądało to bardzo podobnie.

u=>
  u.split`/`.map((p,i)=>       // for each part p at index i
    i?                         // if this is not the first part
      /^\d+$/.test(p)?         // if p is only digits
        (+p).toString(36)      // return p as a base-36 number
      :p[0]                    // else return the first letter
    :
      (d=p.split`.`)           // d = domain parts
      .slice(0,-1).map((s,j)=> // for each domain part before the last
        s[l=j,0]               // return the first letter, l = index of last domain part
      ).join``
      +"."+d[l].slice(1,3)     // add the 2 letters as the final domain
  )
  .join`/`                     // output each new part separated by a slash

Test

użytkownik 81655
źródło
1

JavaScript ES6, 157 bajtów

u=>u.split`/`.map((p,i)=>i?/^\d+$/.test(p)?(+p).toString(36):p[0]:p.split`.`.reverse().map((h,i)=>i--?i?h[0]:h[0]+'.'+h[1]+h[2]:'').reverse().join``).join`/`

Edycja: Zapisano 4 bajty dzięki Doᴡɴɢᴏᴀᴛ.

Neil
źródło
Powinieneś być w stanie tworzyć .split('/')i tworzyć .split('.')szablony ciągów
Downgoat 21.01.16
@ Doᴡɴɢᴏᴀᴛ Bah, też pamiętałem join!
Neil
1

Python 2, 378 365 bajtów

Aktualizacja

Trochę zagrał w golfa. ~ 150 bajtów dla funkcji base36 jest denerwujące, ale nie mogę się tego pozbyć, dopóki Python nie ma wbudowanej funkcji ...

def b(n):
 a=abs(n);r=[];
 while a :
    r.append('0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'[a%36]);a//=36
 if n<0:r.append('-')
 return''.join(reversed(r or'0'))
u=raw_input();P=u.split("/")[0].split(".")
print"".join([p[0] for p in P[0:-2]]+[P[-2][0]]+["."]+list(P[-2])[1:3]+["/"]+[b(int(p))+"/"if p.isdigit()else p[0]+"/" for p in u.split(".")[-1].split("/")[1:-1]])

Stara wersja

def b(n):
 a=abs(n)
 r=[]
 while a:
    r.append('0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'[a%36])
    a//=36
 if n<0:r.append('-')
 return''.join(reversed(r or'0'))
u=raw_input()
P=u.split("/")[0].split(".")
s=""
if len(P)>2:
 for p in P[:-2]:s+=p[0]
s+=P[-2][0]+"."+P[0][1:3]
P=u.split(".")[-1].split("/")[1:-1]
for p in P:
 s+="/"+(b(int(p)) if p.isdigit() else p[0])
print s+"/"

Ponieważ Python nie ma wbudowanego sposobu konwersji ints na base36-String, wziąłem implementację z numpy i grałem w golfa. Odpoczynek jest dość prosty, po pracy będę grać w golfa. Tymczasem sugestie są zawsze mile widziane!

Denker
źródło
0

Pyhton 2, 336 329 bajtów

aktualizacja

naprawione i krótsze dzięki webwarrior

def b(a):
 r=''
 while a:
  r+=chr((range(48,58)+range(65,91))[a%36])
  a//=36
 return ''.join(reversed(r or '0'))
u=raw_input()
P=u.split('/')[0].split('.')
s=''
if len(P)>2:
 for p in P[:-2]: s+=p[0]
s+=P[-2][0]+'.'+P[0][1:3]
P=u.split('.')[-1].split('/')[1:]
for p in P: s+='/'+(b(int(p)) if p.isdigit() else p[0])
print s+'/'

oryginał

Wersja DenkerAffe z niektórymi modami: poprawnie obsługuje schemat „foo / bar? Baz”, a ponadto nie ma potrzeby występowania ujemnego przypadku w funkcji konwersji base36.

 def b(a):
 r=''
 while a:
  r+=('0123456789ABCDEFGHUKLMNOPQRSTUVWXYZ'[a%36])
  a//=36
 return ''.join(reversed(r or '0'))
u=raw_input()
P=u.split('/')[0].split('.')
s=''
if len(P)>2:
 for p in P[:-2]: s+=p[0]
s+=P[-2][0]+'.'+P[0][1:3]
P=u.split('.')[-1].split('/')[1:]
for p in P: s+='/'+(b(int(p)) if p.isdigit() else p[0])
print s+'/'
Setop
źródło
Wystąpił błąd w ciągu wyszukiwania, a także cała linia może być krótsza:r+=chr((range(48,58)+range(65,91))[a%36])
webwarrior