TO… JEST… TWIERDZA!

11

Fortress był językiem opracowywanym przez Sun Programming Language Research Group (RIP Fortress), który miał unikalną właściwość, możliwe było renderowanie („Fortify”) programów w różnych stylach czcionek (tj. Pogrubienie, pogrubienie, kursywa, rzymskie itp.). Celem jest reprezentowanie jednoznakowej zmiennej Fortress w znacznikach HTML.

Oto jak działa fortyfikacja zmiennych jednoznakowych (uproszczonych / zmodyfikowanych z dokumentacji do celów gry w golfa kodowego):

  • Jeśli zmienna jest kapitałem powtarzalnym (tj. ZZ), Zostaje sformatowana pogrubioną czcionką ( 𝔸𝔹ℂ𝔻𝔼𝔽𝔾ℍ𝕀𝕁𝕂𝕃𝕄ℕ𝕆ℙℚℝ𝕊𝕋𝕌𝕍𝕎𝕏𝕐ℤ)
  • Jeśli zmienna jest poprzedzona znakiem podkreślenia, zmienna jest renderowana czcionką rzymską (pozostawiona sama)
  • Jeśli po zmiennej następuje znak podkreślenia, zmienna jest renderowana pogrubioną czcionką ( <b>v </b>)
  • Jeśli zmienna nie jest poprzedzona ani nie jest podkreślona, ​​zmienna jest renderowana kursywą ( <i>v </i>)
  • Punkty kodowe pogrubionej tablicy to:: 𝔸1D538,: 1D539 𝔹,: 2102 𝔻,: 1D53B,: 1D53C,: 1D53D 𝔼,: 𝔽1D53E 𝔾,: 210D 𝕀,: 𝕁1D540 𝕂,: 𝕃1D541 𝕄,: 1D542,: 1D543,: 1D544,: 2115, 𝕆: 1D546,: 2119 ,: 211A ,: 𝕊211D 𝕋,: 𝕌1D54A 𝕍,: 𝕎1D54B 𝕏,: 𝕐1D54C,: 1D54D,: 1D54E,: 1D54F,: 1D550,: 2124. Liczą się one jako jeden bajt w twoim programie (jeśli twój wybrany język w ogóle obsługuje te znaki)

Dane wejściowe będą albo powtarzaną wielką literą ASCII, albo pojedynczą literą ASCII bez podkreślenia, wiodącego podkreślenia lub końcowego podkreślenia (AKA _a_nie będzie wejściem). To jest golf golfowy, więc wygrywa najmniej bajtów!

Przypadki testowe:

a => <i>a</i>
BB => 𝔹
c_ => <b>c</b>
_d => d
E => <i>E</i>
G_ => <b>G</b>
_H => H
ZZ => ℤ

Linki: Specyfikacja , Bezpośrednie pobieranie wersji 0.1 alfa .

Implementacja referencyjna (byłaby to w Fortress, ale Fortress nie lubi większości podwójnie uderzonych postaci, więc ta implementacja jest w D):

dstring fortify(string arg) {
    import std.string, std.conv;

    alias D = to!dstring; //Convert to a string that accepts the unicode needed
    dstring BB = "𝔸𝔹ℂ𝔻𝔼𝔽𝔾ℍ𝕀𝕁𝕂𝕃𝕄ℕ𝕆ℙℚℝ𝕊𝕋𝕌𝕍𝕎𝕏𝕐ℤ"d; //blackboard bold capitals
    string UC = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"; //normal ASCII capitals

    if(arg.length == 1)
        return D("<i>" ~ arg ~ "</i>");
    if(arg[0] == a[1])
        return D(BB[UC.indexOf(arg[0])]);
    if(arg[0] == '_')
        return D(arg[1]);
    return D("<b>" ~ arg[0] ~ "</b>");
}
Zacharý
źródło
Zapomniałem je usunąć, link do piaskownicy: codegolf.meta.stackexchange.com/a/13383/55550
Zacharý
Czy jedyne zmienne pisane małymi literami są powtarzane podwójnie, a czy jedyne trzy małe litery to pozostałe trzy?
Jonathan Allan
Wielkie litery mogą być normalne, pochylone i pogrubione. Małe litery nie mogą być podwójnie uderzone.
Zacharý
_____nie zostaną wprowadzone.
Zacharý
Och ... Więc to nie jest ciąg znaków, które konwertujemy, tylko jeden?
Magic Octopus Urn

Odpowiedzi:

1

Galaretka , 73 bajty

Okazuje się, że niemożność użycia liter BBB w kodzie jest dość droga.

5ŀ”i
“Ðñṡ’Dẋ@€“¡ḞḄ’ż“¿¿Æ€¢¬µ‘+⁽ø³F⁸ṪO¤+ị¥Ọ
Ṫ
Ḣ5ŀ”b
;j“<>/”ṃ@“¢ʠf’
i”_+LµĿ

Pełny program przyjmujący jeden argument i wypisujący wynik.

Wypróbuj online! lub zobacz pakiet testowy .

W jaki sposób?

Głównym punktem wejścia jest ostatni wiersz kodu („Główny link”).

5ŀ”i - Link 1: list of characters, s (length 1 & no underscore)
  ”i - literal character 'i'
5ŀ   - call link 5 as a dyad with s on the left and 'i' on the right

“Ðñṡ’Dẋ@€“¡ḞḄ’ż“¿¿Æ€¢¬µ‘+⁽ø³F⁸ṪO¤+ị¥Ọ - Link 2: list of characters, s (length 2 & no underscore)
“Ðñṡ’                                 - base 250 literal              1007245
     D                                - to decimal list               [1,0,0,7,2,4,5]
         “¡ḞḄ’                        - base 250 literal              111673
      ẋ@€                             - repeat with reversed @rguments for €ach -> [[111673],[],[],[111673,111673,111673,111673,111673,111673,111673],[111673,111673],[111673,111673,111673,111673],[111673,111673,111673,111673,111673]]
               “¿¿Æ€¢¬µ‘              - code page index list          [11,11,13,12,1,7,9]
              ż                       - zip together                  [[111673,11],[11],[13],[[111673,111673,111673,111673,111673,111673,111673],12],[[111673,111673],1],[[111673,111673,111673,111673],7],[[111673,111673,111673,111673,111673],9]]
                         ⁽ø³          - base 250 literal              8382
                        +             - addition (vectorises)         [[120055,8393],[8393],[8395],[[120055,120055,120055,120055,120055,120055,120055],8394],[[120055,120055],8383],[[120055,120055,120055,120055],8389],[[120055,120055,120055,120055,120055],8391]]
                            F         - flatten                       [120055,8393,8393,8395,120055,120055,120055,120055,120055,120055,120055,8394,120055,120055,8383,120055,120055,120055,120055,8389,120055,120055,120055,120055,120055,8391]
                                ¤     - nilad followed by link(s) as a nilad:                                                                                    ^
                             ⁸        -   chain's left argument, s  e.g.    "CC"                                                                                 |
                              Ṫ       -   tail (last character)             'C'                                                                                  |
                               O      -   cast to ordinal                   67                                                                                   |
                                   ¥  - last two links as a dyad:                                                                                                |
                                  ị   -   index into (1-indexed & modular)  8383 (this is at index 67%26=15 -----------------------------------------------------+ )
                                 +    -   add the ordinal                   8450
                                    Ọ - convert from ordinal to character   'ℂ'

Ṫ - Link 3: list of characters, s (length 2 & underscore at index 1)
Ṫ - tail (get the first character

Ḣ5ŀ”b - Link 4: list of characters, s (length 2 & underscore at index 2)
Ḣ     - head s (the non-_ character)
   ”b - literal character 'b'
 5ŀ   - call link 5 as a dyad with the non-_ character on the left and 'b' on the right

;j“<>/”ṃ@“¢ʠf’ - Link 5, wrap in a tag: element, tagName      e.g. 'a', 'i'
;              - concatenate the element with the tagName          "ai"
  “<>/”        - literal list of characters                        "<>/"
 j             - join                                              "a<>/i"
         “¢ʠf’ - base 250 literal                                  166603
       ṃ@      - base decompression with reversed @rguments
               -   "a<>/i" is 5 long, so 166603 is converted to
               -   base 5 [2,0,3,1,2,4,0,3] with digits "a<>/i"    "<i>a</i>"

i”_+LµĿ - Main link: list of characters, s (as specified only):
 ”_     - literal '_'
i       - index of '_' in s (1-indexed; 0 if not found)
    L   - length of s
   +    - addition
     µĿ - call link with that number as a monad with argument s
        - implicit print
Jonathan Allan
źródło
Nie działa na wejściu ZZ.
Zacharý
Och, czy to jest w innym miejscu w Unicode? Dokonali dziwnego wyboru.
Jonathan Allan,
Tak, podwójnie uderzeni C H N P Q Ri Zsą w różnych miejscach w Unicode.
Zacharý
(Przeczytaj piąty punkt)
Zacharý
LOL, fajnie jest oglądać takie flopowe galaretki!
Zacharý
4

Python 3.6, 159 131 128 bajtów

1 bajt zapisany dzięki @ Zacharý

3 bajty zapisane dzięki @ VаlueInk

28 bajtów zapisanych dzięki @Rod

lambda s:len(s)<2and f"<i>{s}</i>"or s[0]==s[1]and"𝔸𝔹ℂ𝔻𝔼𝔽𝔾ℍ𝕀𝕁𝕂𝕃𝕄ℕ𝕆ℙℚℝ𝕊𝕋𝕌𝕍𝕎𝕏𝕐ℤ"[ord(s[0])-65]or[f"<b>{s[0]}</b>",s[1]][s[0]=='_']

Wypróbuj online!

Uriel
źródło
len(s)<2 and=>len(s)<2and
Zacharý
Spójrz na nową edycję wpisu 𝔸𝔹ℂ𝔻𝔼𝔽𝔾ℍ𝕀𝕁𝕂𝕃𝕄ℕ𝕆ℙℚℝ𝕊𝕋𝕌𝕍𝕎𝕏𝕐ℤ policz jako 1 bajt każdy.
Zacharý
2

Rubinowy , 104 106 105 + 1 = 105 107 106 „bajtów”

Prawdopodobnie działa jeszcze lepiej w siatkówce. Używa -pflagi.

-1 bajt z Zacharý.

gsub /^.$/,'<i>\0</i>'
gsub(/(.)\1/){$1.tr"A-Z","𝔸𝔹ℂ𝔻-𝔾ℍ𝕀-𝕄ℕ𝕆ℙℚℝ𝕊-𝕐ℤ"}
gsub /(.)_/,'<b>\1</b>'
gsub ?_,''

Wypróbuj online!

Wartość tuszu
źródło
Zapomniałeś JJ, KK, LL, TT, UU, VVi WW. !! (I prawdopodobnie dlatego MMdaje )
Zacharý
@ Zacharý naprawiony.
Wartość tuszu
2
Myślę, że możesz uratować bajt, robiąc 𝕊-𝕏𝕐 𝕊-𝕐.
Zacharý
Nie zaktualizowałeś linku TIO w celu zapisania 1-bajtowego. Ponadto zawodzi to w przypadku Retiny, która korzysta z UTF-16, a więc nie może przetłumaczyć pojedynczego AY na czarną pogrubioną postać o dwóch char16_t.
Neil,
@Neil oops. Naprawiono link.
Wartość tuszu
1

JavaScript, 97 znaków

([a,b])=>a==b?[...'𝔸𝔹ℂ𝔻𝔼𝔽𝔾ℍ𝕀𝕁𝕂𝕃𝕄ℕ𝕆ℙℚℝ𝕊𝕋𝕌𝕍𝕎𝕏𝕐ℤ'][a.charCodeAt()-65]:b?b=='_'?a.bold():b:a.italics()

Dlaczego język ma metody takie jak String.prototype.italicsi String.prototype.bold?

Dzięki Neilowi ​​zaoszczędź 9 bajtów, użyj [...s]zamiast s.match(/./u).

tsh
źródło
Czy to ES6, czy ES7?
Zacharý
uFlaga w RegExp jest funkcją ES6. String.prototype.italicsi String.prototype.boldto tylko niektóre starsze funkcje.
tsh
Wiedziałem, że to ES6 ... bo grube strzały.
Zacharý
zmień „ES6” na „ES6 lub ES7” w powyższym komentarzu.
Zacharý
[...'𝔸𝔹ℂ𝔻𝔼𝔽𝔾ℍ𝕀𝕁𝕂𝕃𝕄ℕ𝕆ℙℚℝ𝕊𝕋𝕌𝕍𝕎𝕏𝕐ℤ']powinien zaoszczędzić trochę bajtów.
Neil,