Jak przekonwertować tytuł na slug adresu URL w jQuery?

163

Pracuję nad aplikacją w CodeIgniter i próbuję utworzyć pole w formularzu dynamicznie generując slug URL. Chciałbym usunąć znaki interpunkcyjne, zamienić je na małe litery i zastąpić spacje łącznikami. Na przykład Rib Shane stałby się shanes-rib-shack.

Oto, co mam do tej pory. Małe litery były łatwe, ale zamiana wydaje się w ogóle nie działać i nie mam pojęcia, aby usunąć interpunkcję:

$("#Restaurant_Name").keyup(function(){
    var Text = $(this).val();
    Text = Text.toLowerCase();
    Text = Text.replace('/\s/g','-');
    $("#Restaurant_Slug").val(Text);    
});
GSto
źródło
2
Nie jQuery, ale zajrzyj do bibliotek „speakurl” lub „node-slug”
Kevin Wheeler
... lub slugify
x-yuri

Odpowiedzi:

379

Nie mam pojęcia, skąd wzięło się określenie „ślimak”, ale zaczynamy:

function convertToSlug(Text)
{
    return Text
        .toLowerCase()
        .replace(/ /g,'-')
        .replace(/[^\w-]+/g,'')
        ;
}

Pierwsza zamiana zamieni spacje na łączniki, druga zamiana usunie wszystko, co nie jest alfanumeryczne, podkreślenie ani łącznik.

Jeśli nie chcesz, aby rzeczy takie jak - zamieniały się w takie jak --- to, możesz zamiast tego użyć tego:

function convertToSlug(Text)
{
    return Text
        .toLowerCase()
        .replace(/[^\w ]+/g,'')
        .replace(/ +/g,'-')
        ;
}

Spowoduje to usunięcie łączników (ale nie spacji) przy pierwszym zastąpieniu, a przy drugim zastąpieniu nastąpi kondensacja kolejnych spacji w jeden łącznik.

Więc „jak - to” wychodzi jako „jak to”.

Peter Boughton
źródło
1
nie zapomnij dodać „/” również, jeśli potrzebujesz oddzielnych wielu katalogów
Val
6
termin "ślimak" pochodzi z wordpress
Brynner Ferreira
18
Aby uniknąć wielu kolejnych łączników, użyłem text.toLowerCase().replace(/ /g,'-').replace(/[-]+/g, '-').replace(/[^\w-]+/g,'');zamiast opcji 2. Opcja 2 zamieni „th - is” na „this”.
Ryan Allen
Jak zezwolić na kropkę w adresie URL?
Idan Shechter
Aby uniknąć "_" w slug, nadpisz .replace (/ + / g, '-') na .replace (/ + | _ / g, '-').
Odin Thunder
112
var slug = function(str) {
  str = str.replace(/^\s+|\s+$/g, ''); // trim
  str = str.toLowerCase();

  // remove accents, swap ñ for n, etc
  var from = "ãàáäâẽèéëêìíïîõòóöôùúüûñç·/_,:;";
  var to   = "aaaaaeeeeeiiiiooooouuuunc------";
  for (var i=0, l=from.length ; i<l ; i++) {
    str = str.replace(new RegExp(from.charAt(i), 'g'), to.charAt(i));
  }

  str = str.replace(/[^a-z0-9 -]/g, '') // remove invalid chars
    .replace(/\s+/g, '-') // collapse whitespace and replace by -
    .replace(/-+/g, '-'); // collapse dashes

  return str;
};

i próbuj

slug($('#field').val())

oryginał: http://dense13.com/blog/2009/05/03/converting-string-to-slug-javascript/


EDYCJA: rozszerzona o bardziej specyficzne dla języków znaki:

var from = "ÁÄÂÀÃÅČÇĆĎÉĚËÈÊẼĔȆĞÍÌÎÏİŇÑÓÖÒÔÕØŘŔŠŞŤÚŮÜÙÛÝŸŽáäâàãåčçćďéěëèêẽĕȇğíìîïıňñóöòôõøðřŕšşťúůüùûýÿžþÞĐđßÆa·/_,:;";
var to   = "AAAAAACCCDEEEEEEEEGIIIIINNOOOOOORRSSTUUUUUYYZaaaaaacccdeeeeeeeegiiiiinnooooooorrsstuuuuuyyzbBDdBAa------";
Taranttini
źródło
6
Ale nie poprawnie. W tekstach niemieckich ünależy zastąpić ueitd.
feklee
5
@feklee: „Nieprawidłowo” jest prawdziwe dla niemieckiego (i być może niektórych innych języków), ale w innych językach jest po prostu w porządku. W przypadku angielskiej witryny internetowej chciałbym, aby „Márföldi” (nazwisko pochodzenia węgierskiego) zostało zamienione na „marfoldi”, a nie „marfoeldi”, jak zrobiliby to Niemcy.
michalstanko
1
Aby zapewnić kompatybilność między platformami, możesz dokonać zamiany z = "\ u00E3 \ u00E0 \ u00E1 \ u00E4 \ u00E2 \ u1EBD \ u00E8 \ u00E9 \ u00EB \ u00EA \ u00EC \ u00ED \ u00EF \ u00EE \ u00F5 \ u00F2 \ u00F2 \ u00F2 \ u00F6 \ u00F4 \ u00F9 \ u00FA \ u00FC \ u00FB \ u00F1 \ u00E7 \ u00B7 / _,:; ";
Mike Godin
1
Niezłe rozwiązanie! Brakuje jednak Skandynawii å.
Fredric
1
Możesz dodawać İĞŞığşdo fromzmiennych i konwertować je IGSigsdo obsługi znaków tureckich.
CemilF
19

Po pierwsze, wyrażenia regularne nie powinny mieć otaczających cudzysłowów, więc „/ \ s / g” powinno być / \ s / g

Aby zastąpić wszystkie znaki niealfanumeryczne myślnikami, powinno to zadziałać (używając przykładowego kodu):

$("#Restaurant_Name").keyup(function(){
        var Text = $(this).val();
        Text = Text.toLowerCase();
        Text = Text.replace(/[^a-zA-Z0-9]+/g,'-');
        $("#Restaurant_Slug").val(Text);        
});

To powinno załatwić sprawę ...

Philippe Leybaert
źródło
8

Znalazłem dobre i kompletne rozwiązanie dla języka angielskiego

function slugify(string) {
  return string
    .toString()
    .trim()
    .toLowerCase()
    .replace(/\s+/g, "-")
    .replace(/[^\w\-]+/g, "")
    .replace(/\-\-+/g, "-")
    .replace(/^-+/, "")
    .replace(/-+$/, "");
}

Kilka przykładów użycia:

slugify(12345);
// "12345"

slugify("  string with leading   and   trailing whitespace    ");
// "string-with-leading-and-trailing-whitespace"

slugify("mIxEd CaSe TiTlE");
// "mixed-case-title"

slugify("string with - existing hyphens -- ");
// "string-with-existing-hyphens"

slugify("string with Special™ characters");
// "string-with-special-characters"

Podziękowania dla Andrew Stewarta

zahid9i
źródło
8

Mam nadzieję, że to może uratować komuś dzień ...

/* Encode string to slug */
function convertToSlug( str ) {
	
  //replace all special characters | symbols with a space
  str = str.replace(/[`~!@#$%^&*()_\-+=\[\]{};:'"\\|\/,.<>?\s]/g, ' ').toLowerCase();
	
  // trim spaces at start and end of string
  str = str.replace(/^\s+|\s+$/gm,'');
	
  // replace space with dash/hyphen
  str = str.replace(/\s+/g, '-');	
  document.getElementById("slug-text").innerHTML= str;
  //return str;
}
<input type="text" onload="convertToSlug(this.value)" onkeyup="convertToSlug(this.value)" value="Try it Yourself"/>
<p id="slug-text"></p>

bmatovu
źródło
7

Potrzebowałeś tylko plusa :)

$("#Restaurant_Name").keyup(function(){
        var Text = $(this).val();
        Text = Text.toLowerCase();
        var regExp = /\s+/g;
        Text = Text.replace(regExp,'-');
        $("#Restaurant_Slug").val(Text);        
});
karim79
źródło
6

Spójrz na tę funkcję slug do dezynfekcji adresów URL, opracowaną przez Seana Murphy'ego pod adresem https://gist.github.com/sgmurphy/3095196

/**
 * Create a web friendly URL slug from a string.
 *
 * Requires XRegExp (http://xregexp.com) with unicode add-ons for UTF-8 support.
 *
 * Although supported, transliteration is discouraged because
 *     1) most web browsers support UTF-8 characters in URLs
 *     2) transliteration causes a loss of information
 *
 * @author Sean Murphy <[email protected]>
 * @copyright Copyright 2012 Sean Murphy. All rights reserved.
 * @license http://creativecommons.org/publicdomain/zero/1.0/
 *
 * @param string s
 * @param object opt
 * @return string
 */
function url_slug(s, opt) {
    s = String(s);
    opt = Object(opt);

    var defaults = {
        'delimiter': '-',
        'limit': undefined,
        'lowercase': true,
        'replacements': {},
        'transliterate': (typeof(XRegExp) === 'undefined') ? true : false
    };

    // Merge options
    for (var k in defaults) {
        if (!opt.hasOwnProperty(k)) {
            opt[k] = defaults[k];
        }
    }

    var char_map = {
        // Latin
        'À': 'A', 'Á': 'A', 'Â': 'A', 'Ã': 'A', 'Ä': 'A', 'Å': 'A', 'Æ': 'AE', 'Ç': 'C', 
        'È': 'E', 'É': 'E', 'Ê': 'E', 'Ë': 'E', 'Ì': 'I', 'Í': 'I', 'Î': 'I', 'Ï': 'I', 
        'Ð': 'D', 'Ñ': 'N', 'Ò': 'O', 'Ó': 'O', 'Ô': 'O', 'Õ': 'O', 'Ö': 'O', 'Ő': 'O', 
        'Ø': 'O', 'Ù': 'U', 'Ú': 'U', 'Û': 'U', 'Ü': 'U', 'Ű': 'U', 'Ý': 'Y', 'Þ': 'TH', 
        'ß': 'ss', 
        'à': 'a', 'á': 'a', 'â': 'a', 'ã': 'a', 'ä': 'a', 'å': 'a', 'æ': 'ae', 'ç': 'c', 
        'è': 'e', 'é': 'e', 'ê': 'e', 'ë': 'e', 'ì': 'i', 'í': 'i', 'î': 'i', 'ï': 'i', 
        'ð': 'd', 'ñ': 'n', 'ò': 'o', 'ó': 'o', 'ô': 'o', 'õ': 'o', 'ö': 'o', 'ő': 'o', 
        'ø': 'o', 'ù': 'u', 'ú': 'u', 'û': 'u', 'ü': 'u', 'ű': 'u', 'ý': 'y', 'þ': 'th', 
        'ÿ': 'y',

        // Latin symbols
        '©': '(c)',

        // Greek
        'Α': 'A', 'Β': 'B', 'Γ': 'G', 'Δ': 'D', 'Ε': 'E', 'Ζ': 'Z', 'Η': 'H', 'Θ': '8',
        'Ι': 'I', 'Κ': 'K', 'Λ': 'L', 'Μ': 'M', 'Ν': 'N', 'Ξ': '3', 'Ο': 'O', 'Π': 'P',
        'Ρ': 'R', 'Σ': 'S', 'Τ': 'T', 'Υ': 'Y', 'Φ': 'F', 'Χ': 'X', 'Ψ': 'PS', 'Ω': 'W',
        'Ά': 'A', 'Έ': 'E', 'Ί': 'I', 'Ό': 'O', 'Ύ': 'Y', 'Ή': 'H', 'Ώ': 'W', 'Ϊ': 'I',
        'Ϋ': 'Y',
        'α': 'a', 'β': 'b', 'γ': 'g', 'δ': 'd', 'ε': 'e', 'ζ': 'z', 'η': 'h', 'θ': '8',
        'ι': 'i', 'κ': 'k', 'λ': 'l', 'μ': 'm', 'ν': 'n', 'ξ': '3', 'ο': 'o', 'π': 'p',
        'ρ': 'r', 'σ': 's', 'τ': 't', 'υ': 'y', 'φ': 'f', 'χ': 'x', 'ψ': 'ps', 'ω': 'w',
        'ά': 'a', 'έ': 'e', 'ί': 'i', 'ό': 'o', 'ύ': 'y', 'ή': 'h', 'ώ': 'w', 'ς': 's',
        'ϊ': 'i', 'ΰ': 'y', 'ϋ': 'y', 'ΐ': 'i',

        // Turkish
        'Ş': 'S', 'İ': 'I', 'Ç': 'C', 'Ü': 'U', 'Ö': 'O', 'Ğ': 'G',
        'ş': 's', 'ı': 'i', 'ç': 'c', 'ü': 'u', 'ö': 'o', 'ğ': 'g', 

        // Russian
        'А': 'A', 'Б': 'B', 'В': 'V', 'Г': 'G', 'Д': 'D', 'Е': 'E', 'Ё': 'Yo', 'Ж': 'Zh',
        'З': 'Z', 'И': 'I', 'Й': 'J', 'К': 'K', 'Л': 'L', 'М': 'M', 'Н': 'N', 'О': 'O',
        'П': 'P', 'Р': 'R', 'С': 'S', 'Т': 'T', 'У': 'U', 'Ф': 'F', 'Х': 'H', 'Ц': 'C',
        'Ч': 'Ch', 'Ш': 'Sh', 'Щ': 'Sh', 'Ъ': '', 'Ы': 'Y', 'Ь': '', 'Э': 'E', 'Ю': 'Yu',
        'Я': 'Ya',
        'а': 'a', 'б': 'b', 'в': 'v', 'г': 'g', 'д': 'd', 'е': 'e', 'ё': 'yo', 'ж': 'zh',
        'з': 'z', 'и': 'i', 'й': 'j', 'к': 'k', 'л': 'l', 'м': 'm', 'н': 'n', 'о': 'o',
        'п': 'p', 'р': 'r', 'с': 's', 'т': 't', 'у': 'u', 'ф': 'f', 'х': 'h', 'ц': 'c',
        'ч': 'ch', 'ш': 'sh', 'щ': 'sh', 'ъ': '', 'ы': 'y', 'ь': '', 'э': 'e', 'ю': 'yu',
        'я': 'ya',

        // Ukrainian
        'Є': 'Ye', 'І': 'I', 'Ї': 'Yi', 'Ґ': 'G',
        'є': 'ye', 'і': 'i', 'ї': 'yi', 'ґ': 'g',

        // Czech
        'Č': 'C', 'Ď': 'D', 'Ě': 'E', 'Ň': 'N', 'Ř': 'R', 'Š': 'S', 'Ť': 'T', 'Ů': 'U', 
        'Ž': 'Z', 
        'č': 'c', 'ď': 'd', 'ě': 'e', 'ň': 'n', 'ř': 'r', 'š': 's', 'ť': 't', 'ů': 'u',
        'ž': 'z', 

        // Polish
        'Ą': 'A', 'Ć': 'C', 'Ę': 'e', 'Ł': 'L', 'Ń': 'N', 'Ó': 'o', 'Ś': 'S', 'Ź': 'Z', 
        'Ż': 'Z', 
        'ą': 'a', 'ć': 'c', 'ę': 'e', 'ł': 'l', 'ń': 'n', 'ó': 'o', 'ś': 's', 'ź': 'z',
        'ż': 'z',

        // Latvian
        'Ā': 'A', 'Č': 'C', 'Ē': 'E', 'Ģ': 'G', 'Ī': 'i', 'Ķ': 'k', 'Ļ': 'L', 'Ņ': 'N', 
        'Š': 'S', 'Ū': 'u', 'Ž': 'Z', 
        'ā': 'a', 'č': 'c', 'ē': 'e', 'ģ': 'g', 'ī': 'i', 'ķ': 'k', 'ļ': 'l', 'ņ': 'n',
        'š': 's', 'ū': 'u', 'ž': 'z'
    };

    // Make custom replacements
    for (var k in opt.replacements) {
        s = s.replace(RegExp(k, 'g'), opt.replacements[k]);
    }

    // Transliterate characters to ASCII
    if (opt.transliterate) {
        for (var k in char_map) {
            s = s.replace(RegExp(k, 'g'), char_map[k]);
        }
    }

    // Replace non-alphanumeric characters with our delimiter
    var alnum = (typeof(XRegExp) === 'undefined') ? RegExp('[^a-z0-9]+', 'ig') : XRegExp('[^\\p{L}\\p{N}]+', 'ig');
    s = s.replace(alnum, opt.delimiter);

    // Remove duplicate delimiters
    s = s.replace(RegExp('[' + opt.delimiter + ']{2,}', 'g'), opt.delimiter);

    // Truncate slug to max. characters
    s = s.substring(0, opt.limit);

    // Remove delimiter from ends
    s = s.replace(RegExp('(^' + opt.delimiter + '|' + opt.delimiter + '$)', 'g'), '');

    return opt.lowercase ? s.toLowerCase() : s;
}
Maks
źródło
1
W komendach ktoś powiedział: "To nie zadziała przy użyciu ścisłego w przeglądarkach IE11 z powodu duplikatów w obiekcie char_map."
BBaysinger
3

Tworzę wtyczkę do implementacji w większości języków: http://leocaseiro.com.br/jquery-plugin-string-to-slug/

Domyślne użycie:

$(document).ready( function() {
    $("#string").stringToSlug();
});

Jest to bardzo proste dzięki wtyczce stringToSlug jQuery

Leo Caseiro
źródło
3
function slugify(text){
  return text.toString().toLowerCase()
    .replace(/\s+/g, '-')           // Replace spaces with -
    .replace(/[^\u0100-\uFFFF\w\-]/g,'-') // Remove all non-word chars ( fix for UTF-8 chars )
    .replace(/\-\-+/g, '-')         // Replace multiple - with single -
    .replace(/^-+/, '')             // Trim - from start of text
    .replace(/-+$/, '');            // Trim - from end of text
}

*oparte na https://gist.github.com/mathewbyrne/1280286

teraz możesz przekształcić ten ciąg:

Barack_Obama       Барак_Обама ~!@#$%^&*()+/-+?><:";'{}[]\|`

w:

barack_obama-барак_обама

zastosowanie do twojego kodu:

$("#Restaurant_Name").keyup(function(){
    var Text = $(this).val();
    Text = slugify(Text);
    $("#Restaurant_Slug").val(Text);
});
Aleksandra Iwaszczenki
źródło
Nie wiem, dlaczego ta odpowiedź nie została wybrana jako prawidłowa. Wiele odpowiedzi nie liczy się na usunięcie # lub? z informacji o pracy - adresy URL zostaną w ten sposób uszkodzone. Nawet najczęściej używane biblioteki React nie mają zaimplementowanej tej funkcji. Ta odpowiedź jest bardzo prosta, ale uniwersalna.
Vladimir Marton
3

Połączenie różnych elementów z odpowiedzi tutaj z normalizacją zapewnia dobre pokrycie. Zachowaj kolejność operacji, aby stopniowo czyścić adres URL.

function clean_url(s) {
    return s.toString().normalize('NFD').replace(/[\u0300-\u036f]/g, "") //remove diacritics
            .toLowerCase()
            .replace(/\s+/g, '-') //spaces to dashes
            .replace(/&/g, '-and-') //ampersand to and
            .replace(/[^\w\-]+/g, '') //remove non-words
            .replace(/\-\-+/g, '-') //collapse multiple dashes
            .replace(/^-+/, '') //trim starting dash
            .replace(/-+$/, ''); //trim ending dash
}

normlize('NFD')rozbija znaki akcentowane na ich komponenty, które są podstawowymi literami i znakami diakrytycznymi (część akcentowana). replace(/[\u0300-\u036f]/g, "")usuwa wszystkie znaki diakrytyczne, pozostawiając same podstawowe litery. Resztę wyjaśniają komentarze w tekście.

OXiGEN
źródło
1
Dzięki Ci. Jest to proste i działa dobrze z moimi przypadkami testowymi. Nawet wietnamski znak `` const testCases = [{input: 'is it a good slug' ', oczekuj:' is-it-a-good-slug '}, {input:' ----- is --- --it ----- a ----- dobry ----- slug ----- ', oczekuj:' is-it-a-good-slug '}, {input:' CÔNG cha như núi Thái Sơn ', oczekuj:' cong-cha-nhu-nui-thai-son '}, {wejście:' -Haha - Nhất-Nguyễn ', oczekuj:' haha-nhat-nguyen '}] ``
Phat Tran Ky
1

Możesz użyć do tego własnej funkcji.

spróbuj: http://jsfiddle.net/xstLr7aj/

function string_to_slug(str) {
  str = str.replace(/^\s+|\s+$/g, ''); // trim
  str = str.toLowerCase();

  // remove accents, swap ñ for n, etc
  var from = "àáäâèéëêìíïîòóöôùúüûñç·/_,:;";
  var to   = "aaaaeeeeiiiioooouuuunc------";
  for (var i=0, l=from.length ; i<l ; i++) {
    str = str.replace(new RegExp(from.charAt(i), 'g'), to.charAt(i));
  }

  str = str.replace(/[^a-z0-9 -]/g, '') // remove invalid chars
    .replace(/\s+/g, '-') // collapse whitespace and replace by -
    .replace(/-+/g, '-'); // collapse dashes

  return str;
}
$(document).ready(function() {
    $('#test').submit(function(){
        var val = string_to_slug($('#t').val());
        alert(val);
        return false;
    });
});
MGE
źródło
Jaka jest różnica w tym rozwiązaniu od wysoko ocenionej odpowiedzi powyżej?
nilsi
kod zaktualizowany tutaj, aby usunąć ostatni znak, jeśli to "-" jsfiddle.net/xstLr7aj/36
MGE
1

Zaakceptowana odpowiedź nie spełniła moich potrzeb (pozwala na podkreślenie, nie obsługuje myślników na początku i na końcu itp.), A inne odpowiedzi miały inne problemy, które nie pasowały do ​​mojego przypadku użycia, więc oto funkcja slugify Wymyśliłem:

function slugify(string) {
    return string.trim() // Remove surrounding whitespace.
    .toLowerCase() // Lowercase.
    .replace(/[^a-z0-9]+/g,'-') // Find everything that is not a lowercase letter or number, one or more times, globally, and replace it with a dash.
    .replace(/^-+/, '') // Remove all dashes from the beginning of the string.
    .replace(/-+$/, ''); // Remove all dashes from the end of the string.
}

To zamieni 'foo !!! BAR _-_-_ baz-' (zwróć uwagę na spację na początku) w foo-bar-baz.

Justin Michael
źródło
1

Możesz rzucić okiem na wtyczkę speakURL i po prostu:

    $("#Restaurant_Name").on("keyup", function () {
        var slug = getSlug($("#Restaurant_Name").val());
        $("#Restaurant_Slug").val(slug);
    });
Kornel
źródło
1

Jeszcze jeden. Krótki i zachowuje znaki specjalne:

imaginação é mato => imaginacao-e-mato

function slugify (text) {
  const a = 'àáäâãèéëêìíïîòóöôùúüûñçßÿœæŕśńṕẃǵǹḿǘẍźḧ·/_,:;'
  const b = 'aaaaaeeeeiiiioooouuuuncsyoarsnpwgnmuxzh------'
  const p = new RegExp(a.split('').join('|'), 'g')

  return text.toString().toLowerCase()
    .replace(/\s+/g, '-')           // Replace spaces with -
    .replace(p, c =>
        b.charAt(a.indexOf(c)))     // Replace special chars
    .replace(/&/g, '-and-')         // Replace & with 'and'
    .replace(/[^\w\-]+/g, '')       // Remove all non-word chars
    .replace(/\-\-+/g, '-')         // Replace multiple - with single -
    .replace(/^-+/, '')             // Trim - from start of text
    .replace(/-+$/, '')             // Trim - from end of text
}
Lucas Bustamante
źródło
1

Bardziej wydajna metoda generowania informacji o pracy w czystym JavaScript. W zasadzie obsługuje transliterację wszystkich znaków cyrylicy i wielu umlautów (niemiecki, duński, francuski, turecki, ukraiński itp.), Ale można go łatwo rozszerzyć.

function makeSlug(str)
{
  var from="а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я ā ą ä á à â å č ć ē ę ě é è ê æ ģ ğ ö ó ø ǿ ô ő ḿ ʼn ń ṕ ŕ ş ü ß ř ł đ þ ĥ ḧ ī ï í î ĵ ķ ł ņ ń ň ř š ś ť ů ú û ứ ù ü ű ū ý ÿ ž ź ż ç є ґ".split(' ');
  var to=  "a b v g d e e zh z i y k l m n o p r s t u f h ts ch sh shch # y # e yu ya a a ae a a a a c c e e e e e e e g g oe o o o o o m n n p r s ue ss r l d th h h i i i i j k l n n n r s s t u u u u u u u u y y z z z c ye g".split(' ');
	
  str = str.toLowerCase();
  
  // remove simple HTML tags
  str = str.replace(/(<[a-z0-9\-]{1,15}[\s]*>)/gi, '');
  str = str.replace(/(<\/[a-z0-9\-]{1,15}[\s]*>)/gi, '');
  str = str.replace(/(<[a-z0-9\-]{1,15}[\s]*\/>)/gi, '');
  
  str = str.replace(/^\s+|\s+$/gm,''); // trim spaces
  
  for(i=0; i<from.length; ++i)
    str = str.split(from[i]).join(to[i]);
  
  // Replace different kind of spaces with dashes
  var spaces = [/(&nbsp;|&#160;|&#32;)/gi, /(&mdash;|&ndash;|&#8209;)/gi,
     /[(_|=|\\|\,|\.|!)]+/gi, /\s/gi];

  for(i=0; i<from.length; ++i)
  	str = str.replace(spaces[i], '-');
  str = str.replace(/-{2,}/g, "-");

  // remove special chars like &amp;
  str = str.replace(/&[a-z]{2,7};/gi, '');
  str = str.replace(/&#[0-9]{1,6};/gi, '');
  str = str.replace(/&#x[0-9a-f]{1,6};/gi, '');
  
  str = str.replace(/[^a-z0-9\-]+/gmi, ""); // remove all other stuff
  str = str.replace(/^\-+|\-+$/gm,''); // trim edges
  
  return str;
};


document.getElementsByTagName('pre')[0].innerHTML = makeSlug(" <br/> &#x202A;Про&amp;вер<strong>ка_тран</strong>с…литеърьации\rюга\nи&ndash;южного&nbsp;округа\t \nс\tёжикам&#180;и&nbsp;со\\всеми&ndash;друзьями\tтоже.Danke schön!ich heiße=КáÞÿá-Skånske,København çağatay rí gé tőr zöldülésetekről - . ");
<div>
  <pre>Hello world!</pre>
</div>

anakod
źródło
1

Dla osób już korzystających lodash

Większość z tych przykładów jest naprawdę dobra i obejmuje wiele przypadków. Ale jeśli `` wiesz '', że masz tylko angielski tekst, oto moja wersja, która jest bardzo łatwa do odczytania :)

_.words(_.toLower(text)).join('-')

Frexuz
źródło
1

Cóż, po przeczytaniu odpowiedzi wymyśliłem ten.

    const generateSlug = (text) => text.toLowerCase().trim().replace(/[^\w- ]+/g, '').replace(/ /g, '-').replace(/[-]+/g, '-');
Siraj Alam
źródło
1

Uwaga: jeśli nie obchodzi Cię argument przeciwko zaakceptowanej odpowiedzi i po prostu szukasz odpowiedzi, pomiń następną sekcję, na końcu znajdziesz moją propozycję odpowiedzi

zaakceptowana odpowiedź ma kilka problemów (moim zdaniem):

1) jak w przypadku pierwszego fragmentu funkcji:

bez względu na wiele następujących po sobie białych znaków

Wejście: is it a good slug

Odebrane: ---is---it---a---good---slug---

spodziewany: is-it-a-good-slug

bez względu na wiele kolejnych myślników

Wejście: -----is-----it-----a-----good-----slug-----

Odebrane: -----is-----it-----a-----good-----slug-----

spodziewany: is-it-a-good-slug

proszę zauważyć, że ta implementacja nie obsługuje zewnętrznych myślników (lub białych znaków w tym przypadku), niezależnie od tego, czy są to wiele następujących po sobie znaków, czy pojedyncze znaki, które (o ile rozumiem informacje o ślimakach i ich użycie) są nieprawidłowe

2) jak w przypadku drugiego fragmentu funkcji:

dba o wiele kolejnych białych znaków, konwertując je na pojedyncze, -ale to nie wystarczy, ponieważ zewnętrzne (na początku i na końcu ciągu) białe spacje są obsługiwane tak samo, więc is it a good slugzwróci-is-it-a-good-slug-

usuwa również całkowicie myślniki z wejścia, które konwertuje coś podobnego --is--it--a--good--slug--'doisitagoodslug , fragment komentarza @ ryan-allen zajmuje się tym, pozostawiając problem z zewnętrznymi myślnikami nierozwiązany

teraz wiem, że nie ma standardowej definicji dla ślimaków, a zaakceptowana odpowiedź może załatwić zadanie (którego szukał użytkownik, który zamieścił pytanie), ale jest to najpopularniejsze pytanie SO dotyczące ślimaków w JS, więc te problemy trzeba było wskazać, również (jeśli chodzi o wykonanie pracy! ) Wyobraź sobie wpisywanie tego ohydnego adresu URL ( www.blog.com/posts/-----how-----to-----slugify-----a-----string-----) lub nawet przekierowanie do niego zamiast czegoś takiego jak ( www.blog.com/posts/how-to-slugify-a-string), wiem, że to skrajny przypadek, ale hej, to właśnie testy są dla.

moim zdaniem lepszym rozwiązaniem byłoby:

const slugify = str =>
  str
  .trim()                      // remove whitespaces at the start and end of string
  .toLowerCase()              
  .replace(/^-+/g, "")         // remove one or more dash at the start of the string
  .replace(/[^\w-]+/g, "-")    // convert any on-alphanumeric character to a dash
  .replace(/-+/g, "-")         // convert consecutive dashes to singuar one
  .replace(/-+$/g, "");        // remove one or more dash at the end of the string

teraz prawdopodobnie istnieje ninja RegExp, który może przekształcić to w jedno-liniowe wyrażenie, nie jestem ekspertem w RegExp i nie mówię, że jest to najlepsze lub najbardziej kompaktowe rozwiązanie lub takie o najlepszej wydajności ale miejmy nadzieję, że uda się to wykonać.

Waddah
źródło
Ma to wadę polegającą na tym, że konwersja znaków niealfanumerycznych na myślniki prawdopodobnie przywróci myślnik na początku wiersza. Ale proszę, nie rób z tego jednej wkładki. Ten jest łatwy do zrozumienia!
Timo
1
$("#Restaurant_Name").keyup(function(){
        var Text = $(this).val();
        Text = Text.toLowerCase();
        Text = Text.replace(/[^a-zA-Z0-9]+/g,'-');
        $("#Restaurant_Slug").val(Text);        
});

Ten kod działa

Deepak K. sah
źródło
Dziękuję Ci! To jest łatwiejsze w użyciu.
Jane Doe
0
//
//  jQuery Slug Plugin by Perry Trinier ([email protected])
//  MIT License: http://www.opensource.org/licenses/mit-license.php

jQuery.fn.slug = function(options) {
var settings = {
    slug: 'slug', // Class used for slug destination input and span. The span is created on $(document).ready() 
    hide: true   // Boolean - By default the slug input field is hidden, set to false to show the input field and hide the span. 
};

if(options) {
    jQuery.extend(settings, options);
}

$this = $(this);

$(document).ready( function() {
    if (settings.hide) {
        $('input.' + settings.slug).after("<span class="+settings.slug+"></span>");
        $('input.' + settings.slug).hide();
    }
});

makeSlug = function() {
        var slug = jQuery.trim($this.val()) // Trimming recommended by Brooke Dukes - http://www.thewebsitetailor.com/2008/04/jquery-slug-plugin/comment-page-1/#comment-23
                    .replace(/\s+/g,'-').replace(/[^a-zA-Z0-9\-]/g,'').toLowerCase() // See http://www.djangosnippets.org/snippets/1488/ 
                    .replace(/\-{2,}/g,'-'); // If we end up with any 'multiple hyphens', replace with just one. Temporary bugfix for input 'this & that'=>'this--that'
        $('input.' + settings.slug).val(slug);
        $('span.' + settings.slug).text(slug);

    }

$(this).keyup(makeSlug);

return $this;
    };

To pomogło mi z tym samym problemem!

Marko Ranković
źródło
0
function slugify(content) {
   return content.toLowerCase().replace(/ /g,'-').replace(/[^\w-]+/g,'');
}
// slugify('Hello World');
// this will return 'hello-world';

to działa dla mnie dobrze.

Znalazłem go w CodeSnipper

Al Quarashi
źródło
-5
private string ToSeoFriendly(string title, int maxLength) {
    var match = Regex.Match(title.ToLower(), "[\\w]+");
    StringBuilder result = new StringBuilder("");
    bool maxLengthHit = false;
    while (match.Success && !maxLengthHit) {
        if (result.Length + match.Value.Length <= maxLength) {
            result.Append(match.Value + "-");
        } else {
            maxLengthHit = true;
            // Handle a situation where there is only one word and it is greater than the max length.
            if (result.Length == 0) result.Append(match.Value.Substring(0, maxLength));
        }
        match = match.NextMatch();
    }
    // Remove trailing '-'
    if (result[result.Length - 1] == '-') result.Remove(result.Length - 1, 1);
    return result.ToString();
}

źródło