Dlaczego niektóre witryny dodają „informacje o pracy” na końcu adresów URL? [Zamknięte]

111

Wiele stron internetowych, w tym ta, dodaje na końcu adresów URL coś, co najwyraźniej nazywa się ślimakami - opisowymi, ale o ile wiem, bezużyteczne fragmenty tekstu.

Na przykład adres URL podany przez witrynę w przypadku tego pytania to:

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

Ale następujący adres URL działa równie dobrze:

/programming/47427/

Czy celem tego tekstu jest tylko jakoś uczynienie adresu URL bardziej przyjaznym dla użytkownika, czy też są jakieś inne korzyści?

Dave Webb
źródło
44
ślimaki służą jako nazwa dzwoniącego adresu URL. Kiedy odbierasz telefon, znajomość nazwiska osoby nie jest konieczna, ale pomaga zdecydować, czy chcesz odebrać telefon, czy nie. Podobnie, fragment adresu URL pomaga użytkownikowi zdecydować, czy chce kliknąć łącze, i nadaje mu wewnętrzny kontekst.
Armstrongest
4
^^ +1, ale lepiej by było, gdyby Twoja odpowiedź była odpowiedzią, a nie komentarzem.
Dienekes,
pomaga w pozycjonowaniu w wynikach wyszukiwania.
Jay Smoke
stackoverflow.com/q/47427 również działa: P
Habeeb Perwad

Odpowiedzi:

166

Ślady sprawiają, że adres URL jest bardziej przyjazny dla użytkownika i wiesz, czego się spodziewać po kliknięciu łącza. Wyszukiwarki, takie jak Google, umieszczają strony wyżej w rankingu, jeśli wyszukiwane słowo znajduje się w adresie URL.

Espo
źródło
3
Jedną z rzeczy, które sprawiają, że adres URL jest przyjazny dla użytkownika, jest „możliwość odkrywania”, co oznacza, że ​​można go odgadnąć, korzystając z paska adresu. i.love.pets.com/search/cats+dogs może łatwo doprowadzić do i.love.pets.com/search/pug+puppies itp.
Xian
12
Xian, słyszałem już ten argument, ale nie sądzę, aby był on poddany analizie. Oprócz maniaków, prawie nikt tak naprawdę nie wpisuje bezpośrednio adresów URL. Czytelność jest zdecydowanie ważna i myślę, że rosnąca liczba użytkowników widzi adresy URL, ale jeśli chodzi o „zgadywanie”, uważam, że mniejszość jest niezwykle mała.
powiek
4
@eyelidlessnes - będę musiał się nie zgodzić. Chociaż ludzie mogą nie wprowadzać adresów URL ręcznie, widziałem dowody na to, że je tworzą. Patrząc na nasze logi i nasze urządzenia monitorujące, widzimy próbki, w których jedna sesja użytkownika coś zrobi, a następnie zmodyfikujemy adres URL (o czym świadczy brak strony odsyłającej). Oczywiście nie wszyscy to robią - ale na pewno nie jest to znikomy ruch.
Joseph Ferris
@Xian. Tak, niewiele typów adresów URL, jednak slug jest w zasadzie identyfikatorem dzwoniącego. Nazwisko osoby dzwoniącej nie jest KONIECZNE, ale pomaga zdecydować, czy chcesz odebrać połączenie, czy nie. informacje o błędach sprawiają, że adres URL wygląda bardziej przyjaźnie i zwiększa prawdopodobieństwo, że użytkownik go kliknie.
Armstrongest
xian, czym dokładnie różni się od google.com/search?q=cat+puppy? Osoby, które odkryją adresy URL, prawdopodobnie to zrobią. Robię to.
netrox,
39

Użyteczność jest jednym z powodów, jeśli otrzymasz ten link w swoim e-mailu, wiesz, czego się spodziewać. SEO (optymalizacja pod kątem wyszukiwarek) to kolejny powód. Wyszukiwarki takie jak Google będą pozycjonować twoją stronę wyżej pod względem słów kluczowych zawartych w adresie URL

Michiel van Oosterhout
źródło
2
Jak myślisz, dlaczego Google podjął taką decyzję? Co to zmotywowało?
Mike Clark
Czy możesz znaleźć dokumentację od Google, która wyraźnie stwierdza, że ​​będą pozycjonować stronę wyżej, jeśli słowo kluczowe jest zawarte w adresie URL?
praca łańcuchowa,
@chainwork Nie, ale istnieją setki sygnałów, które wyszukiwarka wykorzystuje do pozycjonowania stron, i możesz być pewien, że adres URL jest jednym z takich sygnałów.
Michiel van Oosterhout
2
Słowa kluczowe w adresie URL pasujące do wyszukiwania są pogrubione w wynikach Google, dzięki czemu są bardziej widoczne dla użytkowników przeprowadzających wyszukiwanie.
Chainwork
35

Niedawno zmieniłem format adresu URL mojej witryny z:

www.mywebsite.com/index.asp?view=display&postid=100

Do

www.mywebsite.com/this-is-the-title-of-the-post

i zauważyliśmy, że po zmianie współczynniki klikalności na artykuł wzrosły o około 300%. Z pewnością pomaga użytkownikowi zdecydować, czy to, w co myślą o kliknięciu, jest istotne pod względem celów SEO, chociaż muszę powiedzieć, że po zmianie widziałem niewielki wpływ

Katy
źródło
4
Mam nadzieję, że tytuły twoich postów nigdy, przenigdy się nie zmienią: wiele osób nienawidzi martwych linków i tworzących je usług internetowych.
Nikita Rybak
6
Naprawdę nie mogę zgadnąć, którego CMS lub oprogramowania do blogowania używa, ale w przypadku WordPressa i wielu podobnych, modyfikacja tytułu posta po opublikowaniu postu nie zmienia ślimaka (i dokładnie z tego powodu, o którym wspomniałeś).
Cyde Weys,
25

Zgadzam się z innymi odpowiedziami, że każdy błędnie wpisany slug powinien przekierowywać 301 do odpowiedniego formularza. Innymi słowy, /programming/47427/whpowinno przekierowywać do /programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls. Ma jeszcze jedną zaletę, o której nie wspomniano - jeśli nie przekierujesz do kanonicznego adresu URL, okaże się, że masz prawie nieskończoną liczbę zduplikowanych stron. Google nienawidzi powielania treści.

To powiedziawszy, powinieneś naprawdę dbać tylko o identyfikator treści i zezwalać na wszelkie dane wejściowe dla informacji o pracy, o ile przekierowujesz. Czemu?

/programming/47427/why-do-some-strony-dodają-ślimaki-do-końca-adresów URL

... Ups, oprogramowanie pocztowe odcięło koniec adresu URL! Nie ma jednak problemu, ponieważ nadal możesz rzucać tylko/programming/47427

Jedynym dużym problemem związanym z tym podejściem jest to, że jeśli wyprowadzisz ślimak z tytułu swojej treści, jak zamierzasz poradzić sobie z tytułami spoza ASCII, UTF-8?

Cory R. King
źródło
1
Niezły post, bardzo ważny punkt! +1 A jeśli chodzi o pytanie, „jak sobie poradzisz z tytułami innymi niż ASCII, UTF8?” Istnieją do tego algorytmy, na przykład ten, którego używa WordPress. Opublikowałbym rozwiązanie PHP dla tego konkretnego problemu, gdyby dozwolone było więcej niż 600 znaków. Jeśli naprawdę chcesz wiedzieć, dodawać je jako pytanie i będę szczęśliwy odpowiedzieć na to;)
Mathias Bynens
1
re: „prawie nieskończona liczba zduplikowanych stron” - stanie się tak tylko wtedy, gdy istnieją linki do niekanonicznego adresu URL. Jeśli zachowasz spójność w swojej witrynie, nie powinno być problemu. Twoja teoria na temat odcinania adresów URL jest trochę głupia, adres URL mógłby zostać odcięty w dowolnym miejscu, prawda? Nawet po 4742, co doprowadziłoby do innego pytania. Jeśli będziesz trzymać się tylko standardowych liter, cyfr, myślników i / lub podkreśleń w adresie URL, prawdopodobieństwo wystąpienia jest mniejsze.
DisgruntledGoat
2
Jak zasugerował DisgruntledGoat, technicznie rzecz biorąc, Google nie znalazłby żadnej zduplikowanej treści, chyba że ktoś łączyłby się ze stroną za pomocą innego ślimaka, w ten sposób oszukując pająka Google do myślenia, że ​​istnieje zduplikowana treść. Więc pająk będzie nienawidził tej strony, tak droga chłopaki;)
Austyn Mahoney
Z technicznego punktu widzenia nie musisz wykonywać przekierowania 301, jeśli umieścisz na stronie wskazówkę rel = "canonical". Niezależnie od „prawie nieskończonej liczby zduplikowanych stron” Google przyjmie jedyny prawidłowy kanoniczny adres URL. Amazon nie obsługuje 301. Spróbuj: amazon.com/lat-thinking-stragies/dp/0470942185 Jednak lepiej jest zrobić jedno i drugie. Powodem jest to, że ktoś może opublikować link z całkowicie zmodyfikowanym slugiem, a gdy widz go czyta, wygląda to inaczej niż treść - dezorientując widza.
Ethan
„Jak sobie poradzisz z tytułami bez ASCII, UTF8?” Kodujesz je procentowo. Wszystkie nowoczesne przeglądarki będą wtedy faktycznie wyświetlać Unicode w całej jego wielojęzycznej chwale na pasku adresu, ale podadzą ci adres URL zakodowany w procentach ASCII podczas kopiowania do schowka.
Stijn de Witt,
14

Powodem, dla którego używa go większość witryn, jest prawdopodobnie SEO (optymalizacja pod kątem wyszukiwarek). Yahoo dawał rozsądną wagę obecności słowa kluczowego wyszukiwania w samym adresie URL, a także pomagało w wynikach Google.

Niedawno wyszukiwarki obniżyły wagę przypisywaną słowom kluczowym w adresie URL, prawdopodobnie dlatego, że technika ta jest obecnie bardziej powszechna w witrynach spamujących niż legalna. Słowa kluczowe w adresie URL mają teraz bardzo niewielki wpływ na wyniki wyszukiwania, jeśli w ogóle.

Jeśli chodzi o sam przepływ stosów, SEO może być motywacją (stare nawyki ciężko umierają) lub po prostu użytecznością.

DGentry
źródło
SEO ma znaczenie. Ale co ważniejsze, chodzi o użyteczność, jak powiedziałeś.
Armstrongest
14

Zasadniczo jest to bardziej znacząca lokalizacja zasobu. Używanie identyfikatora jest jak najbardziej poprawne, ale oznacza więcej dla maszyn niż dla ludzi.

Ściśle mówiąc, identyfikator nie powinien być potrzebny, jeśli ślimak jest unikalny, możesz łatwiej zapewnić unikalne ślimaki, określając ich zakres wewnątrz dat.

to znaczy:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/

Zasadniczo wykorzystuje to niskie prawdopodobieństwo użycia dwóch identycznych ślimaków tego samego dnia. W przypadku kolizji ogólną konwencją jest dodanie licznika na końcu ślimaka, ale rzadko zdarza się, aby kiedykolwiek je zobaczyłeś:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-1/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-2/

Wiele algorytmów informacji o pracy usuwa również popularne słowa, takie jak „the” i „a”, aby pomóc w utrzymaniu krótkiego adresu URL. To ograniczone podejście sprawia, że ​​bardzo łatwo jest znaleźć wszystkie zasoby na dany dzień, miesiąc lub rok - wystarczy odciąć segmenty.

Ponadto adresy URL stackoverflow są złe w tym sensie, że wprowadzają dodatkowy segment w celu umieszczenia informacji o pracy, co jest naruszeniem idei, że każdy segment powinien reprezentować malejącą hierarchię zasobów.

Andrew Ingram
źródło
11

Termin ślimak pochodzi z branży gazetowej / wydawniczej. To krótki tytuł, który służy do identyfikacji trwającej historii. Osoby zainteresowane semantyką adresów URL zaczęły używać krótkiego, skróconego tytułu w swoich adresach URL. Opłaca się również w SEO, ponieważ słowa kluczowe w adresach URL dodają wagi stronie.

Jak na ironię, wiele witryn internetowych zaczęło umieszczać w swoich adresach URL pełne, zserializowane i łączone wersje tytułów w celach ściśle SEO, co oznacza, że ​​termin slug nie ma już zastosowania. To także irytuje semantycznych purystów, ponieważ wiele implementacji umieszcza tę serializowaną wersję tytułu na końcu swoich adresów URL.

Alan Storm
źródło
10

Zaznaczam, że tekst można dowolnie zmieniać. Wygląda na to, że ten adres URL działa równie dobrze.

/programming/47427/why-is-billpg-so-very-awesome

billpg
źródło
Czy to jest błąd lub funkcja?
Jakub Šturc
4
W rzeczywistości zapewnia, że ​​masz dostęp do postu nawet po zmodyfikowaniu tematu (a zatem istnieje nowy adres URL).
Dirk Vollmar
3
Idealnie byłoby jednak, gdyby każdy zasób internetowy („dokument”) miał tylko 1 identyfikator URI. Zasadniczo więc zezwolenie na przeglądanie tego samego dokumentu za pomocą różnych identyfikatorów URI może mieć negatywny wpływ na Twoją witrynę w SERP. To chyba jedyna rzecz, której nie lubię w przepełnieniu stosu;)
Mathias Bynens
3
Dlatego istnieją strony kanoniczne i używa ich Stack Overflow. =)
Alix Axel
4
@Alix Axel: 301 przekierowuje >strony kanoniczne
Mathias Bynens
6

Jak już wspomniano, „ślimak” pomaga ludziom i wyszukiwarkom ...

Warto zauważyć, że w źródle strony znajduje się kanoniczny adres URL

Zapobiega to wielokrotnemu indeksowaniu strony.

Przykład:

<link rel="canonical" href="http://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls">
Robs
źródło
3

Nie zapomnij o czytelności podczas wysyłania linku, nie tylko w wyszukiwarkach. Jeśli wyślesz komuś e-mail z pierwszym linkiem, może on spojrzeć na adres URL i uzyskać ogólne pojęcie o tym, o czym jest. Druga nie zawiera informacji o zawartości tej strony przed kliknięciem.

Chris Bartow
źródło
2

Gdybyś wysłał komuś link e-mailem, czy nie miałoby sensu dołączenie opisu przez faktyczne wypisanie opisu, zamiast zmuszania drugiej osoby do przeanalizowania adresu URL, w którym istnieje opis, i spróbowania-przeczytania kilku -złączone-słowa-sklejone-razem.

Kibbee
źródło
Oczywiście nigdy nie byłeś Rickiem Rollem, prawda? Ile otrzymałeś linków: Sprawdź to. Wesoły! <link>. Byłoby miło, gdyby YouTube zrobił takie adresy URL: youtube.com/12345/evil-bikini-wax-job-not-work-safe. Dzięki temu linki byłyby bardziej wiarygodne i pomogłyby mi w podjęciu decyzji o kliknięciu lub nie.
Armstrongest
1
Jednak każdy system MVC, jaki widziałem, nie wymagałby dodatkowej części zła-bikini-wosk-praca-nie-bezpieczna praca i mógłby być równie łatwo wysłany jako youtube.com/12345, a większość ludzi kto chciał wysyłać takie rzeczy, szybko nauczyłby się je usuwać.
Kibbee
2

Po pierwsze, jest to SEO i przyjazne dla użytkownika, ale w przypadku przykładu (tej strony) nie jest to zrobione dobrze lub poprawnie (ponieważ jest podatne na sztuczki czarnego kapelusza i zatruwanie rangi przez innych, co źle by odbiło się na tej stronie) .

Jeśli

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

zawiera treść

/programming/47427/

i

/programming/47427/any-other-bollix

nie powinny być duplikatami. Powinni faktycznie automatycznie wykryć, że śledzony link nie używa bieżącego tekstu (ponieważ oczywiście slug jest zdefiniowany przez tytuł pytania i może być później edytowany) i powinni automatycznie przekierować 301 do

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

zapewniając w ten sposób regułę „jeden fragment treści do jednego identyfikatora URI”, a jeśli URI się poruszy / zmieni, upewnij się, że stare zakładki podążają za nim / przenoszą się z nim przez przekierowania 301 (aby inteligentne przeglądarki mogły aktualizować zakładki).

Alan Doherty
źródło
1
Wyświetl źródło strony, a znajdziesz to: <link rel = "canonical" href = " stackoverflow.com/questions/47427/… "> Zobacz: tutaj: googlewebmastercentral.blogspot.com/2009/02/…
Armstrongest
0

W idealnym przypadku „ślimak” powinien być jedynym wymaganym identyfikatorem. W praktyce w dynamicznych witrynach, takich jak ta, musisz albo mieć unikalny identyfikator liczbowy, albo zacząć dodawać / zwiększać liczby do „slugu”, jak robi to Digg.

Kyle Cronin
źródło
1
Link Digg był pierwszym, na który natknąłem się przechodząc w dół strony głównej. To czysty przypadek, że tak się składa, że ​​jest to przykład tego, jak daleko spadł Digg - trzykrotnie opublikowano historię o uzależnieniu od seksu.
Kyle Cronin