streszczenie
Jeśli Twój serwer rozdziela strony z ligaturami (jak robią to smartypants), wyszukiwarki są niespójne. Bing obecnie nie indeksuje prawidłowo ligatur. Powiedziałbym ogólnie, że prosi o kłopoty. Ponieważ wyszukiwarki się zmieniają, poniżej znajduje się metoda, za pomocą której można przetestować, w jaki sposób wyszukiwarki są zainteresowane ligaturami indeksu .
Jeśli naczynia serwera strony za pomocą zwykłego tekstu, następnie Javascript zamienia je w ligatur, że jest w porządku . Wyszukiwarki nie stosują zmian treści Javascript przed zaindeksowaniem stron (chociaż twierdzi się, że istnieje kilka wyjątków, takich jak ładowanie komentarzy na Facebooku ). Ponieważ istnieje standardowa w branży metoda dostarczania dynamicznej treści dla wyszukiwarek i ta metoda jest zatwierdzona przez Google , byłoby wielką niespodzianką, gdyby zmieniła się w przyszłości. Google zaleca przeglądanie Twojej witryny przy użyciu przeglądarki zwykłego tekstu (np. Sugerują Lynx ), aby zobaczyć twoją treść, jak widzi to wyszukiwarka.
Więcej szczegółów na temat pierwszego przypadku (strony wyparte ligaturami w kodzie) ...
W teorii
... nie powinno to mieć żadnego wpływu na dobrze skonfigurowaną wyszukiwarkę.
Po pierwsze pomaga zrozumieć różnicę między glifami a postaciami . Ligatura fi
to jeden glif, który oznacza dwie postacie f
i
. Jak oprogramowanie traktuje to zależy od tego oprogramowania i zależy od kontekstu i wykonywanego zadania - z przykładów w tym powiązanym pytaniu zobaczysz, że po skopiowaniu i wklejeniu glifów, to, co zostanie wklejone, będzie się różnić: czasami glif jest wklejany, czasem glif jest traktowany jako powiązane z nim znaki f
i i
jest wklejany.
Każdy dobrze wykonany automatyczny procesor tekstu, który jest zainteresowany semantyką tekstu (wyszukiwarki, sprawdzanie pisowni, czytniki ekranu ...) powinien traktować glif jako identyczny ze znakami, które reprezentuje, i powinien traktować finally
jako identyczny finally
, ponieważ jest to tekst znaczenie fi
glifu.
W praktyce
Nie wszystko jest dobrze wykonane ...
Oto prosty sposób na przetestowanie wyszukiwarek. Oto wiersz tekstu z tego drugiego pytania:
Copy the ligature fi from Illustrator to this input box
Jeśli weźmiemy wersję tego zdania niebędącą ligaturami i wyszukamy ją w cudzysłowie:
(szukam dalej "Copy the ligature fi from Illustrator to this input box"
):
- ... jeśli wyszukiwarka traktuje glify ligatur jako pasujące do znaków, które reprezentują, znajdzie tę stronę (a po zaindeksowaniu - tę)
- ... jeśli wyszukiwarka traktuje glify ligatur jako inne niż znaki, które reprezentują, nie znajdzie niczego, dopóki strona nie zostanie zindeksowana, to znajdzie tylko tę stronę, a wyszukiwania w wersji ligaturowej znajdą tę stronę.
- ... jeśli wyszukiwarka wariuje na widok glifów takich jak ligatury, nie znajdzie niczego, nawet tej strony, a wyszukiwania z wersją ligatur również nie znajdą
Kilka szybkich wyników dla 5 najlepszych wyszukiwarek na świecie (linki do wyników wyszukiwania):
- Google: Dobry (typ 1) . (pomimo poniższego komentarza dobrze radzi sobie z formatowaniem encji Unicode lub HTML)
- Bing: Niepowodzenie ( typ 2 ).
- Yahoo: Fail ( typ 2 ) (okazuje się, że Yahoo to „Powered by Bing”)
- Yandex (rosyjski): Dobry (typ 1)
- Baidu (chiński): erm, strony graphicdesign.stackexchange.com wydają się w ogóle pojawiać w wyszukiwaniach Baidu ... może zostaliśmy tam zbanowani ...?!
f
i
odpowiednik bez żadnych problemów. Google wydaje się dobrze sobie radzić - ale niespójność między różnymi wyszukiwarkami jest (przynajmniej w mojej książce) przełomem.W oparciu o jeden przykład na żywo, który widziałem, byłbym bardzo zaniepokojony szerokim wykorzystaniem tego, ponieważ wpłynie to na SEO. Znaki specjalne są analizowane jako Unicode, aby algorytm Google go nie odczytał. Powinien być odpowiedni do oszczędzania, ale nie oszalałbym na tym ani nie używałbym go do niczego ważnego, takiego jak tytuł.
Oto link do przykładu na żywo, na który patrzyłem: http://pages.cs.wisc.edu/~wolfson/ligatures.html
źródło
l
i
f
i
itp. (Zobacz, jak je pogrubiono w podglądzie). Ale zdecydowanie nie chciałbym nigdy na tym polegać ...