Pracuję nad witryną, która będzie oferować zlokalizowane treści zgodnie z language+region
podejściem opisanym na tej stronie W3.org (np. W fr-CA
przypadku treści z kanadyjskiego francuskiego i fr-FR
„francusko-francuskiego”). Ponieważ uważamy, że treść każdego language+region
z nich jest unikalna, kluczowe jest dla nas, aby wyszukiwarki odpowiednio identyfikowały i odpowiednio je wyświetlały.
Patrząc w Internecie (np. Na to pytanie ), wydaje się, że większość ludzi zaleca użycie kodu języka ISO639 w lang
atrybucie HTML do opisu języka treści. Zgodnie z tym zaleceniem zdecydowalibyśmy się na użycie, <html lang="fr">
które nie umożliwiłoby rozróżnienia między wyżej wymienionymi language+region
kombinacjami.
Podczas przeglądania specyfikacji HTML4 wydaje się, że użycie language+region
jako kodu języka byłoby całkowicie OK, ponieważ en-US
przykład podano jako jedną z możliwych wartości. Jednak nie znalazłem żadnego potwierdzenia tego w specyfikacji HTML5, która nie wydaje się dawać żadnego przykładu co do możliwych dozwolonych wartości.
Stamtąd próbowałem uzyskać de facto odpowiedź, patrząc na to, co robią giganci sieci. Patrzyłem na to, co robią Facebook: oferują wersje Candian French i French French ze swoimi (nieco) różnymi treściami, podczas gdy lang
wartość HTML pozostaje taka sama:
fr-CA
URL: http://fr-ca.facebook.com
Atrybut <html lang="fr">
języka HTML: tłumaczenie słowa „email”:courriel
fr-FR
URL: http://fr-fr.facebook.com/
Atrybut lang HTML: <html lang="fr">
tłumaczenie słowa „email”:Adresse électronique
Jaki jest zalecany / standardowy sposób opisywania treści zlokalizowanych przy użyciu language+region
metody HTML5?