Co to jest katalog .well-known / i jak go skonfigurować?

14

W moich błędach indeksowania Narzędzi dla webmasterów mam kilka lokalizacji, do których odmówiono dostępu:

.well-known/apple-app-site-association
.well-known/assetlinks.json
.well-known/.com

Spojrzałem na RFC 5785, ale tak naprawdę go nie rozumiałem. Naprawdę mam problemy z przestrzeganiem wielu dokumentów RFC, wydaje się, że są one wypełnione wieloma niewyjaśnionymi i niejednoznacznymi terminologiami.

Jaki jest cel tego katalogu i tych trzech plików? Jaka powinna być ich zawartość? Czy powinienem się tym martwić? Czy powinienem zablokować katalog w pliku robots.txt?

To pierwszy raz, kiedy natknąłem się na ten katalog, nie sądzę, żeby istniał i nie próbowałem go zapełniać (prawdopodobnie dlatego mu odmówiono). Nie znam też żadnych linków do tego katalogu z mojej witryny.

Arth
źródło
1
Odmowa lokalizacji jest zwykle wynikiem zablokowanych zasobów w pliku robots.txt lub htaccess. Edytuj swoje pytanie i dołącz zawartość tych plików, dodatkowo ... .well-known/istnieje?
Simon Hayter
4
Naprawdę mam problemy z przestrzeganiem wielu dokumentów RFC, wydaje się, że są one wypełnione wieloma niewyjaśnionymi i niejednoznacznymi terminologiami. Nie jesteś sam! Twoje zdrowie!!
closetnoc
1
Jeśli nie podniosłem oczu, .well-known/powinienem być ukrytym katalogiem i nie być dostępny dla zewnętrznych żądań, jednak powinien być dostępny dla elementów zakodowanych po stronie serwera, takich jak programy CGI, Java i tym podobne.
closetnoc
2
Prawdopodobnie wybrał link z innej strony. To próba śmieciowego identyfikatora URI, nie martwiłbym się, gdybyś nie miał tam zasobów i ktoś o nich wiedział.
L Martin

Odpowiedzi:

12

RFC 5785 można sparafrazować:

Jeśli utworzysz nowy adres URL, taki jak robots.txt lub favicon.ico, który ma znajdować się w określonym miejscu na każdej stronie internetowej, odtąd zacznij od takiego adresu URL /.well-known/.

Ponadto zarejestrujesz wszystkie takie adresy URL w IETF, dzięki czemu będzie istniała duża centralna lista wszystkich tych adresów URL.

Rejestr wydaje się być tutaj: https://www.iana.org/assignments/well-known-uris/well-known-uris.xhtml Możesz przejrzeć rejestr, zdecydować, czy któryś z wymaganych adresów URL służy celowi, który pomógłby twojej stronie i tworzył dokumenty, jeśli byłyby przydatne.

Spośród adresów URL wymienionych w pytaniu assetlinks.jsonwydaje się, że zostały zarejestrowane poprawnie.

Zasadniczo nie ma powodu, aby tworzyć dokumenty tylko dlatego, że Google zgłasza je jako 404. Google oczekuje na błędy 404 w witrynach. Uważają nawet za oznakę dobrej strony, że adresy URL bez dokumentów zwracają poprawny status (404).

Stephen Ostermiller
źródło
1
Okay, więc aby się zastosować, technicznie mój plik robots.txt powinien zostać przeniesiony do publicznie dostępnego miejsca, www.mysite.com/.well-known/robots.txta nie tylko w nim www.mysite.com/robots.txt? Ale ostatecznie to na razie nie ma znaczenia?
Arth
7
Nie, nie poruszyłbym się robots.txt. Ten adres URL został utworzony na długo przed tym znanym edyktem i spodziewam się, że pozostanie on zapisany w swojej zwykłej lokalizacji.
Stephen Ostermiller
Fajnie, to ma sens .. dzięki za pomoc! Gdybyś mógł sparafrazować również wszystkie inne RFC, to by to puchło :)
Arth