Obrazy zakodowane w standardzie Base64 i dostępność ich metadanych dla Googlebota

9

Jeśli osadzę obraz na stronie jako img- srcz identyfikatorem URI danych base64, czy metadane obrazu (EXIF, IPTC, XMP) są nadal dostępne dla imagebota Google?

Evgeniy
źródło
1
Prawdopodobnie nie. Googlebot prawdopodobnie potrzebuje adresu URL, do którego może rankingować i polecać użytkowników.
John Conde
1
Zapomnij o danych EXIF, nie jestem nawet pewien, czy obrazy Google indeksowałyby nawet obraz, który nie ma własnego adresu URL.
Stephen Ostermiller
@StephenOstermiller: oto pytanie: czy indeksuje takie obrazy, więc też odczytuje EXIF
Evgeniy
@ Evgeniy Jak zauważa Stephen, identyfikatory URI danych nie są oddzielone od ich zawierających dokumentów (zobacz to więcej). Wyszukiwarki indeksują adresy URL, więc indeksowany będzie tylko dokument zawierający, a to, czy indeksowałyby metadane zawarte w identyfikatorze URI danych (o ile rzeczywiście je zawierały, czyniąc je jeszcze większym, jest niemym punktem). W celu potwierdzenia możesz użyć wyszukiwarki kodu źródłowego, aby wyszukać identyfikator URI danych, a następnie sprawdzić, czy ten obraz został zindeksowany i zawiera informacje EXIF ​​w Google. Wydaje się to jednak mało prawdopodobne.
dan
@Evgeniy Pamiętaj, że zamieszczanie tego samego pytania w więcej niż jednej witrynie Stack Exchange nie jest dozwolone.
dan

Odpowiedzi:

6

Google nie indeksuje obrazów URI danych dla wyszukiwania grafiki Google. John Mueller z Google mówi to tutaj i w komentarzach poniżej. Ponieważ obrazy URI danych nie są indeksowane w wyszukiwaniu obrazów Google, dane EXIF ​​w nich nie mają znaczenia.

Możesz sprawdzić, czy te obrazy nie są indeksowane. Przeszukałem obrazy Google pod kątem „danych uri” i natychmiast sprawdziłem wyniki. Wszystkie obrazy, które przeglądałem, były plikami obrazów, a nie kodem URI obrazu zakodowanego w standardzie base64. Można by pomyśleć, że gdyby Google był w stanie zindeksować obrazy URI danych, niektóre z nich pojawiłyby się w wynikach wyszukiwania tego terminu.

Jeśli Google kiedykolwiek zdecyduje się zaindeksować obrazy URI danych, powinien mieć możliwość uzyskania z nich danych EXIF. Dane uri to cały plik zakodowany w formacie base64 (bez spacji i nowych wierszy) z data:image/png;base64,prefiksem. Wszelkie metadane w pliku nadal będą obecne w wersji identyfikatora URI danych zakodowanych w standardzie base64.

Używam obrazów URI danych na jednej z moich stron internetowych. Robię to, ponieważ użytkownicy zazwyczaj przeglądają tylko jedną stronę w witrynie, aby uzyskać wszystkie potrzebne informacje. Dołączenie wszystkich danych CSS, JS i danych obrazu bezpośrednio na stronie znacznie poprawia wydajność. Wszystkie obrazy są małe, więc technika działa szczególnie dobrze.

Moja witryna otrzymuje spory ruch z przeglądarki Internet Explorer 7 i wcześniejszych, które nie obsługują obrazów URI danych. Dlatego muszę im służyć warunkowo. Mam również obrazy na serwerze i wybieram regularne adresy URL obrazów lub URI danych na podstawie User-Agentnagłówka. Boty (w tym Googlebot) traktuję tak samo jak IE 7, tzn. Obsługuję obrazy jako adresy URL HTTP. Robię to, ponieważ dołączenie danych uri danych dramatycznie zwiększa rozmiar strony. Większość botów nie musi pobierać obrazów, więc jest dla nich bardziej wydajna. Zauważyłem również, że Narzędzia Google dla webmasterów zgłosiły, że Googlebot indeksuje moją witrynę znacznie wolniej z włączonymi dla niej obrazami URI danych. Technicznie można to uznać za maskowanie, ale byłoby to sposobem na indeksowanie obrazów URI danych.

Stephen Ostermiller
źródło
2
Twój pierwszy przykład jest indeksowany pod tym adresem URL: photos.topicshow.com/…, a drugi pod tym adresem: images5.fanpop.com/image/photos/30600000/... We wszystkich przypadkach, które mogłem znaleźć, istnieje adres URL http dla obrazu także.
Stephen Ostermiller
1
Łańcuch @StephenOstermiller może zawierać spacje: goo.gl/RF8r07 . wypełnię obraz EXIF, zakoduję go, opublikuję i zobaczę, czy przejdzie do indeksu.
Evgeniy
3
John Mueller (z Google) wskazuje tutaj, że Google zasadniczo nie indeksuje obrazów z identyfikatorów URI danych. Wiele narzędzi internetowych używanych do ich kodowania usuwa również metadane, więc tak naprawdę zależy to od tego, w jaki sposób są one zakodowane pod kątem utrzymania informacji EXIF ​​... ale biorąc pod uwagę, że i tak nie są indeksowane, jest to kwestia sporna. Poinformuj nas o swoich wynikach (pamiętaj, aby nie zaindeksować adresu URL obrazu - Google używa również rozpoznawania obrazu, aby można było użyć informacji EXIF ​​z dopasowanych obrazów).
dan
1
@dan dziękuję! Twój link do odpowiedzi Johna Muellera usuwa wiele rzeczy naraz! Jeśli G nie indeksuje obrazów, w których nie może uzyskać identyfikatora URI, nie trzeba się zastanawiać, czy EXIF ​​jest w środku, czy nie.
Evgeniy
3
Jak wspomniano powyżej, obecnie nie indeksujemy ich osobno jako obrazów. To może się zmienić w przyszłości, ale przynajmniej na chwilę, gdy chcesz użyć osobnych adresów URL obrazów, jeśli chcesz, aby te obrazy były indeksowane w Wyszukiwarce obrazów.
John Mueller
2

Chociaż Google używa obrazów jako identyfikatorów URI danych zakodowanych w standardzie base64 na swoim serwerze SERP, nie indeksuje takich obrazów na innych stronach internetowych. Dzięki @dan, który wskazał mi dyskusję w Grupach dyskusyjnych Google, gdzie John Mueller wyjaśnia ten problem . Oznacza to również, że pytanie o istnienie danych EXIF ​​w takich obrazach nie jest istotne.

To wyjaśnienie wyjaśnia, do których obrazów lepiej zastosować tę technikę optymalizacji wydajności: małe obrazy, takie jak ikony, ikony i ikony, oraz te, które nie zapewniają żadnej dodatkowej wartości dla zawartości witryny.

Z drugiej strony, jeśli kategorycznie należy osadzić obraz Z dodatkową wartością treści jako URI danych zakodowanych w standardzie base64, jedyną najlepszą praktyką do dostarczania metadanych obrazu jest użycie znaczników Schema.org, gdzie można negocjować dane EXIF, np. Z tym rodzaj znaczników.

Inny obiecujący rodzaj znaczników do negocjowania danych wyglądających jak „właściwość: wartość”, podobnie jak EXIF, ma w tej chwili status propozycji. Ale ten artykuł z bloga Google pokazuje ustrukturyzowane fragmenty, które można wygenerować na podstawie propozycji znaczników, do której odsyłam powyżej.

Evgeniy
źródło