Jakie są prawidłowe typy treści dla dokumentów XML, HTML i XHTML?
Muszę napisać prostego robota, który pobiera tylko tego typu pliki.
Obecnie http://example.net/index.html może służyć na przykład jako plik JPEG dzięki mod_rewrite, dlatego muszę sprawdzić typ zawartości z nagłówka odpowiedzi i porównać go z listą dozwolonych typów treści.
Skąd mogę wziąć taką listę?
Odpowiedzi:
HTML:
text/html
kropka.XHTML:
application/xhtml+xml
, lub tylko wtedy, gdy następujące wytyczne HTML compatbility,text/html
. Patrz uwaga dotycząca typów mediów W3 .XML:
text/xml
,application/xml
( RFC 2376 ).Istnieje również wiele innych typów mediów opartych na XML, na przykład
application/rss+xml
lubimage/svg+xml
. Można bezpiecznie założyć, że każda nierozpoznana, ale zarejestrowana końcówka+xml
ma rozszerzenie XML. Zobacz listę IANA dla zarejestrowanych typów mediów kończących się na+xml
.(W przypadku niezarejestrowanych
x-
typów wszystkie zakłady są wyłączone, ale masz nadzieję,+xml
że zostaną uszanowane).źródło
text/xml
iapplication/xml
zobacz tutaj stackoverflow.com/questions/4832357/…