Prawidłowy typ treści dla dokumentów XML, HTML i XHTML

123

Jakie są prawidłowe typy treści dla dokumentów XML, HTML i XHTML?

Muszę napisać prostego robota, który pobiera tylko tego typu pliki.

Obecnie http://example.net/index.html może służyć na przykład jako plik JPEG dzięki mod_rewrite, dlatego muszę sprawdzić typ zawartości z nagłówka odpowiedzi i porównać go z listą dozwolonych typów treści.

Skąd mogę wziąć taką listę?

astropaniczny
źródło
O fragmentach patrz stackoverflow.com/q/19303361/287948 i w3.org/TR/xml-fragment
Peter Krauss

Odpowiedzi:

206

HTML: text/htmlkropka.

XHTML: application/xhtml+xml, lub tylko wtedy, gdy następujące wytyczne HTML compatbility, text/html. Patrz uwaga dotycząca typów mediów W3 .

XML: text/xml, application/xml( RFC 2376 ).

Istnieje również wiele innych typów mediów opartych na XML, na przykład application/rss+xmllub image/svg+xml. Można bezpiecznie założyć, że każda nierozpoznana, ale zarejestrowana końcówka +xmlma rozszerzenie XML. Zobacz listę IANA dla zarejestrowanych typów mediów kończących się na +xml.

(W przypadku niezarejestrowanych x-typów wszystkie zakłady są wyłączone, ale masz nadzieję, +xmlże zostaną uszanowane).

bobince
źródło
32
O różnicach między text/xmli application/xmlzobacz tutaj stackoverflow.com/questions/4832357/…
sanmai
To samo dotyczy fragmentów , zobacz w3.org/TR/xml-fragment lub tę inną qustion .
Peter Krauss