6 Les types de donnÚes HTML fondamentaux

Sommaire

  1. Information de casse
  2. Types SGML fondamentaux
  3. Chaänes de texte
  4. URLs
  5. Couleurs
    1. Notes sur l'utilisation des couleurs
  6. Longueurs
  7. Types de contenu Content types (types MIME)
  8. Language codes
  9. Encodages de caract¶re
  10. Caract¶re unique
  11. Dates et heures
  12. Types de lien
  13. Descripteurs de mÚdia
  14. DonnÚe script
  15. Noms de cible pour Frames

Cette section de la spÚcification dÚcrit les types de donnÚes fondamentaux qui peuvent apparaätre comme un contenu d'ÚlÚment ou une valeur d'attribut.

Consultez le manuel SGML, pour obtenir une information prÚliminaire sur la lecture d'une DTD HTML.

6.1 Information de casse

Chaque dÚfinition d'attribut inclut l'information à propos de la sensibilitÚ Ã la casse de ses valeurs. L'information de casse est prÚsentÚ avec les clÚs suivantes :

CS
La valeur est sensible à la casse (i.e., les clients interprÆtent "a" et "A" diffÚremment).
CI
La valeur est non sensible à la casse (i.e., les clients interprÆtent "a" et "A" de la mÆme mani¶re).
CN
La valeur n'est pas sujette au changement de casse, e.g., parce-que c'est un nombre ou un caract¶re de la table des caract¶res du document.
CA
La dÚfinition de l'ÚlÚement ou de l'attribut donne lui mÆme l'information sur la casse.
CT
Consultez la dÚfinition du type pour obtenir des dÚtails sur la sensibilitÚ Ã la casse.

Si une valeur d'attribut est une liste, les clÚs s'appliquent à toutes les valeurs de la liste, à moins d'un indication contraire.

6.2 Types SGML fondamentaux

La dÚclaration de document type spÚcifie la syntaxe du contenu de l'ÚlÚment HTML et des valeurs d'attribut en utilisant les jetons SGML suivants (e.g., PCDATA, CDATA, NAME, ID, etc.). L'information à propos de la signification sur ces jetons et comment les clients devraient les interprÚter peut Ætre trouvÚ dans [GOLD90].

Voici un rÚsumÚ des informations clÚs :

6.3 Chaänes de texte

Un nombre d'attributs (%Text; dans la DTD) signifie que le texte est "lisible par l'humain". Pour une introduction à propos des attributs, consultez le manuel à propos des attributs.

6.4 URLs

Cette spÚcification utilise le terme URL pour le terme gÚnÚrique d'identificateurs de ressource appelÚs "URI" dans [RFC1630], incluant le terme "URL" comme dÚfini dans [RFC1738] et [RFC1808], et le terme "URN" comme dÚfini dans [RFC2141].

Les URLs sont reprÚsentÚs dans la DTD par l'entitÚ param¶tre %URL.

Les URLs en gÚnÚral sont sensibles à la casse. Il existe des URLs, ou des parties d'URLs, oÿ la casse importe peu (e.g., les noms de machines), mais dÚterminer ceci peut ne pas Ætre facile. Les utilisateurs devraient toujours considÚrer que les URLs sont sensibles à la casse.

Les URLs relatifs sont ramenÚes à des URLs complets utilisant un URL de base. [RFC1808] dÚfinit l'algorithme normatif de ce procÚdÚ. Pour obtenir des informations à propos des URLs de base, consultez la section sur les URLs de base dans le chapitre sur les liens.

Consultez l'appendice, pour obtenir de l'information à propos de l'Úcriture des caract¶res non-ASCII dans les URLs.

6.5 Couleurs

La valeur d'attribut de type "color" (%Color) se rÚferre aux dÚfinitions des couleurs comme spÚcifiÚ dans [SRGB]. Une valeur de couleur peut Ætre un nombre hexadÚcimal (prÚcÚdÚ d'un di¶se) ou d'un des 16 noms de couleurs suivants. Les noms des couleurs sont insensibles à la casse.

Nom des couleurs et valeurs sRGB
Black = "#000000" Green = "#008000"
Silver = "#C0C0C0" Lime = "#00FF00"
Gray = "#808080" Olive = "#808000"
White = "#FFFFFF" Yellow = "#FFFF00"
Maroon = "#800000" Navy = "#000080"
Red = "#FF0000" Blue = "#0000FF"
Purple = "#800080" Teal = "#008080"
Fuchsia = "#FF00FF" Aqua = "#00FFFF"

Donc, les valeurs de couleur "#800080" et "Purple" se rÚferre toutes deux à la couleur violette.

6.5.1 Notes sur l'utilisation des couleurs

Bien que les couleurs peuvent Ætre un artifice signifcatif d'ajout d'informations à un document et rendre celui-ci plus lisible, considÚrez les r¶gles suivantes quand vous utilisez des couleurs dans vos documents :

6.6 Longueurs

HTML spÚcifie trois type de valeurs de longueur pour les attributs :

  1. Pixel : La valeur (%Pixels dans la DTD) est un entier qui reprÚsente le nombre de pixels du support (Úcran, papier). Ainsi, la valeur "50" signifie cinquante pixels. Pour obtenir des informations à propos de la norme dÚfinissant le pixel, consultez [CSS1].
  2. Length : La valeur (%Length dans la DTD) peut Ætre un %Pixel; ou un pourcentage de l'espace horizontal ou vertical disponible. Ainsi, la valeur "50%" signifie la moitiÚ de l'espace disponible.
  3. MultiLength: La valeur (%MultiLength dans la DTD) peut Ætre une %Length; ou une longueur relative. Une longueur relative a la forme "i*", oÿ "i" est un entier. Quand l'espace allouÚ est partagÚ par plusieurs ÚlÚments rÚclamant cet espace, les clients fixent les longueurs en pixel et pourcentage en premier, et divise le reste de l'espace restant en longueurs relatives. Chaque longueur relative reÙoit une portion de l'espace disponible qui est proportionnel à l'entier prÚcÚdent le "*". La valeur "*" est Úquivalente à "1*". Ainsi, is 60 pixels d'espaces sont disponibles apr¶s que le client ait allouÚ l'espace en pixel et pourcentage et les longueurs relatives en concurrence Útant 1*, 2*, et 3*, le 1* sera fixÚ Ã 10 pixels, le 2* sera fixÚ Ã 20 pixels, et le 3* sera fixÚ Ã 30 pixels.

Les valeurs de longueur sont neutres à la casse

6.7 Types de contenu (Types MIME)

Note. Un type mÚdia (dÚfini dans [RFC2045] et dans [RFC2046]) spÚcifie la nature d'une ressource liÚ. Cette spÚcification emploie le terme content type plutút que type mÚdia par respect des usages courants.

Ce type est reprÚsentÚ dans la DTD par %ContentType.

Les types de contenus sont insensibles à la casse.

Les exemples de types de contenus comprennent "text/html", "image/png", "image/gif", "video/mpeg", "audio/basic", "text/tcl", "text/javascript", et "text/vbscript". Pour la liste actuelle des types MIME, consultez [MIMETYPES].

Note. Le type de contenu "text/css", bien que non enregistrÚ par IANA, devrait Ætre utiliser quand la ressource liÚe est une feuille de style [CSS1].

6.8 Codes de langue

La valeur des attributs dont le type est un code de langue (%LanguageCode dans la DTD) se rÚferre à unn code de langue tel que spÚcifiÚ par [RFC1766]. Pour obtenir des informations à propos des codes de langue en HTML, consultez la section sur les codes de langue. Les espaces ne sont pas permis au sein du code de langue.

6.9 Encodage des caract¶res

Les attributs "charset" (%Charset dans la DTD) se rÚferre à un encodage de caract¶re tel que dÚcrit dans la section sur l'encodage de caract¶re. Les valeurs doivent Ætre des chaänes de caract¶res (e.g., "euc-jp") tirÚ du registre IANA (voir [CHARSETS] pour une liste compl¶te). Les noms pour l'encodage des caract¶res sont insensibles à la casse.

Les clients doivent suivre les Útapes spÚcifiÚ dans cette section afin de choisir l'encodage des caract¶res afin de dÚterminer l'encodage des caract¶res d'une ressource externe.

6.10 Caract¶res uniques

Parfois les attributs appelle un caract¶re unique de la table des caract¶res du document. Ces attributs prennent le type %Character dans la DTD.

Les caract¶res uniques peuvent Ætre spÚcifiÚs avec les caract¶res rÚfÚrences (e.g., "&").

6.11 Dates et heures

[ISO8601] permet beaucoup de variationbs dans la reprÚsentation des dates et des heures. La spÚcification actuelle utilise l'un de ces formats dÚcrits dans le profil [DATETIME] pour la dÚfinition des chaänes lÚgales de date/heure (%Datetime dans la DTD).

Le format est :

  YYYY-MM-DDThh:mm:ssTZD
where:
     YYYY = annÚe sur 4 chiffres
     MM   = mois sur 2 chiffres (01=Janvier, etc.)
     DD   = jour du mois sur 2 chiffres (01 Ã 31)
     hh   = heure sur 2 chiffres (00 Ã 23) (am/pm non autorisÚ)
     mm   = minute sur 2 chiffres (00 Ã 59)
     ss   = seconde sur 2 chiffres (00 Ã 59)
     TZD  = indicateur de fuseau horaire (Time Zone Designator)

L'indicateur de fuseau horaire est un de ceux-ci :

Z
indique UTC (Temps Universel CoordonnÚ). Le "Z" doit Ætre en majuscule.
+hh:mm
indique que l'heure est l'heure locale avec hh heures et mm minutes avant UTC.
-hh:mm
indique que l'heure est l'heure locale avec hh heures et mm minutes apr¶s UTC.

Les composantes exposÚs doivent Ætre prÚsente exactement avec cette Úcriture et ponctuation. Notez que le "T" apparait littÚralement dans la chaäne (il doit Ætre en majuscule), afin d"indiquer le dÚbut de l'ÚlÚment temps, comme spÚcifiÚ dans [ISO8601]

Si une application de gÚnÚration ne connait pas l'heure au niveau des secondes, elle peut utiliser la valeur "00" pour les secondes (et minutes et heures si nÚcessaires).

Note. [DATETIME] ne rÚsoud pas les secondes de rattrapage.

6.12 Types de liens

Les auteurs peuvent utiliser les types de liens suivants reconnus, listÚs ici avec leur interprÚtation conventionnelle. Ceux ci sont dÚfinis comme Útant non sensible à la casse, i.e., "Alternate" à la mÆme signification que "alternate". Dans la DTD, %LinkTypes se rÚferre à une liste de types de liens sÚparÚs par des espaces. Les espaces ne sont pas permis au sein des types de lien.

Les clients, les moteurs de recherche, etc. peuvent traiter les types de liens dans une grande variÚtÚ d'interprÚtation. Par exemple, les clients peuvent fournir un acc¶s à des documents liÚs à travers une barre de navigation.

Alternate
DÚsigne des versions de substitution pour le document dans lequel le lien est prÚsent. Quand celui-ci est utilisÚ avec l'attribut lang, cela implique une version traduite du document . Lorsqu'il est utilisÚ avec l'attribut media cela implique une version spÚcifique pour un mÚdium particuler (ou un mÚdia).
Stylesheet
RÚfÚrence à une feuille de style externe. Voir la section sur les feuilles de style externe pour les dÚtails. ceci est utilisÚ avec le type de lien "Alternate" afin de dÚfinir des feuilles de style alternative pour l'utilisateur.
Start
RÚfÚrence au document de dÚpart d'une collection de documents. Ce type de lien indique à un moteur de recherche quel document est considÚrÚ par l'auteur comme le point de dÚpart de l'ensemble des documents.
Next
RÚfÚrence au prochain document dans une sÚquence linÚaire de documents. Les clients peuvent choisir de prÚcharger le document "suivant" (next), afin de rÚduire le temps de chargement apparent.
Prev
RÚfÚrence au document prÚcÚdent dans une sÚrie ordonnÚe de documents. certains clients admettent Úgalement le synonyme Previous.
Contents
RÚfÚrence à un document faisant fonction de sommaire. Certains clients admettent Úgalement le synonyme ToC ( de "Table of Contents").
Index
RÚfÚrence à un document fournissant un index du document courant.
Glossary
RÚfÚrence à un document fournissant un glossaire des termes relatifs au document courant.
Copyright
RRÚfÚrence à un document fournissant un avertissement de copyright pour le document courant.
Chapter
RÚfÚrence à un document servant de chapitre pour le document courant.
Section
RÚfÚrence à un document utilisÚ comme section dans un ensemble de documents.
Subsection
RÚfÚrence à un document utilisÚ comme sous-section dans un ensemble de documents.
Appendix
RÚfÚrence à un document utilisÚ comme appendice dans un ensemble de documents.
Help
RÚfÚrence à un document offrant une aide (plus d'information, liens vers d'autres sources d'informations, etc.)
Bookmark
RÚfÚrence à signet. Un signet est un lien qui est un point d'entrÚe dans un document à l'intÚrieur d'un document Útendu. L'attribut title peut Ætre utilisÚ, par exemple, pour nommer le signet. Noter que plusieurs signets peuvent Ætre dÚfinis dans chaque document.

Les auteurs peuvent souhaiter dÚfinir des types de liens additionnels non dÚfinis par la spÚcification. S'ils le font, ils devraient utiliser un profil pour annoncer les conventions utilisÚes pour dÚfinir les types de liens. Voir l'attribut profile de l'ÚlÚment HEAD pour plus de dÚtails.

A propos des discussions sur les types de liens, consulter la section sur les liens dans les documents HTML.

6.13 Descripteurs de Media

Voici la liste des descripteurs de media reconnu (%MediaDesc dans la DTD).

screen
PrÚvu tout d'abord pour les Úcrans non paginÚs, mais Úgalement applicables pour les prÚsentations projetÚes et imprimÚes.
tty
PrÚvu tout d'abord pour une grille de caract¶res à chasse fixe, comme les fax, terminaux, ou instruments portables avec des capacitÚs d'affichage limitÚ.
tv
PrÚvu pour les appareils de type tÚlÚvision (faible rÚsolution, couleur, dÚfilement limitÚ).
projection
PrÚvu pour les projecteurs.
handheld
PrÚvu pour les agendas Úlectroniques personnels (petit Úcran, monochrome, graphique bitmap, bande passante limitÚe).
print
PrÚvu pour le matÚriel paginÚ, opaque et pour les documents vu sur un Úcran en mode "aperÙu avant impression".
braille
PrÚvu pour les appareils à fonction braille.
aural
PrÚvu pour les synthÚtiseurs vocaux.
all
Valables pour tout appareil.

Les versions futures de HTML peuvent introduire de nouvelles valeurs et peuvent permettrent des valeurs paramÚtrÚes. Pour faciliter l'introduction de ces extensions, les clients se conformant à cette spÚcification doivent Ætre capable de traiter la valeur d'attribut media comme suit :

  1. les caract¶res virgules (Unicode decimal 44) sont utilisÚs pour sÚparer la valeur de l'attribut media dans une liste d'entrÚe, e.g. :
    media="screen, 3d-glasses, print and resolution > 90dpi"
    

    est compris de cette mani¶re :

    "screen"
    "3d-glasses"
    "print and resolution > 90dpi"
    
  2. Chaque entrÚe est tronquÚe juste avant le premier caract¶re qui n'est pas une lettre ASCII US [a-zA-Z] (Unicode decimal 65-90, 97-122), un chiffre [0-9] (Unicode hex 30-39), ou un tiret (45). Dans l'exemple cela donne :
    "screen"
    "3d-glasses"
    "print"
    
  3. Une corrÚlation sensible à la casse est alors Útablie avec l'ensemble des types de mÚdia dÚfini au-dessus. Les clients peuvent ignorer les entrÚes qui ne correspondent pas. Dans l'exemple, nous acons laissÚ screen et print.

Note. Les feuilles de styles peuvent contenir en leurs seins des variations dÚpendantes du mÚdia (e.g., la construction du @media CSS). Dans certains casn il peut Ætre appropriÚ d'utiliser "media=all".

6.14 DonnÚes script

Le contenu de l'ÚlÚment SCRIPT et la valeur des attributs ÚvÚnements intrins¶ques sont des donnÚes script (indiquÚ par le %Script; dans la DTD). Ces donnÚes ne doivent pas Ætre ÚvaluÚes par le client comme descripteur HTML. Le client doit passer les donnÚes telle quelles à interprÆteur de script. La sensibilitÚ Ã la casse est dÚpendant du langage de scripting.

Les lecteurs HTML doivent Ætre capable de reconnaätre les donnÚes script d¶s la balise de dÚbut et se terminer d¶s que les dÚlimiteurs ETAGO ("</") sont suivis un caract¶re ([a-zA-Z]). Les donnÚes scripts ne se termine pas nÚcessairement avec la balise de fin </SCRIPT> mais sont terminÚes par "</" suivi par un caract¶re.

Par consÚquent, tout descripteur HTML qui est envoyÚ par le moteur de scripting (qui fait ce qu'il veut avec le descripteur) doit Ætre "escaped" afin de ne pas pertuber le lecteur HTML. Les concepteurs de chauqe langage de scripting devraient recommander un support spÚcifique en fonction du langage afin de rÚsoudre ce probl¶me.

EXEMPLE ILLEGAL :
Le code suivant est invalide dõ Ã la prÚsence des caract¶res "</" prÚsents, comme une partie de "</EM>", Ã l'intÚrieur de l'ÚlÚment SCRIPT :

    <SCRIPT type="text/javascript">
      document.write ("<EM>Cela ne marche pas</EM>")
    </SCRIPT>

un lecteur conforme doit traiter les caract¶res "</" comme indicateur de fin des donnÚes script, ce qui clairement n'est pas ce que l'auteur a prÚvu.

En JavaScript, ce code peut Ætre Úcrit correctement en s'assurant que la prÚsence du dÚlimiteur ETAGO ne soit apparente avant un caract¶re SGML de dÚpart :

    <SCRIPT type="text/javascript">
      document.write ("<EM>Ceci marche<\/EM>")
    </SCRIPT>

En Tcl, On peut l'accomplir comme cela :

    <SCRIPT type="text/tcl">
      document write "<EM>Ceci marchera<\/EM>"
    </SCRIPT>

En VBScript, Le probl¶me peut Ætre ÚvitÚ par la fonction Chr() :

    "<EM>Ceci marchera<" & Chr(47) & "EM>"

6.15 Noms des cibles Frame

A l'exception des noms rÚservÚs listÚs ici, les noms de cible des frames (%FrameTarget; dans la DTD) doivent commencer avec un caract¶re alpahbÚtique (a-zA-Z). Les clients devraient ignorer tous les autres noms cibles.

Les noms suivants sont rÚservÚs et ont une signification particuli¶re.

_blank
Le client devrait chargÚ le document dÚsignÚ dans une nouvelle fenÆtre, non nommÚ.
_self
Le client devrait charger le document dans le mÆme frame que l'ÚlÚment qui se rÚferre à cette cible.
_parent
Le client devrait charger le document dans le FRAMESET immÚdiat, parent de l'actuel frame. Cette valeur est Úquivalente à _self si le frame actuel n'a pas de parent.
_top
Le client devrait charger le document dans la fenÆtre originale, compl¶te (annulant ainsi tous les autres frames). Cette valeur est Úquivalente à _self si le frame actuel n'a pas de parent.