link W3C open

Qu'est ce que le DOM ?

#1 Que veut dire DOM ? open

L'abréviation DOM vient de Document Object Model. Pour expliciter un peu on peut dire que c'est une hiérarchie d'objets destinées à interfacer un langage, pas forcement Javascript, avec un document XML ou HTML.

#2 Historique open

Sans interface entre Javascript et le document, le document était statique et il n'était pas possible de le manipuler.

En 1997 plusieurs interfaces différentes ont vu le jour sur des navigateurs concurrents. Du coup les programmeurs devaient détecter le type du navigateur pour ajuster leur code en conséquence.

Le besoin de normalisation était évident et on va demander au W3C (World Wide Web Consortium) d'écrire une spécification pour cette hiérarchie d'objets.

  • Une première version de cette spécification qu'on appelle le DOM Level 1 voit le jour en 1998. Cette version est faite de plusieurs parties. Une partie HTML, une partie XML et une partie core commune HTML/XML.
  • Une deuxième version que l'on appelle le DOM Level 2 sort en 2000. Plusieurs parties sont ajoutées, notamment une partie sur les événements et une autre sur la feuille de style.
  • Aujourd'hui (Août 2019) on en est à la version DOM4 pour le HTML 5.

#3 Vous avez dit DOM ? open

Le terme DOM est utilisé dans différentes situations. Je vais préciser lesquelles.

Le DOM pour la spécification.

On parle de DOM lorsque l'on parle de la spécification qui décrit une structure d'objets qui vont permettre d'interfacer un langage de programmation avec un document XML ou HTML.

La spécification décrit un standard qui est indépendant de tous langages et de toutes plates-formes. Dans le document de spécification c'est un pseudo langage qui est utilisé pour spécifier les objets. Le pseudo langage est quelque chose de très simple. Pour décrire un objet on fait la liste des propriétés et des méthodes et on dit à quoi elles vont servir. Si un objet est une extension d'un autre objet on l'écrit.

Ensuite il y a des implémentations du DOM pour Javascript dans un navigateur.

On parle aussi de DOM lorsque le programmeur web travaille sur une implémentation du DOM intégrée à l'interpréteur Javascript qui tourne dans un navigateur. Là c'est une interface, c'est du code, je dirais que c'est le vrai DOM. On trouve une implémentation du DOM sur chaque navigateur, une sur Chrome une autre sur Firefox, une autre sur Opéra etc. Il faut donc noter que l'on est dans un cas particulier d'application de cette spécification. Et toutes ces implémentations fonctionnent de la même façon et c'est bien ce qu'apporte la spécification.

Il y a aussi l'arbre du DOM

On peut aussi vous parler du DOM à propos de l'arbre d'un document. On vous dit c'est son DOM.

En général vous vous y retrouvez facilement grâce au contexte de la discussion.

#4 Comment fonctionne l'interface DOM ? open

  1. Le document HTML est analysé par le navigateur.
  2. Pour faire simple on va dire que pour chaque élément HTML trouvé, le navigateur instancie un objet Javascript et le place dans un arbre. Il constitue ainsi un arbre d'instances d'objets Javascript à partir du contenu HTML.
  3. L'arbre est mis à disposition du développeur à partir d'une instance d'un objet spécifique qui s'appelle document.
  4. Le développeur web n'a plus qu'à récupérer les adresses des instances des objets Javascript pour les manipuler et modifier le document HTML (* celui du navigateur).
  5. Il peut aussi choisir une instance pour intercepter les événements qui pourrait être déclenchés depuis un élément HTML.
Analyse du HTML et instanciation des objets Javascript
Analyse du HTML et instanciation des objets Javascript

Il faut remarquer que chaque élément HTML a sa propre instance d'un objet Javascript ce qui fait que tous les nœuds de l'arbre ne sont pas les mêmes. Dans le tutoriel suivant on fera des parcours de cet arbre de manière à visualiser tout ça.

#5 La hiérarchie des objets du DOM open

Extrait très édulcoré de la hiérarchie des objets du DOM
Hiérarchie des objet du DOM

On va voir juste trois choses :

  1. Tous les éléments HTML ont leur propre "objet élément HTML".
  2. Tous seront accrochés dans un arbre. Et pour ça ils descendent d'un ancêtre commun qui est l'objet Node. C'est cet objet qui contient les propriétés et les méthodes pour créer cet arbre. Tous les "objets élément HTML" héritent des propriétés et méthodes de l'objet Node.
  3. C'est une instance document de l'objet HTMLDocument qui permet au programmeur d'accéder à l'arbre du document HTML.

#6 L'objet Node open

Extrait de l'objet Node (*spécification)
Objet Node dans le document de spécification

Dans cette structure on trouve :

  • Des constantes qui qualifient le type de nœud.
  • La liste des nœuds enfants childNodes avec des propriétés firstChild lastChild, parentNode ... qui permettent de fabriquer l'arbre en liant les nœuds.
  • Des propriétés nodeType, nodeName, nodeValue qui permettent de stocker des informations sur les nœuds.
  • Des méthodes appendChild(), insertBefore() qui permettent d'accrocher des nœuds dans l'arbre. Une méthode removeChild() qui permet de supprimer un nœud.

childNodes est assimilable à un tableau de Node. Ce n'est pas un objet de constructeur Array mais vous pouvez accéder aux éléments de manière "traditionnelle" avec [] et vous avez l'attribut length.

Construire un arbre avec les propriétés de Node
Construction d'un arbre avec les propriétés de Node

En réalité c'est un peu plus compliqué. Pour les éléments HTML l'information est stockée dans deux nœuds. Par exemple pour h1, Un premier nœud de type HTMLHeadingelement contiendra le nom de la balise h1 et les attributs. Un deuxième nœud enfant du premier sera du type Text et contiendra Bonjour à tous.

Il y a aussi d'autres nœud de type Text qui vont venir s'insérer par ci par là. Par exemple pour une ligne vide on aura un nœud de type Text qui contiendra les caractères new line et carriage return.

Ici deux types de nœud différents
Différent type de nœud

#7 L'objet HTMLDocument open

La fameuse instance document est en fait une instance de l'objet HTMLDocument.

Extrait de l'objet Document partie core (*spécification)
Objet Document dans le document de spécification de la partie core
Extrait de l'objet HTMLDocument partie HTML (*spécification)
Objet HTMLDocument dans le document de spécification de la partie HTML

Si vous avez besoin d'informations supplémentaires vous pouvez taper dans Google MDN HTMLDocument puis vous cliquez sur document.

#8 Les objets HTMLElement open

Il existe un objet propre à chaque élément HTML qui contient le nom de la balise et les attributs de l'élément. Le nom de l'objet est formé de la chaîne HTML suivit du nom de l'élément HTML suivit de la chaîne Element. Par exemples pour un élément Heading le nom de l'objet sera HTMLHeadingElement, pour un élément input le nom sera de HTMLInputElement.

Si vous êtes en train de coder et que vous avez besoin d'informations sur un objet élément le mieux est d'utiliser la doc MDN. Vous tapez par exemple MDN HTMLInputElement dans Google et vous avez tout ce qu'il faut.

#9 La documentation open

La documentation du MDN pour la partie DOM

Document du W3C en anglais pour tous les niveaux.

La partie HTML est intégrée à la spécification du HTML du whatwg.

Documents traduits en français pour le niveau 2, core, html, événements, feuilles de style.