Avant
d'aborder le langage HTML, rappelons quelques définitions et concepts liés aux
serveurs web.
Il
existe, sur Internet (et maintenant en Intranet[1]),
un nombre important de serveurs proposant des documents multimédia c'est-à-dire composés de texte, images, sons, animations
etc. Ces documents, appelés pages web
sont visualisés grâce à un programme appelé browser
ou navigateur en Français. Il existe principalement deux grands navigateurs, à
savoir Netscape, disponible sur un très grand nombre de plates-formes (Windows,
UNIX, Mac) et Internet Explorer, fourni par Microsoft pour ses systèmes
d'exploitation.
Un
document, proposé par un serveur web, est toujours désigné par une
"adresse" appelée URL pour Universal Resource Locator. Une URL[2]
a la structure suivante :
protocole://adresse_machine[/répertoire/sous-rep/.../nom_document][3]
Le
protocole HTTP (HyperText Transfert
Protocol) est utilisé pour transmettre une page au format HTML (que nous
allons définir tout de suite). Il est cependant possible d'indiquer un autre
protocole comme ftp, telnet etc. C'est pourquoi on parle de localisateur de
ressource universel.
La
machine sur laquelle fonctionne le serveur web[4]
est spécifiée soit par son adresse IP numérique (ex : 147.25.48.54) soit par
son adresse DNS alphanumérique (ex : www.ibm.com). Dans le dernier cas, le
premier terme de l'adresse DNS est généralement
"www" (mais ce n'est pas
une obligation).
Enfin,
le document demandé est identifié par son chemin d'accès (path) et son nom. Pour une page HTML, son nom se termine par .html[5].
Notez que si aucun document n'est spécifié, c'est une page par défaut, dite HomePage ou Page d'acceuil qui est
envoyée au navigateur.
Voici
un exemple d'URL (fictive):
http://www.apple.com/index/download/drivers/list.html
Précisons
que les pages HTML utilisent la technique de l'hypertexte, permettant de
spécifier des URL au sein des pages, vers d'autres pages. Cela crée une
structure, au niveau mondial, qui peut être vue comme une toile d'araignée,
d'où le terme de World Wide Web.
Maintenant
que nous avons fait ces quelques rappels, il est temps de définir ce qu'est le
langage HTML.
HTML
signifie HyperText Markup Language.
Comme son nom l'indique, c'est un langage qui permet de définir l'habillage
d'un document, c'est à dire la façon dont il doit s'afficher à l'écran d'un
navigateur.
Cette
notion d'habillage est importante : elle signifie qu'une page écrite en HTML
comportera du texte, bien-sûr, mais aussi des codes ou balises permettant de modifier l'affichage de ce texte, à savoir sa
forme, sa taille, sa couleur. Le HTML permet également d'inclure des images, du
son ou des animations dans une page web.
Le
HTML est très simple. Ce n'est pas
un langage de programmation dans le sens où il n'existe pas de variables,
boucles, expressions conditionnelles. En fait, c'est plus un ensemble de codes
qu'un langage, comme on le conçoit en informatique[6].
Il faut également signaler
qu'un document HTML n'est autre qu'un fichier
texte (i.e. ASCII) auquel on a ajouté des balises HTML. Il est en effet
parfaitement possible de créer une page HTML avec un simple éditeur de texte
comme Write ou Wordpad sous Windows, à condition de sauver le fichier ainsi
créé au format texte, avec une extension .html (ou .htm pour les versions de
Windows antérieures à Windows 95).
En
pratique cependant, on utilise des outils munis d'une interface graphique
évoluée permettant, d'un clic de souris, d'insérer dans le document en cours
d'édition une balise HTML, comme on le ferait avec un traitement de texte.[7]
Dans
les lignes qui suivent, nous n'allons présenter que certaines commandes du langage HTML, dans sa version 2, dernière en
date à avoir été "officialisée". Nous ne présenterons que très peu de
commandes appartenant aux dernières version du langage, toujours non définies
officiellement, désignées par les numéros de versions 3 et 3.2. En pratique,
les navigateurs récents exploitent déjà les fonctionnalités des versions 3 et
3.2 du langage.
[1] Voir le dernier chapitre.
[2] Bien que locator soit masculin, il est fréquent
de parler d'une URL en Français.
[3] Les crochets indiquent une
zone optionnelle. Il ne faut jamais
les indiquer dans une URL.
[4] Ou FTP, Telnet etc.
[5] Parfois, on rencontre des
pages avec l'extension .shtml (ce sont
des pages dynamiques, Cf. dernier chapitre).
[6] Un peu comme le vidéotex utilisé par le Minitel. Nous
verrons, dans le dernier chapitre, que le HTML peut être associé à un ou
plusieurs programmes.
[7] Dans le cas d'un logiciel
de traitement de texte, comme Word, les caractères permettant de changer les
attributs d'un texte (taille, corps, etc.) n'apparaissent pas dans le document
mais ils existent bien et sont stockés lors de l'enregistrement du fichier.



Aucun commentaire:
Enregistrer un commentaire