mercredi 29 mai 2013

HTML rappels et définitions




            Avant d'aborder le langage HTML, rappelons quelques définitions et concepts liés aux serveurs web.

            Il existe, sur Internet (et maintenant en Intranet[1]), un nombre important de serveurs proposant des documents multimédia c'est-à-dire composés de texte, images, sons, animations etc. Ces documents, appelés pages web sont visualisés grâce à un programme appelé browser ou navigateur en Français. Il existe principalement deux grands navigateurs, à savoir Netscape, disponible sur un très grand nombre de plates-formes (Windows, UNIX, Mac) et Internet Explorer, fourni par Microsoft pour ses systèmes d'exploitation.


            Un document, proposé par un serveur web, est toujours désigné par une "adresse" appelée URL pour Universal Resource Locator. Une URL[2] a la structure suivante :
            protocole://adresse_machine[/répertoire/sous-rep/.../nom_document][3]

            Le protocole HTTP (HyperText Transfert Protocol) est utilisé pour transmettre une page au format HTML (que nous allons définir tout de suite). Il est cependant possible d'indiquer un autre protocole comme ftp, telnet etc. C'est pourquoi on parle de localisateur de ressource universel.
            La machine sur laquelle fonctionne le serveur web[4] est spécifiée soit par son adresse IP numérique (ex : 147.25.48.54) soit par son adresse DNS alphanumérique (ex : www.ibm.com). Dans le dernier cas, le premier terme de l'adresse DNS est généralement "www" (mais ce n'est pas une obligation).
            Enfin, le document demandé est identifié par son chemin d'accès (path) et son nom. Pour une page HTML, son nom se termine par .html[5]. Notez que si aucun document n'est spécifié, c'est une page par défaut, dite HomePage ou Page d'acceuil qui est envoyée au navigateur.
            Voici un exemple d'URL (fictive):
http://www.apple.com/index/download/drivers/list.html

            Précisons que les pages HTML utilisent la technique de l'hypertexte, permettant de spécifier des URL au sein des pages, vers d'autres pages. Cela crée une structure, au niveau mondial, qui peut être vue comme une toile d'araignée, d'où le terme de World Wide Web.

            Maintenant que nous avons fait ces quelques rappels, il est temps de définir ce qu'est le langage HTML.

            HTML signifie HyperText Markup Language. Comme son nom l'indique, c'est un langage qui permet de définir l'habillage d'un document, c'est à dire la façon dont il doit s'afficher à l'écran d'un navigateur.

            Cette notion d'habillage est importante : elle signifie qu'une page écrite en HTML comportera du texte, bien-sûr, mais aussi des codes ou balises permettant de modifier l'affichage de ce texte, à savoir sa forme, sa taille, sa couleur. Le HTML permet également d'inclure des images, du son ou des animations dans une page web.

            Le HTML est très simple. Ce n'est pas un langage de programmation dans le sens où il n'existe pas de variables, boucles, expressions conditionnelles. En fait, c'est plus un ensemble de codes qu'un langage, comme on le conçoit en informatique[6].
           
Il faut également signaler qu'un document HTML n'est autre qu'un fichier texte (i.e. ASCII) auquel on a ajouté des balises HTML. Il est en effet parfaitement possible de créer une page HTML avec un simple éditeur de texte comme Write ou Wordpad sous Windows, à condition de sauver le fichier ainsi créé au format texte, avec une extension .html (ou .htm pour les versions de Windows antérieures à Windows 95).
            En pratique cependant, on utilise des outils munis d'une interface graphique évoluée permettant, d'un clic de souris, d'insérer dans le document en cours d'édition une balise HTML, comme on le ferait avec un traitement de texte.[7]

            Dans les lignes qui suivent, nous n'allons présenter que certaines commandes du langage HTML, dans sa version 2, dernière en date à avoir été "officialisée". Nous ne présenterons que très peu de commandes appartenant aux dernières version du langage, toujours non définies officiellement, désignées par les numéros de versions 3 et 3.2. En pratique, les navigateurs récents exploitent déjà les fonctionnalités des versions 3 et 3.2 du langage.




[1] Voir le dernier chapitre.
[2] Bien que locator soit masculin, il est fréquent de parler d'une URL en Français.
[3] Les crochets indiquent une zone optionnelle. Il ne faut jamais les indiquer dans une URL.
[4] Ou FTP, Telnet etc.
[5] Parfois, on rencontre des pages avec l'extension .shtml  (ce sont des pages dynamiques, Cf. dernier chapitre).
[6] Un peu comme le vidéotex utilisé par le Minitel. Nous verrons, dans le dernier chapitre, que le HTML peut être associé à un ou plusieurs programmes.
[7] Dans le cas d'un logiciel de traitement de texte, comme Word, les caractères permettant de changer les attributs d'un texte (taille, corps, etc.) n'apparaissent pas dans le document mais ils existent bien et sont stockés lors de l'enregistrement du fichier.

Aucun commentaire:

Enregistrer un commentaire