Le langage HTML est un langage de description de pages. Une page HTML est un fichier texte comportant des balises (tags en Anglais). La liste des balises reconnues en HTML 4.0 est vaste et nous ne verrons tout au long de ce cours que les balises les plus utilisées.
Le premier tag double utilisé dans une page est <html> ou <html lang=fr> et </html> (l'indication de langue peut être utilisée par les moteurs de recherche). La totalité de votre fichier HTML doit se trouver à l'intérieur de ce tag double.
Vient ensuite l'entête de fichier qui est particulièrement important même s'il ne se voit pas. En effet, les moteurs de recherche en texte intégral utilisent avant tout ces entêtes pour référencer votre site. L'entête est contenu dans le tag double <head> et </head> en tout début de fichier avant même la description du corps de la page (<body> et </body>)
Le titre est définit par le tag <title> et </title> et un certain nombre d'autres attributs peuvent encore être définis dans l'entête à l'aide de tags de type <meta ...> citons entre autres :
<html>
<head>
<title> Ceci est le titre <title>
<meta name="description" content="... description de la page ...">
<meta name="keywords" content="motcle1, motcle2, ...">
<meta http-equiv="Refresh" content="30">
<meta http-equiv="Refresh" content="5; url=nouvelle_page.html">
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
</head>
<body>
...
</body>
</html>
La couleur de la police de caractères par défaut peut également se définir par un tag double <font color="#CC0055"> </font> encadrant la totalité de la page