Lorsque vous commencez à explorer le monde de création de sites web, vous découvrirez sans aucun doute un certain nombre de mots et d'expressions nouveaux pour vous. L'un des termes que vous entendrez probablement est « balisage » ou peut-être « langage de balisage ». En quoi « balisage » est-il différent du « code » et pourquoi certains professionnels du Web semblent-ils utiliser ces termes de manière interchangeable? Commençons par examiner exactement ce qu'est un "langage de balisage".
Cet exemple est un paragraphe HTML. Il est composé d'une balise ouvrante (
), une balise de fermeture (
), et le texte réel qui serait affiché à l'écran (il s'agit du texte contenu entre les deux balises). Chaque balise comprend un symbole « inférieur à » et « supérieur à » pour le désigner dans le cadre du balisage. Lorsque vous formatez du texte à afficher sur un ordinateur ou un autre écran d'appareil, vous devez faire la distinction entre le texte lui-même et les instructions pour le texte. Le "balisage" correspond aux instructions d'affichage ou d'impression du texte.
Le balisage n'a pas besoin d'être lisible par ordinateur. Les annotations imprimées ou dans un livre sont également considérées comme du balisage. Par exemple, de nombreux élèves à l'école mettront en évidence certaines phrases dans leurs manuels. Cela indique que le texte en surbrillance est plus important que le texte qui l'entoure. La couleur de surbrillance est considérée comme un balisage.
Le balisage devient un langage lorsque des règles sont codifiées sur la façon d'écrire et d'utiliser ce balisage. Ce même élève pourrait avoir son propre « langage de balisage de prise de notes » s'il codifiait des règles telles que « le surligneur violet est pour les définitions, le surligneur jaune est pour les détails de l'examen, et les notes au crayon dans les marges sont pour des ressources supplémentaires.
La plupart des langages de balisage sont définis par une autorité extérieure pour être utilisés par de nombreuses personnes différentes. C'est ainsi que fonctionnent les langages de balisage pour le Web. Ils sont définis par le W3C ou World Wide Web Consortium.
Regardons 3 langages de balisage
Presque tous les acronymes sur le Web qui contiennent un « ML » sont un « langage de balisage » (grande surprise, c'est ce que signifie « ML »). Les langages de balisage sont les blocs de construction utilisés pour créer des pages Web ou toutes les formes et tailles.
En réalité, il existe de nombreux langages de balisage différents dans le monde. Pour la conception et le développement de sites Web, il existe trois langages de balisage spécifiques que vous rencontrerez probablement. Il s'agit de HTML, XML et XHTML.
Qu'est-ce qu'un langage de balisage?
Pour définir correctement ce terme, un langage de balisage est un langage qui annote du texte afin que l'ordinateur puisse manipuler ce texte. La plupart des langages de balisage sont lisibles par l'homme car les annotations sont écrites de manière à les distinguer du texte lui-même. Par exemple, avec HTML, XML et XHTML, les balises de balisage sont.
<
et.
>
Tout texte qui apparaît dans l'un de ces caractères est considéré comme faisant partie du langage de balisage et non du texte annoté. Par example:
HTML — Langage de balisage hypertexte
HTML ou HyperText Markup Language est le langage principal du Web et le plus courant avec lequel vous travaillerez en tant que concepteur/développeur Web. En fait, c'est peut-être le seul langage de balisage que vous utilisez dans votre travail.
Toutes les pages Web sont écrites dans une saveur de HTML. HTML définit la manière dont les images, le multimédia et le texte sont affichés dans les navigateurs Web. Ce langage comprend des éléments pour connecter vos documents (hypertexte) et rendre vos documents web interactifs (comme avec des formulaires). Beaucoup de gens appellent HTML "code de site Web", mais en réalité, il ne s'agit en réalité que d'un langage de balisage. Aucun des deux termes n'est strictement faux et vous entendrez des gens, y compris des professionnels du Web, utiliser ces deux termes de manière interchangeable.
HTML est un langage de balisage standard défini. Il est basé sur SGML (Langage de balisage généralisé standard). C'est un langage qui utilise des balises pour définir la structure de votre texte. Les éléments et les balises sont définis par les caractères < et >.
Alors que HTML est de loin le langage de balisage le plus populaire utilisé sur le Web aujourd'hui, ce n'est pas le seul choix pour le développement Web. Au fur et à mesure que le HTML a été développé, il est devenu de plus en plus compliqué et les balises de style et de contenu ont été combinées en une seule langue. Finalement, le W3C a décidé qu'il était nécessaire de séparer le style d'une page Web et le contenu. Une balise qui définit le contenu seul resterait en HTML tandis que les balises qui définissent le style étaient dépréciées au profit de CSS (Cascading Style Sheets).
La dernière version numérotée de HTML est HTML5. Cette version a ajouté plus de fonctionnalités au HTML et a supprimé une partie de la rigueur imposée par XHTML (plus d'informations sur ce langage sous peu).
La façon dont le HTML est publié a été modifiée avec l'essor du HTML5. Aujourd'hui, de nouvelles fonctionnalités et modifications sont ajoutées sans qu'il soit nécessaire de publier une nouvelle version numérotée. La dernière version du langage est simplement appelée "HTML".
XML — Langage de balisage extensible
Le langage de balisage extensible est le langage sur lequel une autre version de HTML est basée. Comme HTML, XML est également basé sur SGML. Il est moins strict que le SGML et plus strict que le simple HTML. XML offre l'extensibilité pour créer plusieurs langages différents.
XML est un langage pour écrire des langages de balisage. Par exemple, si vous travaillez sur la généalogie, vous pouvez créer des balises en utilisant XML pour définir le père, la mère, la fille et le fils dans votre XML comme ceci:. Il existe également plusieurs langages standardisés déjà créés avec XML: MathML pour définir les mathématiques, SMIL pour travailler avec le multimédia, XHTML et bien d'autres.
XHTML — Langage de balisage hypertexte étendu
XHTML 1.0 est HTML 4.0 redéfini pour répondre aux XML la norme. XHTML a été remplacé dans la conception Web moderne par HTML5 et les changements intervenus depuis. Il est peu probable que vous trouviez de nouveaux sites utilisant XHTML, mais si vous travaillez sur un site beaucoup plus ancien, vous pouvez toujours rencontrer du XHTML dans la nature.
Il n'y a pas beaucoup de différences majeures entre HTML et XHTML, mais voici ce que vous remarquerez:
- XHTML est écrit en minuscules. Pendant que Balises HTML peut être écrit en MAJUSCULES, en MiXeD ou en minuscules, pour être correct, les balises XHTML doivent être toutes en minuscules. (de nombreux professionnels du Web écrivent du HTML en minuscules, même si ce n'est pas techniquement requis).
- Tous les éléments XHTML doivent avoir une balise de fin. Les éléments avec une seule balise, tels que et nécessitent une barre oblique fermante (/) à la fin de la balise:
- Tous les attributs doivent être entre guillemets en XHTML. Certaines personnes suppriment les guillemets autour des attributs pour économiser de l'espace, mais ils sont nécessaires pour un XHTML correct.
- XHTML requiert que les balises soient correctement imbriquées. Si vous ouvrez un gras () élément puis un italique (), vous devez fermer l'élément en italique () avant de fermer le gras (). (Notez que ces deux éléments ont été dépréciés car ce sont des éléments visuels. HTML utilise maintenant et à la place de ces deux).
- Les attributs HTML doivent avoir un nom et une valeur. Les attributs qui sont autonomes en HTML doivent également être déclarés avec des valeurs, par exemple, l'attribut HR serait écrit noshade="noshade".