
HTML (англ. HyperText Markup Language — мова розмітки гіпертексту) — стандартизована мова розмітки документів для перегляду веб-сторінок у браузері. Веб-браузери отримують HTML документ від сервера за протоколами HTTP/HTTPS або відкривають з локального диска, далі інтерпретують код в інтерфейс, який відображатиметься на екрані монітора.
Елементи HTML є будівельними блоками сторінок HTML. За допомогою конструкцій HTML, зображення та інші об'єкти, такі як інтерактивні форми, можуть бути вбудовані у візуалізовану сторінку. HTML надає засоби для створення структурованих документів, позначаючи структурну семантику тексту, наприклад заголовки, абзаци, списки, посилання, цитати та інші елементи. Елементи HTML окреслені тегами, написаними з використанням кутових дужок. Теги на кшталт <img /> чи <input /> безпосередньо виводять вміст на сторінку. Інші теги, такі як <p>, оточують текст і надають інформацію про нього, а також можуть включати інші теги як піделементи. Браузери не показують теги HTML, але використовують їх для інтерпретації вмісту сторінки.
В HTML можна вбудовувати програми, написані на скриптових мовах, наприклад JavaScript, які впливають на поведінку та вміст вебсторінок. Включення CSS визначає вигляд і компонування вмісту. World Wide Web Consortium (W3C), який супроводжує стандарти HTML та CSS, заохочує використання CSS над явним презентаційним HTML з 1997 року1).
HTML впроваджує засоби для:2)
HTML-код веб-сторінки опрацьовується браузером. Браузер відображає текст і вміст уставлених нетекстових об’єктів, їх форматування відповідно до визначеної структури.
Розмітка в HTML складається з чотирьох основних компонентів: елементів (та їхніх атрибутів), базових типів даних, символьних мнемонік та декларації типу документа.
Документ HTML 5.2 складається з трьох частин:
Нижче наведено приклад загальної структури HTML-документа:
<! DOCTYPE html> <html> <head> <title>Назва</title> </head> <body> <p> Hello world!</p> </body> </html>
Де:
тег <title> відображає у заголовку браузера ім'я поточного html-документа. Тег <title> - обов'язковий тег і має бути присутнім на кожній веб-сторінці. Він повинен бути розташований всередині контейнера head.
тег <p> визначає текстовий абзац.
Елементи являють собою базові компоненти розмітки HTML. Кожен елемент має дві основні властивості: атрибути та вміст (контент). Існують певні настанови щодо кожного атрибута та контенту елемента, які треба виконувати задля того, щоб HTML-документ був визнаний валідним.
У елемента є початковий тег, який має вигляд <element-name>, та кінцевий тег, який має вигляд </element-name>. Атрибути елемента записуються в початковому тегу одразу після назви елемента, контент елемента записується між його двома тегами. Наприклад:
<element-name element-attribute="attribute-value">контент елемента</element-name>
.
Деякі елементи, наприклад br, не містять контенту, тож і не мають кінцевого тегу. Елемент може не мати початкового та кінцевого тегу (наприклад, елемент head), проте він завжди буде представлений в документі. Нижче зазначені деякі типи елементів розмітки HTML.
Елементи структурної розмітки застосовуються задля опису семантики тексту, іншими словами ці елементи описують призначення тексту свого контенту. Вони не зазначають ніякого спеціального (візуального) відтворення тексту, проте більшість браузерів мають стандартні стилі форматування для кожного елемента. Для подальшого стилізування тексту рекомендується використовувати Каскадні таблиці стилів (CSS). Наприклад:
Давньогрецькі боги
Посейдон — володар світових вод, Океану, в латинян йому відповідав Нептун, у слов'ян — Цар Моря, Цар Морський, Водяник.
Елементи візуальної розмітки застосовуються задля опису візуальних ефектів тексту, не зазначаючи при цьому функції тексту свого контенту. Остання чинна специфікація HTML 4.01 визначає більшість з цих елементів такими, що не рекомендується застосовувати у розмітці. Наприклад:
Давньогрецькі боги
Посейдон — володар світових вод, Океану, в латинян йому відповідав Нептун, у слов'ян — Цар Моря, Цар Морський, Водяник.
Елементи розмітки гіпертексту застосовуються задля з'єднання частин документа з іншими документами. Наприклад:
Більшість з атрибутів елемента являє собою пару «назва-значення», розділених між собою знаком рівності, та записаних у початковому тегу одразу після назви елемента. Значення атрибуту може бути оточене лапками (подвійними або одиничними), також, якщо значення атрибуту складається з певних символів, його можна не виділяти лапками зліва. Проте невзяття значення атрибутів у лапки вважається небезпечним кодом. На відміну від атрибутів виду «назва-значення», є певні атрибути, що впливають на елемент, назва яких лише з'явилась в початковому тегу (наприклад, атрибут ismap елемента img).
Більшість елементів можуть мати будь-який з загальних атрибутів:
Оскільки HTML є похідною мовою від SGML, усі типи даних HTML ґрунтуються на базових типах даних SGML (наприклад, PCDATA, CDATA, NAME, ID, NUMBER).
Кожен елемент має дві властивості — атрибути і вміст, які мають певні значення. Всі можливі значення цих двох властивостей прописуються відповідно до визначених у DTD типів даних. Нижче наведено кілька типів даних HTML:
Існують такі випадки, коли в документі потрібно використати якийсь символ, якого немає в обраній для документа кодовій таблиці. Для таких випадків можливо замінити символ на еквівалентне йому SGML-посилання на символ (мнемоніку).
Визначають кодову позицію символу із таблиці кодів UCS. Наприклад:
| Мнемоніка | Символ |
|---|---|
<
| < |
&
| & |
"
| “ |