Язык расширенной разметки xml. корректные и валидные xml-документы.

Икс-эм-эль – расширяемый язык разметки, фактически представляющий собой свод общих синтаксических правил. XML – текстовый формат, предназначенный для хранения структурированных данных, для обмена программами, а также для создания на ого основе более специализированных языков разметки (например, XHTML).

XML – это потомок HTML. Разница в том, что HTML имеет четко определенные теги, новые теги появляются лишь по воле разработчиков стандартов и браузеров. В XML совсем другая картина: количество предустановленных (служебных) тегов минимизировано, и программист волен использовать собственные теги.

Годом рождения XML можно считать 1996 год, в конце которого появился черновой вариант спецификации языка, или 1998 год, когда эта спецификация была утверждена.

Первая строка XML-документа называется объявление XML – это строка, указывающая версию XML. В версии 1.0 объявление XML может быть опущено, в версии 1.1 оно обязательно. Также может быть указана кодировка символов.

Важнейшее обязательное синтаксическое требование заключается в том, что документ имеет только один корневой элемент. Это означает, что текст или другие данные всего документа должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.

Следующий простейший пример – правильно построенный документ XML:

Это книга: «Книжечка»

Следующий пример не является корректным XML-документом, потому что имеет два корневых элемента:

Сущность №1

Сущность №2

В любом месте дерева может быть размещен элемент-комментарий. XML-комментарии размещаются внутри специального тега, начинающегося с символов . Два знака дефис (- -) внутри комментария присутствовать не могут. Теги внутри комментария обрабатываться не должны.

XML- документ состоит из элементов, некоторые из которых имеют атрибуты и содержимое. Элемент обычно состоит из открывающего и закрывающего тегов, обрамляющих текст и другие элементы. Открывающий тег состоит из имени элемента в угловых скобках, например, , а закрывающий тег состоит из того же имени в угловых скобках, но перед именем еще добавляется косая черта, например . Имена элементов, как и имена атрибутов, не могут содержать пробелы.

Содержимым элемента называется все, что расположено между открывающим и закрывающими тегами, включая текст и другие элементы.

Кроме содержания у элемента могут быть атрибуты – пары имя-значение, добавляемые в открывающий тег после названия элемента. Значения атрибутов всегда заключаются в кавычки (одинарные или двойные), одно и то же имя атрибута не может встречаться дважды в одном элементе. Не рекомендуется использовать разные типы кавычек для значений атрибутов одного тега.

В XML определены два метода записи специальных символов: ссылка на сущность и ссылка по номеру символа.

Сущностью в XML называются именованные данные, обычно текстовые, в частности, спецсимволы. Ссылка на сущность указывается в том месте, где должна быть сущность и состоит из амперсанда (), имени сущности и точки с запятой (;).

В XML есть несколько предопределенных сущностей, такие как lt(ссылать на нее можно написав ) для левой угловой скобки и amp (ссылка — ) для амперсанда. Возможно также определять собственные сущности.

Ссылка по номеру символа выглядит как ссылка на сущность, но вместо имени сущности указывается символ # и число (в десятичной или шестнадцатеричной записи), являющееся номером символа в кодовой таблице Юникод.

Стандартом определены два уровня правильности документа XML:

1. Правильно построенный соответствует всем общим правилам синтаксиса XML. И если, например, начальный тег не имеет соответствующего ему конечного тега, то это неправильно построенный документ XML. Документ, который неправильно построен, не может считаться документом XML. XML-процессор не должен обрабатывать его обычным образом и обязан классифицировать ситуацию как фатальная ошибка.

2. Действительный (англ. valid). Действительный документ дополнительно соответствует некоторым семантическим правилам. Это более строгая дополнительная проверка корректности документа на соответствие заранее определенным, но уже внешним правилам, в целях минимизации количества ошибок. Эти правила могут быть разработаны как самим пользователем, так и сторонними разработчиками. Обычно такие правила хранятся в специальных файлах – схемах, где самым подробным образом описана структура документа, все допустимые названия элементов, атрибутов и многое другое. И если документ, например, содержит не определенное заранее в схемах название элемента, то XML-документ считается недействительным; проверяющий XML-процессор при проверке на соответствие правилам и схемам обязан сообщить об ошибке.

Как быстро открыть документ xml c Росрееста в читабельном виде


Похожие статьи.

Понравилась статья? Поделиться с друзьями: