Введение в XML
Аббревиатура XML
расшифровывается и переводится как расширяемый язык разметки
. Программист сам определяет формат файла и сам пишет его обработчик, используя для этого предоставляемые языком средства или разрабатывая собственные.
XML файл
является обыкновенным текстовым файлом, данные которого организованы таким образом, чтобы создать иерархическую структуру дерево
тэгов. Имена и атрибуты тэгов программист придумывает самостоятельно, а правила их написания аналогичны таковым в HTML, пример для книжного магазина:
<?xml version="1.0" encoding="UTF-8"?>
<shop>
<book author=”Donald Knuth”>Art of programming</book>
<book author=”Vasily Golovachev”>Magacitly</book>
</shop>
При формировании документа XML
необходимо учитывать описанные ниже минимальные требования к его структуре:
- В документе должен быть предусмотрен лишь единственный корневой элемент, который включает все другие элементы, подобно элементу в документах HTML. Иногда корневой элемент называют также элементом документа
- Структура вложения элементов должна быть иерархической. Это означает, что структура документа с дескрипторами
<x><y> </y></x>
является допустимой, а структура<x><y> </x></y>
— нет. В первом примере очевидно, что элемент<x>
полностью включает элемент<y>
, а во втором примере элементы<x>
и<y>
перекрываются. ЯзыкXML
не допускает, чтобы дескрипторы включаемого элемента выходили за пределы дескрипторов включающего элемента (т.е. перекрывались) - Все элементы должны иметь закрывающий дескриптор (в этом состоит отличие XML от HTML, в котором допускается применение некоторых незакрытых элементов)
- Элементы могут содержать другие элементы, текст и прочие данные. Если элемент включает фрагменты текста, напоминающие код XML (допустим,
<hello>
), но не являются таковыми, или требуется исключить синтаксический анализ какого-то символа в тексте, то этот символ должен быть обозначен символами переключения на другой режим обработки