Вход/Регистрация
Технология XSLT
вернуться

Валиков Алексей Н.

Шрифт:

Следующей простейшей символьной конструкцией является пробельное пространство

S
. Приведем еще раз его продукцию:

[3] S ::= (#х9 | #хА | #xD | #x20)+

Во многих продукциях XML-языков используются имена. Например, имена даются элементам, атрибутам, переменным XPath и так далее. В основе определения имени лежат именные символы

NameChar
:

[4] NameChar ::= Letter | Digit | CombiningChar | Extender

| '.' | '-' | '_' | ':'

Имя начинается либо буквой, либо символами "

_
" или "
:
" и состоит из последовательности именных символов:

[5] Name ::= (Letter | '_' | ' :') (NameChar*)

В некоторых правилах XML используется последовательность имен, соответствующая продукции

Names
:

[6] Names ::= Name (S Name)*

Кроме того, техническая рекомендация определяет так называемый именной токен

NmToken
— строку, которая может состоять из одного или более именных символов и последовательности таких токенов,
NmTokens
.

[7] NmToken ::= (NameChar)+

[8] NmTokens ::= NmToken (S NmToken)*

Символьные данные могут заключаться в кавычки для того, чтобы формировать литералы. В XML определены следующие литералы: значение сущности (

EntityValue
), значение атрибута (
AttValue
), системный литерал (
SystemLiteral
), а также
PubidLiteral
— литерал, определяющий публичный идентификатор ресурса (см. раздел "Определение сущности" данной главы):

[9] EntityValue ::= '"' ([^%&"] | PEReference | Reference)* '"'

| "'" ([^%&'] | PEReference | Reference)* "'"

[10] AttValue ::= '"' ([^<&"] | Reference)* '"'

| ([^<&"] | Reference)* "'"

[11] SystemLiteral ::= ('"' [^"]* '"')

| ("'" [^']* "'")

[12] PubidLiteral ::= '"' PubidChar* '"'

| "'" (PubidChar - "'")*

[13] PubidChar ::= #x20 | #xD | #xA

| [a-zA-Z0-9] | [-'+,./:=?;!*#@$_%]

В литералах

EntityValue
и
AttValue
допустимо использовать продукции сущностей (
PEReference
,
Reference
). Это означает, что при определении значений сущностей и атрибутов можно использовать ссылки на сущности, например, в элементе заданном как:

<song title="Крейсер &quot;Aвpopa&quot; "/>

атрибут

title
имеет значение крейсер
"Аврора"
. Двойные кавычки были определены посредством встроенных сущностей.

Символьные данные, которые задаются продукцией

CharData
, могут состоять из любых символов, кроме символов "
<
" и "
&
", которые используются в XML в качестве управляющих.
CharData
главным образом используется в секциях
CDATA
, и, соответственно, не может содержать терминирующую последовательность "
]]>
".

[14] CharData ::= [^<&]* - ([^<&]* ']]>' [^<&]*)

XML-документы с точки зрения спецификации

Теперь, когда мы разобрали практически все структурные единицы XML, осталось определить стандартным образом синтаксис для самих XML-документов. Им соответствует продукция

document
:

[1] document ::= prolog element Misc

Итак, XML-документ состоит из пролога, единственного корневого элемента и дополнительного нетерминала

Misc
, который может включать инструкции по обработке, комментарии и пробельные символы:

[27] Misc ::= Comment | PI | S

Остановимся отдельно на прологе XML-документа. Пролог состоит из необязательной декларации XML (

XMLDecl
), необязательной декларации типа документа (
doctypedecl
), инструкций, комментариев и пробельных символов:

[22] prolog ::= XMLDeci? Misc* (doctypedecl Misc*)?

В зависимости от того, насколько строго документы соответствуют спецификации XML и собственным DTD-объявлениям, они могут быть хорошо оформленными (well-formed) и правильными (valid).

  • Читать дальше
  • 1
  • ...
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • ...

Ебукер (ebooker) – онлайн-библиотека на русском языке. Книги доступны онлайн, без утомительной регистрации. Огромный выбор и удобный дизайн, позволяющий читать без проблем. Добавляйте сайт в закладки! Все произведения загружаются пользователями: если считаете, что ваши авторские права нарушены – используйте форму обратной связи.

Полезные ссылки

  • Моя полка

Контакты

  • chitat.ebooker@gmail.com

Подпишитесь на рассылку: