C++. Сборник рецептов - [185]

Шрифт
Интервал

> boost::scoped_array ptr(xercesc::XMLString::transcode(str));

> return XercesString(ptr.get());

>}

Здесь >ptr становится обладателем возвращенной функцией >transcode() строки с нулевым завершающим символом и освобождает ее, даже если конструктор >XercesString выбрасывает исключение >std::bad_alloc.

14.3. Синтаксический анализ сложного документа XML

Проблема

Имеется некоторый набор данных, хранимых в документе XML, внутри которого используется DTD или применяются пространства имен XML. Требуется выполнить синтаксический анализ документа и превратить содержащиеся в нем данные в набор объектов C++.

Решение

Используйте реализацию Xerces в виде программного интерфейса SAX2 (простой программный интерфейс для XML, версия 2.0). Во-первых, создайте класс, производный от >xercesc::ContentHandler; этот класс будет получать уведомления с информацией о структуре и содержимом вашего документа XML по мере его анализа. Затем при желании можно создать класс, производный от >xercesc::ErrorHandler, для получения предупреждений и сообщений об ошибках. Сконструируйте парсер типа >xercesc::SAX2XMLReader, зарегистрируйте экземпляры классов вашего обработчика, используя методы парсера >setContentHandler() и >setErrorHandler(). Наконец, вызовите метод парсера >parse(), передавая в качестве аргумента полное имя файла, в котором содержится ваш документ.

Например, пусть требуется выполнить синтаксический анализ документа XML animals.xml, приведенного в примере 14.1, и сконструировать вектор >std::vector объектов >Animal, представляющих животных, перечисленных в этом документе. (Определение класса >Animal дается в примере 14.2.) В примере 14.3 я показываю, как можно это сделать, используя TinyXml. Для усложнения задачи добавим в документ пространства имен, как показано в примере 14.5.

Пример 14.5. Список цирковых животных, в котором используются пространства имен XML

>

>

>

Herby

elephant

1992-04-23

>

Для анализа этого документа с помощью SAX2 определите >ContentHandler, как показано в примере 14.6, и >ErrorHandler, как показано в примере 14.7. Затем сконструируйте >SAX2XMLReader, зарегистрируйте ваши обработчики и запустите парсер. Это проиллюстрировано в примере 14.8.

Пример 14.6. Применение SAX2 ContentHandler для синтаксического анализа документа animals.xml

>#include // runtime_error

>#include

>#include

>#include // Содержит реализации без

>                                           // операций для различных

>                                           // обработчиков, используемых

>#include "xerces_strings.hpp"              // в примере 14.4

>#include "animal.hpp"


>using namespace std;

>using namespace xercesc;


>// Возвращает экземпляр Contact, построенный

>// на основе заданного набора атрибутов

>Contact contactFromAttributes(const Attributes &attrs) {

> // Для повышения эффективности хранить часто используемые строки

> // в статических переменных

> static XercesString name = fromNative("name");

> static XercesString phone = fromNative("phone");

> Contact result;   // Возвращаемый объект Contact.

> const XMLCh* val; // Значение атрибута name или phone.

> // Установить имя объекта Contact.

> if ((val = attrs.getValue(name.c_str())) != 0) {

>  result.setName(toNative(val));

> } else {

>  throw runtime_error("contact missing name attribute");

> }

> // Установить номер телефона для объекта Contact.

> if ((val = attrs.getValue(phone.c_str())) != 0) {

>  result.setPhone(toNative(val));

> } else {

>  throw runtime_error("contact missing phone attribute");

> }

> return result;

>}


>// Реализует обратные вызовы, которые получают символьные данные и

>// уведомления о начале и конце элементов

>class CircusContentHandler : public DefaultHandler {

>public:

> CircusContentHandler(vector& animalList) :

>  animalList_(animalList) {}


> // Если текущий элемент представляет ветеринара или дрессировщика

> // используйте attrs для конструирования объекта Contact для текущего

> // Animal; в противном случае очистите currentText_, подготавливая

> // обратный вызов characters()

> void startElement(

>  const XMLCh *const uri,       // URI пространства имен

>  const XMLCh *const localname, // имя тега без префикса NS

>  const XMLCh *const qname,     // имя тега + префикс NS

>  const Attributes &attrs)      // атрибуты элементов

> {

>  static XercesString animalList = fromNative("animalList");

>  static XercesString animal = fromNative("animal");

>  static XercesString vet = fromNative("veterinarian");

>  static XercesString trainer = fromNative("trainer");

>  static XercesString xmlns =

>   fromNative("http://www.feldman-family-circus.com");

>  // проверить URI пространства имен


Рекомендуем почитать
Изучаем Java EE 7

Java Enterprise Edition (Java EE) остается одной из ведущих технологий и платформ на основе Java. Данная книга представляет собой логичное пошаговое руководство, в котором подробно описаны многие спецификации и эталонные реализации Java EE 7. Работа с ними продемонстрирована на практических примерах. В этом фундаментальном издании также используется новейшая версия инструмента GlassFish, предназначенного для развертывания и администрирования примеров кода. Книга написана ведущим специалистом по обработке запросов на спецификацию Java EE, членом наблюдательного совета организации Java Community Process (JCP)


Pro Git

Разработчику часто требуется много сторонних инструментов, чтобы создавать и поддерживать проект. Система Git — один из таких инструментов и используется для контроля промежуточных версий вашего приложения, позволяя вам исправлять ошибки, откатывать к старой версии, разрабатывать проект в команде и сливать его потом. В книге вы узнаете об основах работы с Git: установка, ключевые команды, gitHub и многое другое.В книге рассматриваются следующие темы:основы Git;ветвление в Git;Git на сервере;распределённый Git;GitHub;инструменты Git;настройка Git;Git и другие системы контроля версий.


Java 7

Рассмотрено все необходимое для разработки, компиляции, отладки и запуска приложений Java. Изложены практические приемы использования как традиционных, так и новейших конструкций объектно-ориентированного языка Java, графической библиотеки классов Swing, расширенной библиотеки Java 2D, работа со звуком, печать, способы русификации программ. Приведено полное описание нововведений Java SE 7: двоичная запись чисел, строковые варианты разветвлений, "ромбовидный оператор", NIO2, новые средства многопоточности и др.


Фундаментальные алгоритмы и структуры данных в Delphi

Книга "Фундаментальные алгоритмы и структуры данных в Delphi" представляет собой уникальное учебное и справочное пособие по наиболее распространенным алгоритмам манипулирования данными, которые зарекомендовали себя как надежные и проверенные многими поколениями программистов. По данным журнала "Delphi Informant" за 2002 год, эта книга была признана сообществом разработчиков прикладных приложений на Delphi как «самая лучшая книга по практическому применению всех версий Delphi».В книге подробно рассматриваются базовые понятия алгоритмов и основополагающие структуры данных, алгоритмы сортировки, поиска, хеширования, синтаксического разбора, сжатия данных, а также многие другие темы, тесно связанные с прикладным программированием.


Питон — модули, пакеты, классы, экземпляры

Python - объектно-ориентированный язык сверхвысокого уровня. Python, в отличии от Java, не требует исключительно объектной ориентированности, но классы в Python так просто изучить и так удобно использовать, что даже новые и неискушенные пользователи быстро переходят на ОО-подход.


Как пасти котов. Наставление для программистов, руководящих другими программистами

«Как пасти котов» – это книга о лидерстве и руководстве, о том, как первое совмещать со вторым. Это, если хотите, словарь трудных случаев управления IT-проектами. Программист подобен кошке, которая гуляет сама по себе. Так уж исторически сложилось. Именно поэтому так непросто быть руководителем команды разработчиков. Даже если вы еще месяц назад были блестящим и дисциплинированным программистом и вдруг оказались в роли менеджера, вряд ли вы знаете, с чего надо начать, какой выбрать стиль руководства, как нанимать и увольнять сотрудников, проводить совещания, добиваться своевременного выполнения задач.