Технологія роботи із структурованими документами у текстовому процесорі MS Word

Призначення текстового процесора – підготовка професійно оформлених документів згідно з правилами сучасного діловодства, використовуючи при цьому не тільки набір тексту, а й можливість застосування різних шрифтів, включення в документ таблиць та графічних зображень, перевірку правопису, автоматичне створення змісту та предметних покажчиків, створення складних документів з декількох файлів різних типів та ін. При цьому на екрані користувач може побачити зображення, максимально наближене до того, яким воно буде після друку на папері.

Сьогодні текстовий процесор Microsoft Word – один з найбільш поширених середовищ створення та редагування документів. Це досить могутній програмний продукт, який надає користувачу широкі можливості якісної підготовки документів.

Він містить потужні бібліотеки стилів і широкий набір засобів форматування і структурування документу. Починаючи з версії MS Word 2003 кожний документ може бути збережений у форматі XML-документа. Щоб зберегти цей документ у форматі XML-документа, потрібно виконати: меню Файл → Сохранить как → у діалоговому вікні вибрати із списку Тип документа Документ XML (див.рис.нижче). Починаючи з версії MS Word 2003, цей редактор може відкривати документи XML.

 

Рис. 3.1.1.

Microsoft Word дозволяє працювати з XML-документами двома способами.

· З використанням XML-схеми Word. Cтворіть документ Word, а потім збережете його як XML-документ. Word використає свою власну XML-схему за назвою WordML для застосування тегів XML, у яких зберігаються відомості про властивості документа й визначається структура документа - абзаци, заголовки й таблиці. Word також використають XML-теги для зберігання відомостей про форматування й структуру документа відповідно до XML-схеми Word.

· З використанням будь-якої XML-схеми. Створіть документ Word або відкрийте його в цьому додатку, приєднайте до документа будь-яку користувальницьку XML-схему, а потім застосуєте XML-теги до вмісту документа. При збереженні у вигляді XML-документа XML-теги визначають структуру документа відповідно до приєднаної XML-схеми.

При збереженні документа до нього приєднуються як схема Word, так і користувальницька схема, щоб зберегти дані відповідно до користувальницької схеми й форматувати текст відповідно до XML-схеми Word. Крім того, відповідно до користувальницької схеми можна зберігати тільки дані документа.

Будь-яке програмне забезпечення, що аналізує дані XML, може також читати й обробляти дані в документі, збереженому у вигляді XML-документа (XML-файл), незалежно від того, чи використалася для структури документа убудована XML-схема Word або приєднана відповідному поставленому завданню користувальницька схема.

Наприклад, якщо користувальницька схема використається для аналізу даних резюме, XML-теги визначають структуру документа через ім'я, адресу, досвід роботи, дату створення й так далі. При збереженні документ містить як форматованный текст, що професійно виглядає після друку документа, так і файл даних, що може бути оброблений будь-якою програмою, призначеної для читання мови XML.

Можна також зберігати дані XML у документі Word (.doc) або у файлі шаблона (.dot). Проте, тільки Word зможе прочитати й обробити XML.

Розмітка за допомогою XML-тегів. Якщо до документа приєднана користувальницька XML-схема, в області завдань Структура XML представляє список елементів, які визначені для схеми. Щоб застосувати XML-теги до документа, виберають зміст документа, а потім виберають елемент зі списку. Якщо в схемі для елемента визначені атрибути, їх також можна вказати в області завдань Структури XML.

Примітка. До документа може бути приєднано кілька схем. В області завдань Структури XML доступен список елементів із всіх приєднаних схем.

Прапорець в області завдань дозволяє побачити XML-теги убудованими, у контексті документа.

Якщо структура документа порушує правила схеми, цей фрагмент документа виділяається фіолетовою хвилястою лінією, а в області завдань Структури XML відображаються відомості про порушення.