Коллеги, кто-нибудь работал с функцией ИзвлечениеТекста для файлов docx?
Интересны подводные камни, принцип работы.
Синтаксис-помощник читал. Хотелось бы больше подробностей узнать.
(0) Формат таков, это запакованный архив, далее
хml'ки
При разархивации папки и файлы
основная папка Word:
document.xml - текст
settings.xml - главные настройки листа, разметка и т.д.
styles.xml - стили текста
есть еще картинки, они будут храниться в папке media