Имя: Пароль:
1C
1С v8
Мусор в XML. Как избавиться?
0 Климов Сергей
 
24.09.25
11:00
Имеем обмен на КД2, файлы.
Источник: древняя как говно мамонта, УТ 10, ещё и изрядно перекуроченная. Платформа 8.3.13.1690. Win 10 корпоративная LTSC. ОЗУ 16Г.
Приёмник: типовая БП3 (базовая).
Источник и приёмник территориально удалены, файлы транспортируются флэшкой.
Проблема: при выгрузке больших файлов внутри XML оказываются недопустимые символы. Причём, как в значениях тегов, так и в самих именах тегов. В данном случае размер файла был 2.7Г, мусор возник в районе строки № 750 000. Проблема плавающая, то есть, то нет. Маленькие файлы выгружаются без проблем.
Подскажите, в какую сторону копать?
1 p-soft
 
24.09.25
11:04
(0) а сам формат xml корректный? именно в идентификаторах и значениях проблема?
2 Мультук
 
гуру
24.09.25
11:04
(0)

ОЗУ без проверки чётности ? Давно тестили на ошибки?
Файлы выгрузки, которые на  компе целые ? или вы сразу на флэшку выгружаете ?
3 craxx
 
24.09.25
11:08
(0) В самой базе могут быть недопустимые символы. Встречал как-то базу, где из экселя копипастили описание со всякими кракозябрами, часть выгрузок из-за этого падала.
4 PLUT
 
гуру
24.09.25
11:08
(0) файлы транспортируются фрешкой...

как вариант, копайте в сторону архиваторов с добавлением данных для восстановления. файл выгрузки архивируете с избытком и на фрешку. можно два, три файла архивов записать. при чтении распакоувываете и сравниваете MD5 было/стало (должны быть одинаковыми)

Программы, поддерживающие работу с информацией для восстановления:
WinRAR — архиватор, позволяющий добавлять в архивы данные для восстановления.
FreeArc — другой архиватор с подобной функцией.
ICE ECC — программа, создающая отдельные файлы с информацией для восстановления
5 LLeonidov
 
24.09.25
11:35
(0) Инфа 77% все дело в комментариях и текстовых полях в которые текст вставляют из экселя. Одно мерзкое поле в миллионах строк данных.. Небось еще перевод каретки...
Что делать?
1) Убрать эти скрытые невидимые символы в каком-то поле в базе источнике. Имхо самое правильное решение.
2) Файл обмена 2.7 гиг это отдельный фейл(но это не точно, может вы там BI на базе 1с мутите)

Вам бы всякие 1с шины, кролики да прочие брокеры обмена.

А в целом можно конечно все эти недопустимые символы убирать до загрузки в самом ХМЛ... Или правила поправить, так чтобы они при выгрузке не появлялись.
Задача на 30 минут под кофе. Отдельно можно сделать не с помощи 1с, а с помощи чего то побыстрей. Но это не так важно.
6 craxx
 
24.09.25
11:12
(4) кстати да, флешка тоже может быть источником проблем.
(0) через Яндекс-диск обмен настроить не вариант?
7 PLUT
 
гуру
24.09.25
11:13
(6) фрешка, пакеты интернета на оленях походу доставляются. какой яндекс-диск?
8 Климов Сергей
 
24.09.25
11:15
(2) Файл на компе-источнике годный. Скорее всего, дело во флэшке. Спасибо! Что-то я недопетрил проверить (((

Всем спасибо за отклики!
9 PLUT
 
гуру
24.09.25
11:15
правильная фрешка должна быть типа такой (с ниггой на картинке)
10 Мультук
 
гуру
24.09.25
11:19
(9)
Можно ли назвать "Джонни мнемоника" флэшкой ? :-)
11 PLUT
 
гуру
24.09.25
11:21
(10) что курили авторы в далеком 1995 году

Самый ценный товар — информация, доставляемая курьерами в их собственном мозгу. Чтобы преуспеть в этом бизнесе, Джонни стёр воспоминания детства и расширил память, но этого всё равно оказалось мало для того объёма информации, который он взялся доставить. Если её вовремя не выгрузить, то Джонни погибнет
12 Климов Сергей
 
24.09.25
11:22
(9) Если глючит USB контроллер, то это не спасёт.
13 PLUT
 
гуру
24.09.25
11:27
(12) контрольная сумма, даже 1С на сайте обновлений всегда эту самую КС публикует. можно скачать файл и для параноиков убедиться, что КС совпадает (на случай глюков контроллеров и каналов связи и памяти и мошейников)
14 Климов Сергей
 
24.09.25
11:30
(13) У вас слишком хорошее представление о техническом уровне пользователей :-) Предложение архивировать файл перед записью на флэшку вызывает смущение.
15 PLUT
 
гуру
24.09.25
11:37
(14) уровень пользователей - биоробот/бабаробот

читает инструкцию и выполняет её

инструкцию канешна кто-то взрослый должен написать
16 Мультук
 
гуру
24.09.25
11:38
(14)

Пользователю нужно просто запустить скрипт -- bat-файл, например.

Стандартная выгрузка умеет zip-файлы, даже в УТ10
17 Климов Сергей
 
24.09.25
11:41
(16) Тут настолько древняя версия "Универсального обмена в формате XML", что даже зиповать она не умеет. Сам был удивлён.
18 craxx
 
24.09.25
12:31
(17) Вы ж программист, там три строчки кода написать чтоб зазиповать