Не так давно команда Контур.Маркета анонсировала возможность автоматического распознавания загруженных накладных. Она избавляет пользователей от рутинной работы по внесению документов в сервис вручную. Поначалу предполагалось, что будут поддерживаться популярные для изображений форматы, а также документы Word и Excel. Однако тесты показали, что при распознавании текстовых документов, кроме PDF, возникает множество ошибок. Поэтому от них пришлось отказаться. То же самое касается и сканов накладных, которые получаются при использовании приложения Контур.Сканер.
В итоге теперь система хорошо распознает сканы накладных, сохраненные в форматах jpg, jpeg, pdf, png, tif или tiff. Как работает автоматическое распознавание, читайте в отдельной инструкции. При этом важно, чтобы исходные документы были заполнены в общепринятом формате.
Однако отказ от форматов Word и Excel вовсе не означает, что такие накладные нельзя загрузить в сервис автоматически. С текстовыми документами (.doc, .docx, .odt и другими) все просто — сначала нужно сохранить накладную в формате .pdf и уже ее загружать в Контур.Маркет. Если же накладная в формате Excel, то ее предварительно следует распечатать. При этом нужно настроить печать таким образом, чтобы:
- по ширине накладная умещалась на печатном листе;
- если в документе несколько листов, то каждый из них включал шапку.
Если распечатанная накладная удовлетворяет этим требованиям, то файл можно сохранить в .pdf и загрузить в Контур.Маркет для распознавания.
Бумажные накладные нужно либо сканировать, либо фотографировать. Первый вариант предпочтительней, поскольку качество сканированного документа гораздо выше. Если сканера нет, можно сфотографировать накладную на телефон. Однако гарантировать точное распознавание такой накладной разработчики сервиса не могут. Чтобы снизить количество ошибок при распознавании, при фотографировании рекомендуется:
- делать фото при хорошем однородном освещении, без теней;
- расположить камеру строго параллельно документу, чтобы не возникало перспективы;
- размещать на каждом фото только один лист целиком;
- удостовериться, что на фото нет размытых участков.
В дальнейшем разработчики обещают распространить функцию автоматического распознавания и на документы других типов.