Чтобы создать или изменить категорию для поиска цитат из документов, выполните следующие действия:
Откроется окно с параметрами категории.
Программа поддерживает работу с файлами, из которых возможно выделить нормализованный текст (такими как DOC, DOCX, ODT, ODP, PDF, PPT, PPTX, RTF, TXT) длиной не менее 1000 символов. Длина нормализованного текста (в символах) – это количество алфавитно-цифровых символов в тексте без учета пробелов, знаков препинания и специальных символов. Длина извлеченного из файлов текста может отличаться от количества символов, подсчитанного в других программах, таких как Microsoft Word.
Рекомендуется загружать в одну категорию документы суммарным объемом не более 2 ГБ.
Программа не хранит в наборе данных категории исходные документы или части этих документов. На основании набора данных, сформированного в категории, невозможно восстановить или прочитать исходные документы или части этих документов.
Программа начнет формировать набор данных категории на основании документов, добавленных в эту категорию. Если при формировании набора данных не удалось обработать некоторые документы, программа отобразит список этих документов с информацией об ошибках обработки. Новая / измененная категория для поиска цитат из документов отобразится в списке категорий и политик.
Чтобы программа начала использовать новую или измененную категорию для поиска цитат из документов, на основе категории вам нужно создать политику.
В начало