Корпоративные информационные системы. Борисов Д.Н. - 56 стр.

UptoLike

Составители: 

2. Организация учета бумажных и микрографических документов.
Архивная система кроме работы с электронными документами
должна обеспечивать работу с бумажными и микрографическими
документами. В этом случае система должна хранить только электронную
карточку на документ данного типа и поддерживать контроль стандартных
архивных операций: выдача документа, возврат документа и пр.
3. Организация поиска документов.
Наряду с организацией хранения документов необходимо их быстро и
эффективно искать. Существует два подхода к поиску документов.
Первый подход состоит в том, что в процессе поиска ищется
документ, который точно существует в системе, и задача состоит в том,
чтобы процесс поиска свелся к нахождению требуемого документа или
документов. Этот подход применятся в 90 % всех случаев поиска. Второй
подход состоит в том, что ищутся все документы по интересующему
вопросу. Для этого подхода присущи такие понятия, как полнота
соответствие между найденными документами по данному запросу и
действительному списку документов и шумсоответствие документов,
отвечающих запросу и документов, нерелевантных ему.
Существует два основных типа поиска. Атрибутивныйкаждому
документу присваивается набор определенных атрибутов, присваиваемых
документу во время его размещения в архиве. В дальнейшем документ
ищется на совпадение значений этих атрибутов полям запроса. К
атрибутам документа можно отнести имя документа, время создания,
автор, машинистка, имя подразделения, тип документа (факс, письмо,
контракт, спецификация и т. д.). Совокупность атрибутов документа
называется карточкой документа. Эти поля могут заполняться произвольно
или из предопределенных справочников.
Второй тип поискаполнотекстовый. В этом случае автоматически
обрабатывается все содержание документа, и затем по любому слову,
входящему в данный документ, можно найти сам документ.
Соответственно существует зависимость между типами поиска и
подходами к поиску.
Для поиска известного документа, более применим атрибутивный
поиск, для исследовательского поискаполнотекстовый. Существует
комбинация полнотекстового и атрибутивного поиска, когда атрибуты
документа обрабатываются так же, как все содержание документа.
Полнотекстовый поиск зависит от формата документа и языка, на котором
он создан. Электронный документ любого формата необходимо
предварительно преобразовывать в стандартный текст для обработки
системой полнотекстового поиска. Зависимость от языка выражается в
следующих факторах: поиск документа будет более полным, если в
результате запроса будут найдены не только документы, которые точно
соответствуют слову в запросе, но и те документы, в которых
56
    2. Организация учета бумажных и микрографических документов.
    Архивная система кроме работы с электронными документами
должна обеспечивать работу с бумажными и микрографическими
документами. В этом случае система должна хранить только электронную
карточку на документ данного типа и поддерживать контроль стандартных
архивных операций: выдача документа, возврат документа и пр.
    3. Организация поиска документов.
    Наряду с организацией хранения документов необходимо их быстро и
эффективно искать. Существует два подхода к поиску документов.
    Первый подход состоит в том, что в процессе поиска ищется
документ, который точно существует в системе, и задача состоит в том,
чтобы процесс поиска свелся к нахождению требуемого документа или
документов. Этот подход применятся в 90 % всех случаев поиска. Второй
подход состоит в том, что ищутся все документы по интересующему
вопросу. Для этого подхода присущи такие понятия, как полнота –
соответствие между найденными документами по данному запросу и
действительному списку документов и шум – соответствие документов,
отвечающих запросу и документов, нерелевантных ему.
    Существует два основных типа поиска. Атрибутивный – каждому
документу присваивается набор определенных атрибутов, присваиваемых
документу во время его размещения в архиве. В дальнейшем документ
ищется на совпадение значений этих атрибутов полям запроса. К
атрибутам документа можно отнести имя документа, время создания,
автор, машинистка, имя подразделения, тип документа (факс, письмо,
контракт, спецификация и т. д.). Совокупность атрибутов документа
называется карточкой документа. Эти поля могут заполняться произвольно
или из предопределенных справочников.
    Второй тип поиска – полнотекстовый. В этом случае автоматически
обрабатывается все содержание документа, и затем по любому слову,
входящему в данный документ, можно найти сам документ.
Соответственно существует зависимость между типами поиска и
подходами к поиску.
    Для поиска известного документа, более применим атрибутивный
поиск, для исследовательского поиска – полнотекстовый. Существует
комбинация полнотекстового и атрибутивного поиска, когда атрибуты
документа обрабатываются так же, как все содержание документа.
Полнотекстовый поиск зависит от формата документа и языка, на котором
он создан. Электронный документ любого формата необходимо
предварительно преобразовывать в стандартный текст для обработки
системой полнотекстового поиска. Зависимость от языка выражается в
следующих факторах: поиск документа будет более полным, если в
результате запроса будут найдены не только документы, которые точно
соответствуют слову в запросе, но и те документы, в которых
                                 56