Интеллектуальные информационные системы. Дубровин А.Д. - 191 стр.

UptoLike

Составители: 

226
единицы
в
совокупности
представляют
собой
иерархическую
систему
,
в
которой
смысловое
содержание единиц более высокого уровня не сводимо или не полностью сводимо к
смысловому содержанию составляющих их единиц более низкого уровня
.
Это
означает
,
что
смысл
единиц
более
высокого
уровня
не
может
быть
«
вычислен
»
на
основе
информации
о
смысле
единиц
более
низкого
уровня
и
на
основе
информации
о
связях
между
этими
единицами
.
Второе
.
Минимальной
единицей
смысла
,
обозначающей
понятие
,
является
слово
,
но
большинство
понятий
обозначаются
(
именуются
)
словосочетаниями
.
При
этом
количество
многословных
наименований
понятий
(
фразеологических
единиц
)
в
сотни
раз
больше
,
чем
количество
однословных
наименований
понятий
.
Третье
.
На
основании
общепризнанной
бесспорности
двух
первых
положений
можно
утверждать
,
что
при
автоматической
«
смысловой
»
обработке
текстов
важную
(
если
не
главную
)
роль
играет
их
концептуальный
анализ
.
Задачей
такого
анализа
должно
быть
определение
границ
наименований
понятий
в
текстах
и
установление
синтагматических
и
парадигматических
отношений
между
ними
.
Четвертое
.
Важнейшей
задачей
компьютерной
лингвистики
на
современном
этапе
ее
развития
(
и
с
учетом
ее
роли
в
развитии
ИИС
)
является
составление
достаточно
представительных
словарей
наименований
понятий
,
что
означает
выявление
понятийного
фонда
естественных
языков
.
Этот
фонд
предположительно
будет
содержать
сотни
миллионов
слов
и
фразеологических
словосочетаний
.
Выполнение
этой
задачи
благотворно
повлияет
на
развитие
информационных
технологий
,
связанных
с
автоматической
обработкой
естественно
языковых
текстов
и
информации
.
Пятое
.
Опыт
полувекового
развития
компьютерной
лингвистики
показал
широкие
возможности
конструктивного
алгоритмического
подхода
к
решению
задач
автоматической
обработки
текстов
и
информации
,
представленных
на
естественном
языке
.
Вместе
с
тем
стала
очевидной
и
ограниченность
алгоритмического
подхода
:
в
некоторых
случаях
эффективнее
оказывался
метод
аналогий
.
В
связи
с
этим
у
специалистов
по
компьютерной
лингвистике
и
перспективным
информационным
технологиям
образовалась
точка
зрения
,
согласно
которой
одна
часть
задач
может
решаться
«
по
правилам
» (rule based approach),
а
другая
«
по
аналогии
с
прецедентами
» (example based approach).
Возможны
и
гибридные
подходы
и
технологии
,
в
которых
сочетаются
оба
эти
подхода
.
единицы в совокупности представляют собой иерархическую систему, в которой смысловое
содержание единиц более высокого уровня не сводимо или не полностью сводимо к
смысловому содержанию составляющих их единиц более низкого уровня. Это означает,
что смысл единиц более высокого уровня не может быть «вычислен» на основе информации
о смысле единиц более низкого уровня и на основе информации о связях между этими
единицами.
       Второе. Минимальной единицей смысла, обозначающей понятие, является слово, но
большинство понятий обозначаются (именуются) словосочетаниями. При этом количество
многословных наименований понятий (фразеологических единиц) в сотни раз больше, чем
количество однословных наименований понятий.
       Третье. На основании общепризнанной бесспорности двух первых положений можно
утверждать, что при автоматической «смысловой» обработке текстов важную (если не
главную) роль играет их концептуальный анализ. Задачей такого анализа должно быть
определение границ наименований понятий в текстах и установление синтагматических и
парадигматических отношений между ними.
       Четвертое. Важнейшей задачей компьютерной лингвистики на современном этапе ее
развития (и с учетом ее роли в развитии ИИС) является составление достаточно
представительных словарей наименований понятий, что означает выявление понятийного
фонда естественных языков. Этот фонд предположительно будет содержать сотни
миллионов слов и фразеологических словосочетаний. Выполнение этой задачи благотворно
повлияет на развитие информационных технологий, связанных с автоматической обработкой
естественно языковых текстов и информации.
       Пятое. Опыт полувекового развития компьютерной лингвистики показал широкие
возможности конструктивного алгоритмического подхода к решению задач автоматической
обработки текстов и информации, представленных на естественном языке. Вместе с тем
стала очевидной и ограниченность алгоритмического подхода: в некоторых случаях
эффективнее оказывался метод аналогий. В связи с этим у специалистов по компьютерной
лингвистике и перспективным информационным технологиям образовалась точка зрения,
согласно которой одна часть задач может решаться «по правилам» (rule based approach), а
другая – «по аналогии с прецедентами» (example based approach). Возможны и гибридные
подходы и технологии, в которых сочетаются оба эти подхода.




                                                                                   226