Интеллектуальные информационные системы. Дубровин А.Д. - 190 стр.

UptoLike

Составители: 

225
проблеме
Информационного
Общества
,
провозглашаем
наше
общее
стремление
и
обязанность
построить
открытое
,
ориентированное
на
человека
и
на
его
развитие
Информационное
Общество
,
в
котором
каждый
может
порождать
информацию
и
знания
,
иметь
к
ним
доступ
и
использовать
их
так
,
чтобы
отдельные
лица
,
человеческие
сообщества
и
народы
могли
полностью
реализовать
свой
потенциал
по
устойчивому
развитию
и
улучшению
качества
жизни
в
полном
соответствии
с
целями
и
принципами
Устава
ООН
и
Всеобщей
Декларацией
Прав
Человека
».
В
Декларации
саммита
сформулирован
принцип
построения
Информационного
Общества
(
ИО
),
прежде
всего
учитывающий
социально
-
политические
,
правовые
и
гуманитарные
аспекты
.
При
этом
особо
подчеркивалась
центральная
роль
науки
в
развитии
ИО
и
в
развитии
информационных и телекоммуникационных технологий
.
Одновременно
указывается
,
что
эти
технологии
не
являются
самоцелью
.
Они
рассматриваются
как
средство
достижения
общечеловеческих
гуманитарных
целей
.
В
Плане
работ
конкретизируются
пути
построения
открытого
ИО
.
При
этом
указывается
,
что
потенциал
человеческих
знаний
и
потенциал
информационных
и
телекоммуникационных
технологий
(
ИТ
и
ТТ
)
следует
направлять
на
достижение
задач
развития
,
одобренных
международным
сообществом
.
Особое
значение
придается
необходимости
сохранения
культурного
многообразия
и
языковой
самобытности
народов
,
населяющих
Землю
.
В
связи
с
этим
подчеркивается
важность
исследований
и
разработок
в
области
машинного
перевода
текстов
с
одних
естественных
языков
на
другие
и
создания
на
этой
основе
эффективных
средств
поиска
информации
в
совокупностях
разноязычных
баз
данных
и
знаний
.
Таким
образом
,
и
в
Декларации
Саммита
,
и
в
Плане
работ
современные
ИТ
и
ТТ
рассматриваются
как
важнейшие
факторы
общественного
развития
.
Следовательно
,
работы
в
области
компьютерной
лингвистики
(
и
сами
по
себе
,
и
в
составе
ИИС
)
приобретают
особое
значение
.
За
последние
полвека
решения
проблемы
использования
естественных
языков
в
различных
информационных
системах
(
в
том
числе
и
в
ИИС
)
характеризуются
результатами
разной
степени
значимости
и
успешности
.
Естественный
язык
сложное
явление
,
непосредственно
связанное
с
процессами
мышления
.
Поэтому
в
лингвистике
вообще
и
в
компьютерной
лингвистике
в
частности
вместе
со
значительными
результатами
есть
много
нерешенных
задач
и
проблем
.
Одной
из
причин
некоторых
неудачных
и
ошибочных
решений
Г
.
Г
.
Белоногов
считает
бытующее
в
среде
лингвистов
заблуждение
в
том
,
что
в
естественных
языках
большинство
словосочетаний
являются
«
свободными
»
от
контекста
конструкциями
.
И
хотя
многие
крупные
лингвисты
(
прежде
всего
Ф
.
де
Соссюр
)
высказывали
иную
точку
зрения
,
это
заблуждение
господствует
в
современном
массовом
сознании
поныне
.
Большинство
лингвистов
и
(
что
особенно
опасно
для
перспектив
развития
ИИС
)
не
лингвистов
считают
,
что
в
естественном
языке
есть
только
ограниченное
число
устойчивых
фразеологических
словосочетаний
(
идиоматических
выражений
),
а
остальные
словосочетания
«
свободные
».
Это
заблуждение
положено
в
основу
почти
всех
известных
формализованных
семантико
синтаксических
моделей
языка
.
Другим
заблуждением
является
представление
лексики
любой
отраслевой
системы
автоматической
обработки
текстовой
информации
сочетанием
только
двух
компонент
лексического
ядра
(
основной
словарный
фонд
естественного
языка
)
и
словаря
отраслевых
терминов
.
Такое
представление
верно
лишь
отчасти
.
Истина
здесь
в
том
,
что
различные
тематические
области
различаются
не
столько
составом
отраслевых
терминов
,
сколько
распределением
вероятностей
появления
этих
терминов
в
текстах
.
Существуют
и
другие
довольно
распространенные
заблуждения
,
но
,
по
мнению
Г
.
Г
.
Белоногова
(2),
объективно
правильными
следует
признать
следующие
положения
,
с
которыми
будут
связаны
успехи
компьютерной
лингвистики
.
Первое
.
В
естественных
языках
и
в
речи
основными
единицами
смысла
являются
морфемы
,
слова
,
словосочетания
,
фразы
и
различного
рода
сверхфразовые
единства
.
Эти
проблеме Информационного Общества, провозглашаем наше общее стремление и
обязанность построить открытое, ориентированное на человека и на его развитие
Информационное Общество, в котором каждый может порождать информацию и знания,
иметь к ним доступ и использовать их так, чтобы отдельные лица, человеческие сообщества
и народы могли полностью реализовать свой потенциал по устойчивому развитию и
улучшению качества жизни в полном соответствии с целями и принципами Устава ООН и
Всеобщей Декларацией Прав Человека».
       В Декларации саммита сформулирован принцип построения Информационного
Общества (ИО), прежде всего учитывающий социально-политические, правовые и
гуманитарные аспекты. При этом особо подчеркивалась центральная роль науки в развитии
ИО и в развитии информационных и телекоммуникационных технологий. Одновременно
указывается, что эти технологии не являются самоцелью. Они рассматриваются как средство
достижения общечеловеческих гуманитарных целей.
       В Плане работ конкретизируются пути построения открытого ИО. При этом
указывается, что потенциал человеческих знаний и потенциал информационных и
телекоммуникационных технологий (ИТ и ТТ) следует направлять на достижение задач
развития, одобренных международным сообществом. Особое значение придается
необходимости сохранения культурного многообразия и языковой самобытности народов,
населяющих Землю. В связи с этим подчеркивается важность исследований и разработок в
области машинного перевода текстов с одних естественных языков на другие и создания на
этой основе эффективных средств поиска информации в совокупностях разноязычных баз
данных и знаний.
       Таким образом, и в Декларации Саммита, и в Плане работ современные ИТ и ТТ
рассматриваются как важнейшие факторы общественного развития. Следовательно, работы
в области компьютерной лингвистики (и сами по себе, и в составе ИИС) приобретают особое
значение.
       За последние полвека решения проблемы использования естественных языков в
различных информационных системах (в том числе и в ИИС) характеризуются результатами
разной степени значимости и успешности. Естественный язык – сложное явление,
непосредственно связанное с процессами мышления. Поэтому в лингвистике вообще и в
компьютерной лингвистике в частности вместе со значительными результатами есть много
нерешенных задач и проблем. Одной из причин некоторых неудачных и ошибочных
решений Г.Г.Белоногов считает бытующее в среде лингвистов заблуждение в том, что в
естественных языках большинство словосочетаний являются «свободными» от контекста
конструкциями. И хотя многие крупные лингвисты (прежде всего – Ф. де Соссюр)
высказывали иную точку зрения, это заблуждение господствует в современном массовом
сознании поныне. Большинство лингвистов и (что особенно опасно для перспектив развития
ИИС) не лингвистов считают, что в естественном языке есть только ограниченное число
устойчивых фразеологических словосочетаний (идиоматических выражений), а остальные
словосочетания – «свободные». Это заблуждение положено в основу почти всех известных
формализованных семантико – синтаксических моделей языка.
       Другим заблуждением является представление лексики любой отраслевой системы
автоматической обработки текстовой информации сочетанием только двух компонент –
лексического ядра (основной словарный фонд естественного языка) и словаря отраслевых
терминов. Такое представление верно лишь отчасти. Истина здесь в том, что различные
тематические области различаются не столько составом отраслевых терминов, сколько
распределением вероятностей появления этих терминов в текстах.
       Существуют и другие довольно распространенные заблуждения, но, по мнению
Г.Г.Белоногова (2), объективно правильными следует признать следующие положения, с
которыми будут связаны успехи компьютерной лингвистики.
       Первое. В естественных языках и в речи основными единицами смысла являются
морфемы, слова, словосочетания, фразы и различного рода сверхфразовые единства. Эти

                                                                                   225