Составители:
Рубрика:
45
открытия файла (текст из приложения 1 сохраните в отдельном файле
.xml).
5. Вы увидите, что файл с Genia corpus откроется в Language Resourses в
левой панели. Двойной щелчок на ней открывает вторую закладку в
центральном окне. Кликните на Annotation Sets, разверните исходный
список и попробуйте выбирать различные закладки. Вы увидите, что текст
подсвечивается по-разному. Наведение указателя мыши на подсвеченные
части текста вызывает всплывающие окна. Проведите этот опыт. Что
отображается в всплывающих окнах при наведении указателя мыли на
подсвеченный текст?
6. Сохраните неразмеченный текст из приложения 2 в файле .txt. Зайдите
на страницу Lingpipe http://alias-i.com/lingpipe/web/demo-ne.html и
попытайтесь открыть страницу для поиска по тексту Named Entity Demo
on the Web
English Biomedical Text: GENIA Corpus
(TokenShapeChunker). Введите в открывшееся текстовое поле текст из
приложения 2 (неразмеченный текст Genia Corpus). Нажмите кнопку
«Submit Text».
7. Сохраните результаты на диск и затем откройте сохраненный файл
как документ GATE.
8. Внутри окна GATE нажмите Tools
Annotation Diff. Там, где
написано Document (слева вверху в окне Annotation Diff) выберите ваш
документ genia в первом выпадающем меню и ваш результат lingpipe во
втором. Установите Original Markup для обоих в Annotation Set. Кликните
на Do Diff.
9. Обратите внимание на F-score и метки, присвоенные программой и
имеющиеся в «Золотом стандарте». Посмотрите на частичные совпадения
и то, как они соответствуют друг другу – вероятно, будут лишь
незначительные различия в расстановке проделов в двух документах.
10. Сохраните текст из приложения 3 в файле .html.
11. Откройте File
New Language Resource
GATE corpus. Задайте
приемлемое имя и нажмите на иконку со списком справа. Добавьте genia
документ и документ с новостями.
12. Откройте File
Load ANNIE System
With defaults.
13. Сделайте двойной щелчок по новому приложению ANNIE, которое
отображается под Applications на левой панели. Убедитесь в том, что ваш
Corpus документ выбран в выпадающем меню в центральной панели и
нажмите Run.
14. Сделайте двойной щелчок на документе с новостями и разверните
Annotation Sets в верхнем списке. Затем попробуйте выбирать различные
метки, наблюдая за тем, какие аннотации выбирает GATE в этом простом
новостном тексте.
Страницы
- « первая
- ‹ предыдущая
- …
- 45
- 46
- 47
- 48
- 49
- …
- следующая ›
- последняя »