Составители:
Рубрика:
32
9. Произведите поиск в тестовом наборе (или в полной базе данных)
по найденному паттерну\шаблону. Вы можете использовать
приложение EMBOSS patmatdb (для поиска с использованием
паттернов, предварительно найденных в обучающем наборе.
Документация на patmatdb – http://emboss.bioinformatics.nl/cgi-
bin/emboss/.
10. Создайте новый тестовый набор с negative examples в fasta-
формате – возьмите последовательности глобинов от разных
организмов (см. предыдущие лаб. работы или Приложение). Тут
мы предполагаем, что последовательности глобинов не содержат
мотив FMFEGHDTTA. Является ли это предположение верным?
Вы можете проверить это предположение, поместив эти
последовательности в поле поиска Sequences to be scanned на
странице поиска ScanProsite, а затем произведите поиск в базе
данных Prosite для того, чтобы увидеть мотивы, соответствующие
последовательностям глобинов.
11. Теперь вы имеете два тестовых набора (позитивный тест-набор из
п.6 и негативный тест-набор с данными о глобинах).
12. Используйте приложение EMBOSS patmatdb для поиска
некоторых паттернов\мотивов, полученных ранее благодаря
PRATT, в позитивном и негативном тест-наборах
последовательностей.
13. Вы должны знать, что в каждом поиске True Positives (TP), True
Negatives (TN), False Positives (FP) и False Negatives (FN) значат
следующее:
− TP – шаблон найден в позитивном наборе;
− FN – шаблон не найден в позитивном наборе;
− FP – шаблон найден в негативном наборе;
− TN – шаблон не найден в негативном наборе.
14. Используйте ваши результаты для подсчета различных
показателей качества для шаблона (см. rating_patterns.pdf).
Убедитесь в том, что когда вы выбираете слабый шаблон,
предложенный PRATT, то и показатели качества будут плохими.
Но что является интуитивным показателем слабого шаблона?
Можете ли вы сказать что-либо, оценить силу паттерна только
глядя на него вне связи с целевыми последовательностями? Всегда
ли короткие паттерны являются слабыми?
15. Проведите обратную проверку – создайте шаблоны-паттерны
для глобинов (теперь они выступают в качестве позитивного
набора). Используйте набор Р450 в качестве негативного. Удалось
ли вам обнаружить дискриминирующие, определяющие шаблоны
для глобинов?
Страницы
- « первая
- ‹ предыдущая
- …
- 32
- 33
- 34
- 35
- 36
- …
- следующая ›
- последняя »