Биоинформатика. Порозов Ю.Б. - 15 стр.

UptoLike

Составители: 

Рубрика: 

13
Лабораторная работа 3
Парное выравнивание
Лабораторная работа 2 была посвящена поиску по базам данный при
помощи сервиса BLAST, который производит парное сравнение
последовательностей и возвращает оценку выравнивания, E-value и
собственно выровненные последовательности. BLAST может производить
парное очень быстро. Например, поиск похожих последовательностей с
использованием участка в 1568 нуклеотидов или 416 аминокислот из
J02799 по базам последовательностей GenBank+EMBL+DDBJ+PDB (без
EST, STS, GSS), то есть среди более чем 3,7 миллионов
последовательностей (~16,5 млрд. нуклеотидов или аминокислот)
производится за вполне приемлемое время. BLAST выполняет это,
разумеется, не производя глобальное выравнивание, но при помощи
определенных эвристических алгоритмов. Однако нужно понимать, что
иные подходы могут быть иногда более эффективными, например, точные
(не эвристические) методы, подходы, базирующиеся на глобальном
выравнивании, глобальное и локальное выравнивание и даже точечные
диаграммы эффективные способы визуального сравнения двух
последовательностей.
Мы будем производить сравнение последовательностей при помощи
пакета EMBOSS:
а) глобальные выравнивания (см. лекции);
б) локальные выравнивания;
в) работа с точечным графикомвизуализация выравнивания.
Для выполнения лабораторной работы вам понадобится пакет EMBOSS,
установленный на локальном компьютере. Документация пакета доступна
в сети Интернет.
Данные, необходимые для работы: последовательность белка hemoglobin
http://en.wikipedia.org/wiki/Hemoglobin (его β-chain, доступна по адресу
http://srs6.ebi.ac.uk/srs6bin/cgi-bin/wgetz?-e+[swissprot-id:HBB_HUMAN]).
1. needle программа, выполняющая глобальное выравнивание
http://en.wikipedia.org/wiki/Sequence_alignment#Global_alignment по
алгоритму Needleman-Wunsch http://en.wikipedia.org/wiki/Needleman-
Wunsch_algorithm.
а) Вы можете использовать needle с параметрами для выполнения
выравнивания и оценки его результатов, а также для генерации
таблицы с оценками выравнивания, идентичности и похожести
последовательностей и количеством вставленных промежутков для:
человеческих последовательностей (по умолчанию);
горилла;