Биоинформатика. Порозов Ю.Б. - 33 стр.

UptoLike

Составители: 

Рубрика: 

31
Помощь, документация на patmatdb
http://emboss.sourceforge.net/apps/release/5.0/emboss/apps/patmatdb.h
tml.
2. Используя ScanProsite http://ca.expasy.org/tools/scanprosite/
(Поиск «Motif(s) to scan for:» правое поле), проведите поиск
мотива FMFEGHDTTA среди последовательностей базы
SwissProt (галочкатолько около UniProtKB/Swiss-Prot).
3. Загрузите найденные последовательности в формате Fasta
последовательно откройте каждую найденную последовательность
и нажмите “fasta”. Создайте затем файл multi-fasta все
последовательности в одном файле.
4. Проверьте, что найденные последовательности специфичны в
отношении искомого мотива поместите их в поле Sequences to be
scanned.
Теперь нам нужно попытаться автоматически генерировать
мотивы, определяющие (характеризующие) набор полученных
последовательностей белков Р450, а затем протестировать
качество этих шаблонов:
5. Используйте PRATT (http://www.ebi.ac.uk/Tools/pratt/) это
приложение, которое автоматически составляет регулярные
выражения, описывающие эти последовательности. Пример
работы PRATT – http://www.ii.uib.no/~inge/papers/mdl/small.html.
Произведите обратный поиск по базе SwissProt с
использованием сгенерированных паттернов. Какие
последовательности были найдены?
Эти поиски вернули исходные последовательности?
Какие иные последовательности (если есть) были найдены по
введенным шаблонам? Являются ли они последовательностями
Р450?
Вы можете также использовать приложение IBM TEIRESIAS
http://cbcsrv.watson.ibm.com/Tspd.html для генерации
паттернов\шаблонов.
6. Используйте набор последовательностей P450, который вы сумели
идентифицировать при помощи FMFEGHDTTA в качестве набора
positive examples.
7. Случайным образом разделите этот набор на обучающую и
тестовую выборки (в соотношении обучающая\тестовая между 1:1
и 1:3).
8. Используйте PRATT для обучения (получения) надёжного
паттерна по обучающей выборке.