Биоинформатика. Порозов Ю.Б. - 7 стр.

UptoLike

Составители: 

Рубрика: 

5
(целые хромосомы организмов) и Structure (трехмерные структуры
белков).
Получение нуклеотидной последовательности
а) Кликните на Nucleotide: вы увидите первую из сотни страниц
результатов. Нам нужно как-то сократить этот список до размеров,
когда с ним будет удобно работать. Чтобы это сделать:
б) Кликните на ссылке Limits. Вы переместитесь на страницу, на
которой можно выбрать среди множества опций для ограничения
вашего поиска.
в) Выберите Title из выпадающего меню Search field tags и нажмите
Search. Вы вернетесь на страницу с результатами и увидите, что
общее их количество значительно сократилось. Однако мы хотим
ограничить наш поиск последовательностей только Escherichia coli
(E. coli). Поэтому:
г) Добавьте «and E coli» в поле поиска после "isocitrate dehydrogenase".
д) Кликните Search. Вы вернетесь на страницу поиска с двумя
результатами, второй из которыхто, что нам нужно.
е) Кликните на номере доступа J02799. Вы перейдете на страницу в
стандартном формате GenBank с документацией и ссылками и
следующей за ней последовательностью ДНК. Мы ещё вернемся к
этим ссылкам, но вначале для того, чтобы убедиться, что файл может
использоваться в программах, нам надо убедиться в том, что он
содержит правильный текст.
ж) Выберите опцию Text в выпадающем меню, начинающемся с Send
To. Это генерирует страницу в формате plain text без ссылок.
з) Выберите Save из меню File браузера и сохраните страницу под
именем J02799.gbk. Тонкость состоит в том, что, хотя этот файл
содержит только ASCII текст, он в формате Unix. ASCII символ,
обозначающий конец строки, различен в Unix, PC и Mac-
платформах.
и) Первая строка показывает нам, что длина последовательности 1568
bp (пар оснований) и последовательность есть ДНК. Собственно
последовательность начинается со строки ORIGIN. Эту строку
можно использовать как индикатор при открытии любых файлов
GenBank.
к) Если вы посмотрите на строки с отступами, следующими за
FEATURES, вы увидите CDS. Это расположение кодирующей
последовательности и содержит часть гена, транслируемой в белок
нуклеотиды 291-1541. Почему не вся генетическая информация
транслируется в аминокислоты белка будет объяснено на лекциях.
Это имеет практическую ценность для анализа последовательности
ДНК.