Біоінформатика наука, що займається вивченням організації та функціонування біологічних систем різного рівня (від молекулярного до популяційного) на основі


Скачати 2.37 Mb.
Назва Біоінформатика наука, що займається вивченням організації та функціонування біологічних систем різного рівня (від молекулярного до популяційного) на основі
Сторінка 8/20
Дата 19.04.2013
Розмір 2.37 Mb.
Тип Документи
bibl.com.ua > Інформатика > Документи
1   ...   4   5   6   7   8   9   10   11   ...   20

Тип информации, хранимой в каждой из упомянутых вторичных баз данных, отличен. И все же эти ресурсы построены на общем принципе, согласно которому гомологичные последовательности могут быть собра­ны вместе во множественные выравнивания, в пределах которых находятся консервативные области, которые показывают незначительные изменения (или отсутствие таковых) между рассматриваемыми последовательностя­ми. Эти консервативные области, или мотивы, обычно отвечают за выпол­нение некоторой жизненно важной биологической роли (то есть прямо или косвенно влияют на структуру или функцию белка).

Одна из целей анализа последовательностей заключается в проекти­ровании вычислительных методов, которые помогают привязывать функ­циональную и структурную информацию к еще не описанным последовательностям; это достигается за счет поиска в первичных базах данных, назначение которого состоит в установлении связей этих новых последова­тельностей с уже известными последовательностями. Таким образом, по­иск в пределах какой-либо одной базы данных проводят для того, чтобы установить, какие из последовательностей связаны между собой (истин­ное совпадение), а какие — нет (истинные несовпадения). Для улучшения диагностических показателей необходимо отмечать возможно больше ис­тинных совпадений членов семейства и включать в их число как можно меньше (желательно ни одного) ложных совпадений.

База данных «Просайт»

«Просайт» — первая вторичная база данных. Главная причина ее по­явления была связана с тем, что семейства белков могут быть достаточно просто и эффективно охарактеризованы по единственному наиболее консер­вативному мотиву, найденному во множественном выравнивании известных гомологов; такие мотивы обычно кодируют ключевые биологические функ­ции (например, активные участки ферментов, участки связывания лигандов или металлов и т. д.). Поиск в такой базе данных в принципе должен дать ответ на вопросы о принадлежности новой последовательности к какому-либо семейству белков и о возможности содержания в ней определенного домена или активного участка.

База данных «ПРИНТС»

Известно, что большую часть семейств белка можно охарактеризовать не по одному, а по нескольким консервативным мотивам. Поэтому для по­строения диагностических сигнатур членства в семействах имеет смысл использовать многие (или все) мотивы. Этот принцип положен в осно­ву развития базы данных индикаторов «ПРИНТС». Индикаторы, по сути, обеспечивают улучшенную достоверность диагностики по сравнению с ме­тодами единственного мотива — за счет взаимного контекста, обеспеченного мотивами-соседями; другими словами, если некоторая последовательность запроса оказывается не соответствующей всем мотивам в данном индика­торе, то картина совпадений, сформированная остальными мотивами, все же позволяет оператору сделать вполне достоверное заключение.

База данных «Блоки»

База данных множественных мотивов, известная под названием «Бло­ки», была создана путем автоматического обнаружения наиболее консерва­тивных областей в каждом семействе белков.

Ограничения принципа установления дальних гомологов по регуляр­ному выражению привели к созданию компендиума профилей. Оказалось, что изменчивые области между консервативными мотивами также содержат ценную информацию о последовательности. Таким образом, полное вырав­нивание последовательностей фактически становится дискриминатором.

смм

Альтернатива использования профилей — кодирование выравнивания в форме скрытых марковских моделей (СММ). Последние представляют собой математические описания, основанные на статистике и состоящие из линейных цепей состояний «совпадение», «удаление» или «вставка», по­средством которых кодируют консервативность последовательностей в вы­равниваниях членов семейств. Набор СММ для целого ряда белковых до­менов находится в базе данных «Пфам».

Базы данных «АЙДЕНТИФАЙ», «КЭГГ» и «МЕДЛАЙН»

База данных «АЙДЕНТИФАЙ» — еще один третичный ресурс, по­лученный путем автоматической обработки содержимого БД «Блоки» и «ПРИНТС». «КЭГГ» (KEGG - Kyoto Encyclopedia of Genes and Genomes — «Киотская энциклопедия генов и геномов») — база данных ме­таболических путей. В ней собраны отдельные геномы, продукты генов и их функции, а также сопутствующая биохимическая и генетическая ин­формация. «МЕДЛАЙН» объединяет в себе медицинскую литературу и со­держит большое число статей по молекулярной биологии. Она включена в «Пубмед» (PubMed) — библиографическую базу данных, предлагающую аннотации научных статей.

Ниже приведены адреса этих ресурсов в сети:

GenBank http://www.ncbi.nlm.nih.gov/GenBank/GenbankOver

EMBL http://www.eli.ac.uk/embl/index.html

DDBJ http://www.ddbj.nig.ac.jp/

PIR http://www.pir.georgetown.edu/

MIPS http://www.mips.biochem.mpg.de/

Swiss-PROT http://pir.georgetown.edu/pirwww/dlinfo/nrl 3d.h

OWL http://www.bioinf.man.ac.uk/dbbrowser/OWL/

PROSITE http://www.expasy.ch/prosite/

PRINTS http://www.bioinf.man.ac.uk/dbbrowser/PRTNTS/

BLOCKS http://www.blocks.fhcrc.org/

Profiles http://www.isrec.isb-sib.ch/sorr^

Pfam http://www.sanger.ac.uk/soirware/Pfam/

IDENTIFY http://dna.stanford.EDU/identify/

Proweb h1xp://www.proweb.org/kinetin/ProWeb.html

SCOP http://scop.mrc-lmb.cam.ac.uk/scop/

CATH http://www.biochem.ucl.ac.uk^srn/cath/

Библиографические базы данных и «Виртуальная библиотека»

Публикация есть ядро каждого научного изыскания. Это общий для всех ученых процесс, посредством которого научная информация просмат­ривается, оценивается, распространяется и в конечном счете обретает фор­му записи в нетленном журнале научного прогресса. Библиографические базы данных (также известные как информационные базы данных или базы знаний) содержат опубликованные статьи, аннотации и избранные полно­ценные статьи со ссылками на отдельные записи в БД. Хотя существует множество библиографических баз данных, наибольшую популярность за­служили «Пубмед» и «АГРИКОЛА» (AGRICOLA), поскольку они обеспе­чивают постоянно обновляемую информацию, собранную из многочислен­ных источников.

«Пубмед»

«Пубмед» обслуживается «Национальной медицинской библиотекой» (США) и включает в себя библиографическую базу данных «МЕДЛАЙН», а также содержит ссылки на избранные полные статьи на веб-сайтах издательств научных журналов. Она предлагает аннотации к научным ста­тьям и объединена с другими средствами выборки информации, разработан­ными в структурах «Национального центра биотехнологической информа­ции». Научные журналы обычно помещают на своих веб-узлах оглавление и в некоторых случаях — полные статьи. СУБД «Пубмед» относится к ре­ляционному типу, и поэтому результатам запроса сопутствуют ссылки на записи «Генбанка», «БДБ» и т.д. Поиск в базе данных «Пубмед» может быть проведен через следующие веб-узлы:

http://www.ncbi.nlm.nih.gov/PubMed/ http://www.pubmedcentral.nih.gov

«АГРИКОЛА»

«АГРИКОЛА» (AGRICOLA) — аббревиатура названия Agricultural Online Access (сетевой доступ к литературе по сельскому хозяйству). Это библиографическая база данных, которая обеспечивает ссылки на ли­тературу по сельскому хозяйству и поддерживается «Национальной сель­скохозяйственной библиотекой» и некоторыми другими сотрудничающими организациями. Ссылки обеспечивают доступ к публикациям и ресурсам, относящимся ко всем отраслям сельского хозяйства: ветеринарии, растение­водству, лесоводству, водному хозяйству и рыболовству, пищевой промыш­ленности и диетологии человека, охране земельных фондов и окружающей среды. Поиск в этой базе следует начинать с нижеуказанного веб-узла:

http ://www/nal .usda.gov/ ag98/
«Виртуальная библиотека»

Помещенная в сети «Виртуальная библиотека» предоставляет доступ к веб-узлам ценных информационных ресурсов. Она содержит коллекцию ссылок, открывающих путь к различным виртуальным журналам и биб­лиографическим базам данных. Виртуальные библиотеки могут быть клас­сифицированы на различные группы, объединяющие ссылки на различные виртуальные журналы, библиографические базы данных и обеспечивающие доступ к различным библиотекам институтов, форумам и конференциям, веб-узлам с обучающими программами, образовательным узлам, источни­кам предоставления грантов и финансирования научно-исследовательских программ, веб-узлам правительственных и регулятивных органов и т.д. Наиболее популярный веб-узел «Виртуальной библиотеки» следующий:

http://www.vlib.org

Можно выделить также группы виртуальных библиотек, специализи­рованных на различных дисциплинах например микробиологии, биохимии, и т.д. Многие издатели имеют свои собственные веб-узлы и помещают на них виртуальные журналы (например, «Нейче»: www.nature.com). Эти уз­лы обеспечивают свободный доступ к оглавлению и аннотациям статей.
Специализированные средства анализа

Поиск гомологии составляет лишь одну сторону процесса анализа. Из­вестны также многие другие инструменты исследования, как-то: профили гидропатии, применяемые для обнаружения возможных трансмембранных доменов и (или) гидрофобных ядер белковых молекул; винтовые колеса, служащие для определения предполагаемых амфипатических спиралей; ал­горитмы выравнивания последовательностей и построения филогенетиче­ских деревьев, используемые для составления карт эволюционных связей; диаграммы предсказания вторичных структур — для определения местопо­ложения а-спиралей и /3-нитей; многие другие средства.

Очевидное неудобство в использовании целого набора методов для эффективного анализа последовательностей привело к разработке про­граммных пакетов, объединяющих все разнообразие этих методов в од­ной упаковке и устраняющих необходимость применять разные программы с различными интерфейсами, с отличающимися входными требованиями и разнородными форматами выхода.

Очередные обновленные версии баз данных последовательностей ДНК и белков появляются каждые три-четыре месяца. В промежутки между вы­ходом основных версий новые расшифрованные последовательности до­бавляются к ежедневно обновляемым файлам. Для регулярного обновле­ния установленных на ПК баз данных были разработаны синхронизиро­ванные ППФ-сценарии (например, программы календарного планирования типа «Хрон» (Сгоп) для ОС «Юникс»). С помощью такой системы можно относительно легко отслеживать обновления отдельных баз данных, одна­ко эта задача становится обременительной для машины, когда необходимо проверять и слиять с собственным ресурсом сразу несколько баз данных (например, «Генбанк», «ЕЛМБ», «Свисс-прот» и «РИБ»). Более того, при появлении новых баз данных многие стремятся загрузить их и установить на собственный ПК; следовательно, имеющиеся сценарии тоже должны пери­одически обновляться, чтобы включать в панораму обзора новые ресурсы.

Существует несколько известных пакетов, которые содержат доволь­но широкий набор программных средств анализа последовательностей ДНК и белков. Эти пакеты развивались, полнились новыми программами и по прошествии ряда лет стали достаточно универсальными средствами анализа.
Пакет «ДКГ»

Наиболее известный продукт из имеющегося в продаже программно­го обеспечения анализа последовательностей — пакет «ДКГ» (принадлежит «Оксфорд молекулар груп»). Он был разработан «Джинетикс компьютер груп» (575 Science Drive, Madison, Wisconsin, USA 53711) и вначале пред­ставлял собой набор средств анализа последовательностей нуклеиновых кислот, но в свое время включил в себя дополнительные программы анали­за белковых последовательностей.

С помощью «ДКГ» можно обращаться как ко многим из часто исполь­зуемых баз данных последовательностей (например, «Генбанк», «ЕЛМБ», «РИБ» и «Свисс-прот»), так и к ряду специализированных баз данных и ре­сурсов мотивов (типа «Просайт», «БДФТ» («База данных факторов транс­крипции» — Transcription Factor Database, TFD) и «РЕБАЗА» (REBASE -Restriction Enzyme dataBASE — база данных рестриктаз). Особым достоин­ством системы пакета «ДКГ» является возможность относительно легкой ее настройки под конкретного пользователя, желающего, положим, обеспечить себе доступ к каким-либо дополнительным базам данных. Поисковая си­стема комплекта разделяет «ЕЛМБ» и «Генбанк» на различные секции, что позволяет сократить время поиска, направляя запросы только к необходи­мым отделам баз данных. Так, например, последовательности в «Генбанке» и «ЕЛМБ» можно искать совместно, по отдельности или по определенным таксономическим категориям (например: вирусы, бактерии, грызуны и т. д.).
1   ...   4   5   6   7   8   9   10   11   ...   20

Схожі:

Гриби – це одна з найбільших у природі груп організмів. Їх вивченням...
Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»...
*Кроманьйонець
Наука про минуле, що займається вивченням матеріальних предметів (артефактів) діяльності людини
Тема Гриби Загальна характеристика грибів. Різноманітність грибів
Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»...
1 Значення і теоретичні основи фінансового аналізу
Дана спеціальність передбачає вивчення процесів формування і виконання бюджетів різного рівня, механізму управління державним боргом,...
Оповідь, переказ про відоме, досліджене минуле наука, яка займається...
Рід — доісторична і ранньоісторична суспільно-організаційна спільнота, стадія еволюції Етносу, до якої належали кровно пов'язані...
Цієї презентації – Електродинаміка Медико біологічних систем. Створював...
Я, Лесюк Анастасія Юріївна приймала активну участь у класному і позакласному житті Українського медичного ліцею 11-В класу. Писала...
ОБҐРУНТУВАННЯ
Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах....
ОБҐРУНТУВАННЯ
Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах....
ПРОГРАМА З МАТЕМАТИКИ для 10 11 класів загальноосвітніх навчальних...
Програма призначена для організації навчання математики в класах з поглибленим вивченням математики. Вона розроблена на основі Державного...
1 Менеджмент при процесному підході – це
Досягнення високого рівня ефективності організації на основі використання знань та навичок підлеглих
Додайте кнопку на своєму сайті:
Портал навчання


При копіюванні матеріалу обов'язкове зазначення активного посилання © 2013
звернутися до адміністрації
bibl.com.ua
Головна сторінка