|
Скачати 2.37 Mb.
|
Тип информации, хранимой в каждой из упомянутых вторичных баз данных, отличен. И все же эти ресурсы построены на общем принципе, согласно которому гомологичные последовательности могут быть собраны вместе во множественные выравнивания, в пределах которых находятся консервативные области, которые показывают незначительные изменения (или отсутствие таковых) между рассматриваемыми последовательностями. Эти консервативные области, или мотивы, обычно отвечают за выполнение некоторой жизненно важной биологической роли (то есть прямо или косвенно влияют на структуру или функцию белка). Одна из целей анализа последовательностей заключается в проектировании вычислительных методов, которые помогают привязывать функциональную и структурную информацию к еще не описанным последовательностям; это достигается за счет поиска в первичных базах данных, назначение которого состоит в установлении связей этих новых последовательностей с уже известными последовательностями. Таким образом, поиск в пределах какой-либо одной базы данных проводят для того, чтобы установить, какие из последовательностей связаны между собой (истинное совпадение), а какие — нет (истинные несовпадения). Для улучшения диагностических показателей необходимо отмечать возможно больше истинных совпадений членов семейства и включать в их число как можно меньше (желательно ни одного) ложных совпадений. База данных «Просайт» «Просайт» — первая вторичная база данных. Главная причина ее появления была связана с тем, что семейства белков могут быть достаточно просто и эффективно охарактеризованы по единственному наиболее консервативному мотиву, найденному во множественном выравнивании известных гомологов; такие мотивы обычно кодируют ключевые биологические функции (например, активные участки ферментов, участки связывания лигандов или металлов и т. д.). Поиск в такой базе данных в принципе должен дать ответ на вопросы о принадлежности новой последовательности к какому-либо семейству белков и о возможности содержания в ней определенного домена или активного участка. База данных «ПРИНТС» Известно, что большую часть семейств белка можно охарактеризовать не по одному, а по нескольким консервативным мотивам. Поэтому для построения диагностических сигнатур членства в семействах имеет смысл использовать многие (или все) мотивы. Этот принцип положен в основу развития базы данных индикаторов «ПРИНТС». Индикаторы, по сути, обеспечивают улучшенную достоверность диагностики по сравнению с методами единственного мотива — за счет взаимного контекста, обеспеченного мотивами-соседями; другими словами, если некоторая последовательность запроса оказывается не соответствующей всем мотивам в данном индикаторе, то картина совпадений, сформированная остальными мотивами, все же позволяет оператору сделать вполне достоверное заключение. База данных «Блоки» База данных множественных мотивов, известная под названием «Блоки», была создана путем автоматического обнаружения наиболее консервативных областей в каждом семействе белков. Ограничения принципа установления дальних гомологов по регулярному выражению привели к созданию компендиума профилей. Оказалось, что изменчивые области между консервативными мотивами также содержат ценную информацию о последовательности. Таким образом, полное выравнивание последовательностей фактически становится дискриминатором. смм Альтернатива использования профилей — кодирование выравнивания в форме скрытых марковских моделей (СММ). Последние представляют собой математические описания, основанные на статистике и состоящие из линейных цепей состояний «совпадение», «удаление» или «вставка», посредством которых кодируют консервативность последовательностей в выравниваниях членов семейств. Набор СММ для целого ряда белковых доменов находится в базе данных «Пфам». Базы данных «АЙДЕНТИФАЙ», «КЭГГ» и «МЕДЛАЙН» База данных «АЙДЕНТИФАЙ» — еще один третичный ресурс, полученный путем автоматической обработки содержимого БД «Блоки» и «ПРИНТС». «КЭГГ» (KEGG - Kyoto Encyclopedia of Genes and Genomes — «Киотская энциклопедия генов и геномов») — база данных метаболических путей. В ней собраны отдельные геномы, продукты генов и их функции, а также сопутствующая биохимическая и генетическая информация. «МЕДЛАЙН» объединяет в себе медицинскую литературу и содержит большое число статей по молекулярной биологии. Она включена в «Пубмед» (PubMed) — библиографическую базу данных, предлагающую аннотации научных статей. Ниже приведены адреса этих ресурсов в сети: GenBank http://www.ncbi.nlm.nih.gov/GenBank/GenbankOver EMBL http://www.eli.ac.uk/embl/index.html DDBJ http://www.ddbj.nig.ac.jp/ PIR http://www.pir.georgetown.edu/ MIPS http://www.mips.biochem.mpg.de/ Swiss-PROT http://pir.georgetown.edu/pirwww/dlinfo/nrl 3d.h OWL http://www.bioinf.man.ac.uk/dbbrowser/OWL/ PROSITE http://www.expasy.ch/prosite/ PRINTS http://www.bioinf.man.ac.uk/dbbrowser/PRTNTS/ BLOCKS http://www.blocks.fhcrc.org/ Profiles http://www.isrec.isb-sib.ch/sorr^ Pfam http://www.sanger.ac.uk/soirware/Pfam/ IDENTIFY http://dna.stanford.EDU/identify/ Proweb h1xp://www.proweb.org/kinetin/ProWeb.html SCOP http://scop.mrc-lmb.cam.ac.uk/scop/ CATH http://www.biochem.ucl.ac.uk^srn/cath/ Библиографические базы данных и «Виртуальная библиотека» Публикация есть ядро каждого научного изыскания. Это общий для всех ученых процесс, посредством которого научная информация просматривается, оценивается, распространяется и в конечном счете обретает форму записи в нетленном журнале научного прогресса. Библиографические базы данных (также известные как информационные базы данных или базы знаний) содержат опубликованные статьи, аннотации и избранные полноценные статьи со ссылками на отдельные записи в БД. Хотя существует множество библиографических баз данных, наибольшую популярность заслужили «Пубмед» и «АГРИКОЛА» (AGRICOLA), поскольку они обеспечивают постоянно обновляемую информацию, собранную из многочисленных источников. «Пубмед» «Пубмед» обслуживается «Национальной медицинской библиотекой» (США) и включает в себя библиографическую базу данных «МЕДЛАЙН», а также содержит ссылки на избранные полные статьи на веб-сайтах издательств научных журналов. Она предлагает аннотации к научным статьям и объединена с другими средствами выборки информации, разработанными в структурах «Национального центра биотехнологической информации». Научные журналы обычно помещают на своих веб-узлах оглавление и в некоторых случаях — полные статьи. СУБД «Пубмед» относится к реляционному типу, и поэтому результатам запроса сопутствуют ссылки на записи «Генбанка», «БДБ» и т.д. Поиск в базе данных «Пубмед» может быть проведен через следующие веб-узлы: http://www.ncbi.nlm.nih.gov/PubMed/ http://www.pubmedcentral.nih.gov «АГРИКОЛА» «АГРИКОЛА» (AGRICOLA) — аббревиатура названия Agricultural Online Access (сетевой доступ к литературе по сельскому хозяйству). Это библиографическая база данных, которая обеспечивает ссылки на литературу по сельскому хозяйству и поддерживается «Национальной сельскохозяйственной библиотекой» и некоторыми другими сотрудничающими организациями. Ссылки обеспечивают доступ к публикациям и ресурсам, относящимся ко всем отраслям сельского хозяйства: ветеринарии, растениеводству, лесоводству, водному хозяйству и рыболовству, пищевой промышленности и диетологии человека, охране земельных фондов и окружающей среды. Поиск в этой базе следует начинать с нижеуказанного веб-узла: http ://www/nal .usda.gov/ ag98/ «Виртуальная библиотека» Помещенная в сети «Виртуальная библиотека» предоставляет доступ к веб-узлам ценных информационных ресурсов. Она содержит коллекцию ссылок, открывающих путь к различным виртуальным журналам и библиографическим базам данных. Виртуальные библиотеки могут быть классифицированы на различные группы, объединяющие ссылки на различные виртуальные журналы, библиографические базы данных и обеспечивающие доступ к различным библиотекам институтов, форумам и конференциям, веб-узлам с обучающими программами, образовательным узлам, источникам предоставления грантов и финансирования научно-исследовательских программ, веб-узлам правительственных и регулятивных органов и т.д. Наиболее популярный веб-узел «Виртуальной библиотеки» следующий: http://www.vlib.org Можно выделить также группы виртуальных библиотек, специализированных на различных дисциплинах например микробиологии, биохимии, и т.д. Многие издатели имеют свои собственные веб-узлы и помещают на них виртуальные журналы (например, «Нейче»: www.nature.com). Эти узлы обеспечивают свободный доступ к оглавлению и аннотациям статей. Специализированные средства анализа Поиск гомологии составляет лишь одну сторону процесса анализа. Известны также многие другие инструменты исследования, как-то: профили гидропатии, применяемые для обнаружения возможных трансмембранных доменов и (или) гидрофобных ядер белковых молекул; винтовые колеса, служащие для определения предполагаемых амфипатических спиралей; алгоритмы выравнивания последовательностей и построения филогенетических деревьев, используемые для составления карт эволюционных связей; диаграммы предсказания вторичных структур — для определения местоположения а-спиралей и /3-нитей; многие другие средства. Очевидное неудобство в использовании целого набора методов для эффективного анализа последовательностей привело к разработке программных пакетов, объединяющих все разнообразие этих методов в одной упаковке и устраняющих необходимость применять разные программы с различными интерфейсами, с отличающимися входными требованиями и разнородными форматами выхода. Очередные обновленные версии баз данных последовательностей ДНК и белков появляются каждые три-четыре месяца. В промежутки между выходом основных версий новые расшифрованные последовательности добавляются к ежедневно обновляемым файлам. Для регулярного обновления установленных на ПК баз данных были разработаны синхронизированные ППФ-сценарии (например, программы календарного планирования типа «Хрон» (Сгоп) для ОС «Юникс»). С помощью такой системы можно относительно легко отслеживать обновления отдельных баз данных, однако эта задача становится обременительной для машины, когда необходимо проверять и слиять с собственным ресурсом сразу несколько баз данных (например, «Генбанк», «ЕЛМБ», «Свисс-прот» и «РИБ»). Более того, при появлении новых баз данных многие стремятся загрузить их и установить на собственный ПК; следовательно, имеющиеся сценарии тоже должны периодически обновляться, чтобы включать в панораму обзора новые ресурсы. Существует несколько известных пакетов, которые содержат довольно широкий набор программных средств анализа последовательностей ДНК и белков. Эти пакеты развивались, полнились новыми программами и по прошествии ряда лет стали достаточно универсальными средствами анализа. Пакет «ДКГ» Наиболее известный продукт из имеющегося в продаже программного обеспечения анализа последовательностей — пакет «ДКГ» (принадлежит «Оксфорд молекулар груп»). Он был разработан «Джинетикс компьютер груп» (575 Science Drive, Madison, Wisconsin, USA 53711) и вначале представлял собой набор средств анализа последовательностей нуклеиновых кислот, но в свое время включил в себя дополнительные программы анализа белковых последовательностей. С помощью «ДКГ» можно обращаться как ко многим из часто используемых баз данных последовательностей (например, «Генбанк», «ЕЛМБ», «РИБ» и «Свисс-прот»), так и к ряду специализированных баз данных и ресурсов мотивов (типа «Просайт», «БДФТ» («База данных факторов транскрипции» — Transcription Factor Database, TFD) и «РЕБАЗА» (REBASE -Restriction Enzyme dataBASE — база данных рестриктаз). Особым достоинством системы пакета «ДКГ» является возможность относительно легкой ее настройки под конкретного пользователя, желающего, положим, обеспечить себе доступ к каким-либо дополнительным базам данных. Поисковая система комплекта разделяет «ЕЛМБ» и «Генбанк» на различные секции, что позволяет сократить время поиска, направляя запросы только к необходимым отделам баз данных. Так, например, последовательности в «Генбанке» и «ЕЛМБ» можно искать совместно, по отдельности или по определенным таксономическим категориям (например: вирусы, бактерии, грызуны и т. д.). |
Гриби – це одна з найбільших у природі груп організмів. Їх вивченням... Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»... |
*Кроманьйонець Наука про минуле, що займається вивченням матеріальних предметів (артефактів) діяльності людини |
Тема Гриби Загальна характеристика грибів. Різноманітність грибів Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»... |
1 Значення і теоретичні основи фінансового аналізу Дана спеціальність передбачає вивчення процесів формування і виконання бюджетів різного рівня, механізму управління державним боргом,... |
Оповідь, переказ про відоме, досліджене минуле наука, яка займається... Рід — доісторична і ранньоісторична суспільно-організаційна спільнота, стадія еволюції Етносу, до якої належали кровно пов'язані... |
Цієї презентації – Електродинаміка Медико біологічних систем. Створював... Я, Лесюк Анастасія Юріївна приймала активну участь у класному і позакласному житті Українського медичного ліцею 11-В класу. Писала... |
ОБҐРУНТУВАННЯ Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах.... |
ОБҐРУНТУВАННЯ Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах.... |
ПРОГРАМА З МАТЕМАТИКИ для 10 11 класів загальноосвітніх навчальних... Програма призначена для організації навчання математики в класах з поглибленим вивченням математики. Вона розроблена на основі Державного... |
1 Менеджмент при процесному підході – це Досягнення високого рівня ефективності організації на основі використання знань та навичок підлеглих |