|
Скачати 2.37 Mb.
|
Базы данных структур Базы данных структур архивируют, аннотируют и распределяют наборы атомных координат. Они представляют собой собрания трехмерных структур биологических макромолекул, а именно белков и нуклеиновых кислот. Последняя организованная база данных структур белка — «Банк данных белка» («БДБ»). Адрес ее веб-узла следующий: http://www.rcsb.org/. Это единственное хранилище структурных данных мирового масштаба; оно поддерживается «НИОСБ» — «Научно-исследовательским объединением структурной биоинформатики (Research Collaboratory for Structural Bioinformatics, RCSB) в «Руджерском университете», штат Нью-Джерси, США. (Здесь поддерживается также «НДБ» (NDB — Nucleic acid Structure Database — вспомогательная база данных структур нуклеиновых кислот). Равноценная база данных в Европе — «МСД» (MSD — Macromolecular Structure Database — база данных макромолекулярных структур), обслуживаемая «Европейским институтом биоинформатики» («ЕИБ»). Веб-узел «МСД» — http://msd.ebi.ac.uk/. Базы данных «БДБ» и «МСД» содержат абсолютно идентичные данные. Типичная запись «БДБ» включает в себя следующую информацию: название белка, вид организма, из которого он получен, имя исследователя, определившего структуру, ссылки на публикации, описание процесса определения структуры, описание эксперимента по определению структуры, последовательность аминокислот, перечень любых дополнительных молекул и координат атомов. В «МСД» предусмотрено средство поиска «ОКА» (ОСА), представляющее собой базу данных навигационного типа, которая объединяет информацию из многочисленных банков данных и содержит описание структур и функций белка. Другой полезный информационный источник в «ЕИБ» — база данных вероятных четвертичных структур (ВЧС) биологически активных форм белков. Классификация структур Многие белки обнаруживают структурные подобия, отражающие в некоторых случаях общее эволюционное происхождение. Эволюционный процесс производит замены, вставки и удаления в последовательностях аминокислот. У отдаленно связанных белков такие изменения могут быть многочисленными и приводить к сверткам, значительно отличающимся по числу и ориентации вторичных структур. Однако было замечено, что если функции белков консервативны, то и структурные компоненты, окружающие важнейшие аминокислотные остатки определяющих эти функции активных участков, также являются консервативными. С целью лучшего понимания взаимосвязи структуры белка с его первичной последовательностью были разработаны схемы классификации структур. Ниже приведены базы данных (и программа), предлагающие разные варианты иерархической классификации белков «БДБ» согласно образцам свертки.
База данных «СКОП» База данных «СКОП» описывает структурные и эволюционные отношения между белками с известной структурой. Так как современные средства автоматического сравнения структур не могут надежно определить все такие отношения, БД «СКОП» построена на принципе сочетания методов ручного и автоматизированного контроля. Белки классифицированы согласно иерархической схеме, отражающей степень подобия их структур и силу эволюционных связей. Такая иерархия состоит из множества уровней, но в основном они описывают семейство, надсемейство и свертку белка. Белки объединяют в семейство (с ясными эволюционными отношениями членов), если их последовательности подобны более чем на 30 %. Белки помещают в надсемейство, когда, несмотря на низкую идентичность последовательностей, их структурные и функциональные характеристики предполагают общее эволюционное происхождение. К группе с общей сверткой относят те белки, у которых соответствующие основные элементы вторичной структуры находятся в аналогичном взаимном расположении и обладают одинаковой топологией — безотносительно того, имеют ли эти белки общее эволюционное происхождение. БД «СКОП» обслуживает запросы по ключевым словам через сервер «Лаборатории МРК» (MRC Laboratory). База данных «КАТ» База данных «КАТ» (классификация по классу, конфигурации, топологии и гомологии) большей частью получена с помощью автоматических методов, но там, где автоматические методы дают сбой, по-прежнему необходим ручной контроль. Разные категории в структуре классификации обозначены как уникальными номерами, так и описательными именами. В иерархической классификации можно выделить пять уровней: класс, конфигурация, топология, гомология и последовательность. Класс устанавливается по основным элементам вторичной структуры и их упаковке. Конформация описывает общее взаимное расположение элементов вторичной структуры. Топология дает описание, которое охватывает и внешнюю форму, и характер соединений вторичных структур. На уровне гомологии сгруппированы домены, которые показывают более 35 % идентичности последовательностей и предположительно происходят от общего предка. Последовательность обеспечивает последний уровень иерархии, в соответствии с которым структуры в пределах установленных гомологических групп далее группируются на основании идентичности последовательностей. Поиск в БД «КАТ» осуществляют путем направления запросов по ключевым словам через сервер «Биомолекулярных структур и примитивов моделирования» при «Университетском колледже в Лондоне». База данных «КАТ» — это база данных белковых структур, которая находится в «Университетском колледже в Лондоне». Подобно принятому в БД «СКОП» принципу классификации, белки БД «КАТ» классифицированы в первую очередь на иерархические уровни по классу (за исключением того, что здесь а/0- и а + /3-белки принадлежат одному классу; вместо а 4- /?-белков, четвертый класс «КАТ» включает в себя белки с малым числом вторичных структур). Вслед за классом белки классифицированы по конфигурации, свертке, надсемейству и семейству. Смешанные базы данных Смешанными (неоднородными) называют базы данных, которые объединяют в себе разнообразные структуры и типы данных из различных первичных источников. Смешанные базы данных выполняют поиск последовательностей намного эффективнее, потому что они избавлены от необходимости опрашивать многочисленные ресурсы. Если смешанная база данных разработана по принципу исключения избыточности, то процесс опроса будет оптимизирован еще больше, так как в этом случае устранена возможность неоднократной проверки одной и той же последовательности. Для создания смешанных ресурсов могут быть использованы различные стратегии. Конечный продукт зависит от выбранных источников данных и критериев их слияния. Выбор разных источников и применение различных критериев избыточности привел к появлению различных неоднородных баз данных, каждая из которых имеет свой собственный специальный формат. Главные смешанные базы данных: «ББД» (NRDB — Non-Redundant Database — «Безызбыточная база данных»), «АУЛ» (OWL), «МИБП-Х» (MIPSX) и «Свисс-прот+ТрЕЛМБ». «Безызбыточная база данных» — многоцелевой ресурс, располагающий самой современной информацией. «АУЛ» — безызбыточная база данных белков с приоритетом записей по уровню аннотирования и достоверности последовательностей. База данных «МИБП-Х» содержит исключительно информацию об уникальных копиях. Объединенный ресурс «Свисс-прот+ТрЕЛМБ» является одновременно и многоцелевым и минимально избыточным. База данных «НДБ» «НДБ» — база данных структур нуклеиновых кислот (адрес — ndbserver.rutgers.edu/ndb) — собирает и распределяет структурную информацию о нуклеиновых кислотах. В дополнение к информации относительно нуклеиновых кислот, «НДБ» поддерживает вспомогательную базу данных белков, связывающих ДНК. Имеющаяся информация представлена координатами и структурными факторами, архивом стандартов нуклеиновых кислот и атласом нуклеиновых кислот, содержащим структуры, которые подчеркивают определенные особенности каждой белковой структуры в «НДБ». Кроме того, «НДБ» предоставляет сведения о собственных корреляциях между структурными параметрами. База данных «КСД» «КСД» (CSD — Cambridge Structural Database — Кембриджская база данных структур) накопляет исчерпывающие структурные данные об органических и металлоорганических соединениях, полученных с помощью рент-геноструктурного и нейтронографического анализа. Она содержит трехмерные координаты атомов, а также сопутствующие библиографические, химические и кристаллографические данные. Сервисные средства «КСД» представлены программным обеспечением машинной графики, а также средствами поиска, выборки, обработки и визуального отображения данных. База данных «БМРБ» База данных «БМРБ» (BMRB — BioMagResBank — «Банк магнитного резонанса биополимеров») содержит данные ЯМР-анализа белков, пептидов и нуклеиновых кислот (www.bmrb.wisc.edu). Она предназначена для помещения вспомогательных данных, необходимых для определения ограничений ЯМР и координат, хранящихся в «БДБ». «БМРБ» содержит параметры ЯМР, которые являются мерами гибкости и динамики. Кроме того, она содержит данные относительно измеренных параметров химических сдвигов ЯМР, а также коэффициенты связи, полярные (ковалентные) связи, значения Т1, значения Т2, гетероциклические значения NOE, величины 52 (параметры упорядочения), скорости водородного обмена и факторы поддержания водородного обмена. Базы данных «ЗДи» и «КССБ» «ЗДи» (3Dee) — база данных описаний белковых доменов. База данных «КССБ» (Классификация сверток по выравниваниям структур белков — Fold classification based on Structure-Structure alignment of Proteins, FSSP) построена на автоматических сравнениях (по принципу «все против всех») трехмерных структур всех записей «БДБ». Выравнивание структур выполнено с помощью программы «ДАЛИ». База данных «КССБ» является базой данных представительных сверток для всех структур из «БДБ». Алгоритм иерархической группировки обрабатывает такие представительные свертки и выстраивает дерево сверток на основании выявленных структурных подобий. База данных «КССБ» основана на структурном выравнивании всех попарных сочетаний белков из Брукхейвенской базы данных структур, проведенном с помощью программы выравнивания структур «ДАЛИ». Прочие базы данных «База данных молекулярных моделей» («БДММ») — хранилище экспериментально определенных структур, извлеченных из «БДБ». Ее организация базируется на концепции связей соседних последовательностей и структур. «БДММ» классифицирует белки с известной структурой, хранящиеся в Брукхейвенском «БДБ», на структурно связанные группы посредством программы выравнивания структур «ВАСТ» (VAST — Vector Alignment Search Tool — средство поиска векторных выравниваний). «ВАСТ» выравнивает трехмерные структуры путем поиска подобных вариантов взаимного расположения элементов вторичной структуры. «БДММ» обеспечивает метод быстрого опознавания всех структур из «БДБ», которые являются статистически необыкновенными. «База данных консервативных доменов» («БДКД») — (Conserved Domain Database, CDD) — база данных выравниваний консервативных доменов со ссылками на их трехмерные структуры. «ЧЕМП» (CHAMP — Chemico-physical AMino acidic Parameter databank — банк данных физико-химических параметров аминокислот) содержит 32 различные группы физико-химических параметров аминокислот. Он интегрирован с «ФАСТА». «База данных ферментативных реакций» (Enzyme-Reaction Database) связывает химические структуры с аминокислотными последовательностями ферментов, которые распознают эти химические структуры в качестве своих лигандов. Химические структуры и химические названия зарегистрированы в базе данных химических структур по системе MACCS. Ферменты зарегистрированы в этой базе данных с помощью опознавательных кодов записей в формате «НФБИ-РИБ». В этой базе данных последовательности ферментов разделены на группы, а консервативная последовательность каждой группы определяется путем множественного выравнивания последовательностей. Эти консервативные последовательности используются для построения мотивов. «Протерм» (ProTherm — Thermodynamic Database for Proteins and Mutants — база данных термодинамики белков и мутантов) — собрание численных данных, необходимых для изучения взаимосвязи между структурой, стабильностью и функцией белковой молекулы. Она содержит такие термодинамические параметры, как изменение свободной энергии Гиббса при развертывании, изменение энтальпии, изменение теплоемкости, температура (фазового) перехода и т. д. Помимо этого, в «Протерм» помещена информация об активности, вторичной структуре, поверхностной реакционной способности, методах измерения и условиях проведения экспериментов (рН, температура, концентрация буферных ионов и белков). БД «Протерм» связана с базами данных «РИБ», «Свисс-прот», «БДБ», «ПМД» (PMD) и «Пубмед». База данных «САРФ» (SARF — Spatial ARrangement of backbone Fragments — пространственное расположение фрагментов основной цепи) также является базой данных белков, классифицированных на основе структурного подобия. Вторичные базы данных Средства поиска в первичных базах данных эффективны для опознавания подобий последовательностей, но интерпретация результатов поиска иногда затруднена и не всегда дает ответы на некоторые более сложные вопросы анализа последовательностей. В таких случаях целесообразно применять программы поиска во вторичных базах данных. В зависимости от типа аналитического метода, на котором построен алгоритм поиска во вторичных базах данных, отношения между объектами могут быть объяснены достаточно полно на уровне надсемейств, семейств, подсемейств и видоспецифических последовательностей. Принцип, положенный в основу развития вторичных баз данных, состоит в том, что с помощью множественных выравниваний могут быть обнаружены консервативные мотивы, которые отражают общие структурные или функциональные характеристики последовательностей, составляющих белки. Самый простой подход к распознаванию регулярных комбинаций заключается в том, чтобы характеризовать семейство по единственному консервативному мотиву и сократить данные о последовательности мотива к согласованной последовательности или к образцу регулярного выражения. Регулярные выражения формируют основу базы данных «Просайт» (PROSITE). Кроме того, было создано большое число вторичных баз данных, которые содержат плоды анализа последовательностей, выуженных из первичных источников. Многие вторичные базы данных, например, «Просайт», «Профили» (Profiles), «ПРИНТС» (PRINTS), «Пфам» (Pfam), «Блоки» (BLOCKS) и «АЙДЕНТИФАЙ» (IDENTIFY), используют в качестве первичного источника БД «Свисс-прот». База данных «Просайт» хранит регулярные выражения (комбинации); БД «Профили» является хранилищем взвешенных матриц (профилей); в БД «ПРИНТС» находятся выровненные мотивы (индикаторы). БД «Пфам» содержит скрытые марковские модели (СММ). БД «Блок^» хранит выровненные мотивы (блоки), а БД «АЙДЕНТИФАЙ» — нечетко регулярные выражения (комбинации). |
Гриби – це одна з найбільших у природі груп організмів. Їх вивченням... Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»... |
*Кроманьйонець Наука про минуле, що займається вивченням матеріальних предметів (артефактів) діяльності людини |
Тема Гриби Загальна характеристика грибів. Різноманітність грибів Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»... |
1 Значення і теоретичні основи фінансового аналізу Дана спеціальність передбачає вивчення процесів формування і виконання бюджетів різного рівня, механізму управління державним боргом,... |
Оповідь, переказ про відоме, досліджене минуле наука, яка займається... Рід — доісторична і ранньоісторична суспільно-організаційна спільнота, стадія еволюції Етносу, до якої належали кровно пов'язані... |
Цієї презентації – Електродинаміка Медико біологічних систем. Створював... Я, Лесюк Анастасія Юріївна приймала активну участь у класному і позакласному житті Українського медичного ліцею 11-В класу. Писала... |
ОБҐРУНТУВАННЯ Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах.... |
ОБҐРУНТУВАННЯ Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах.... |
ПРОГРАМА З МАТЕМАТИКИ для 10 11 класів загальноосвітніх навчальних... Програма призначена для організації навчання математики в класах з поглибленим вивченням математики. Вона розроблена на основі Державного... |
1 Менеджмент при процесному підході – це Досягнення високого рівня ефективності організації на основі використання знань та навичок підлеглих |