Біоінформатика наука, що займається вивченням організації та функціонування біологічних систем різного рівня (від молекулярного до популяційного) на основі


Скачати 2.37 Mb.
Назва Біоінформатика наука, що займається вивченням організації та функціонування біологічних систем різного рівня (від молекулярного до популяційного) на основі
Сторінка 9/20
Дата 19.04.2013
Розмір 2.37 Mb.
Тип Документи
bibl.com.ua > Інформатика > Документи
1   ...   5   6   7   8   9   10   11   12   ...   20

Базы данных последовательностей имеют свои собственные уникаль­ные форматы, так что последние должны быть преобразованы к формату «ДКГ» для обеспечения совместимости с программами этого пакета. Ана­логично все файлы данных, импортированные в пакет «ДКГ» для проведе­ния анализа, должны соответствовать его формату. К сервисным средствам относятся программы поиска попарного подобия, множественного вырав­нивания последовательностей, анализа эволюционных отношений, поиска мотивов и профилей, предсказания вторичной структуры РНК, построения диаграмм гидропатии и антигенности, смысловой трансляции, сборки по­следовательностей, составления рестрикционных карт и т. д.

Пакет «РДКГ» *

Изначально пакет «Расширенный ДКГ» (EGCG) был задуман сотрудни­ками «ЕЛМБ» (Гейдельберг) как набор программ для поддержки проводи­мых «ЕЛМБ» научных исследований. В «РДКГ» входит более 70 программ, решающих такие задачи, как сборка фрагментов, картографирование, поиск в базах данных, множественный анализ последовательностей, распознава­ние регулярных комбинаций, анализ последовательностей белков и нуклео-тидов, анализ эволюционных связей и т. д.

Пакет «Стаден»

Пакет «Стаден» (Staden) представляет собой набор программ анализа последовательностей ДНК и белков. Он не имеет собственных баз данных,

но работает с базой данных «ЕЛМБ» и некоторыми другими базами дан­ных подобного формата. Пакет обладает оконным интерфейсом для рабо­чих станций «Юникс». Широкий диапазон функциональных возможностей пакета обеспечен служебными программами определения и поиска регу­лярных комбинаций мотивов в последовательностях белков и нуклеиновых кислот (например, некоторые стандартные процедуры позволяют находить участки сращений в иРНК, промоторы у Е. со И, гены тРНК и т. д. Кроме то­го, пользователи могут самостоятельно описывать регулярные комбинации такой же сложности). Сильная сторона пакета «Стаден» — наличие функции сборки последовательностей ДНК.

В него включены алгоритмические методы для выполнения всех операций предварительной обработки первичных данных секвенирования с флуоресцентными метками, реализованные в виде программ визуального отображения следов (TREV), качественного монтажа последовательностей (PREGAP4) и удаления векторов (PREGAP4, VECTORCLIP); набора меха­низмов сборки; мощных алгоритмов редактирования и конечной обработки НПО (GAP4). В пакет вошли также новые программы обнаружения точеч­ных мутаций (TRACEDIFF, GAP4). Кроме того, в пакете «Стаден» преду­смотрены средства анализа окончательно обработанных последовательно­стей ДНК (NIP4) и сравнения последовательностей ДНК или белков (SIP4); помимо своих основных функций, эти служебные программы обеспечи­вают интерфейс к библиотекам последовательностей. Новые диалоговые программы (TEV, PREGAP4, GAP4, NIP4 и SIP4) снабжены графическими интерфейсами пользователя, однако пакет содержит также большое коли­чество более старых, хотя все еще полезных программ, которые общаются с оператором посредством командной строки.
Пакет «Лазерген»

«Лазерген» (Lasergene) — пакет программ для ПК, который обеспе­чивает средства анализа кодирования, сопоставления регулярных комбина­ций и участков, а также анализа структуры и состава РНК и ДНК; ана­лиза участков рестрикции; проектирования зондов, а также праймеров для ПЦР; редактирования последовательностей; сборки последовательностей и управления НПО; множественного и попарного выравнивания последо­вательностей (включая построение и анализ точечных диаграмм); предска­зания вторичной структуры и анализа гидропатии белков; создания сетей и винтовых колес; поиска в базах данных. «Лазерген» может быть установ­лен на ПК с ОС «Уиндоус» или на «Макинтош» и работать как для нужд отдельного пользователя, так и в сетевых рабочих средах.

Наряду с перечисленными выше пакетами программ, были созданы многие другие программные пакеты, которые отличаются специализацией на отдельных областях анализа последовательностей ДНК. Некоторые из них описаны ниже.
Пакет «Секвенатор»

«Секвенатор» (Sequencher) — пакет программ сборки последователь­ностей, предназначенный для работы на «Макинтошах» и обслуживающий многие лаборатории, занятые секвенированием полных геномов. Пакет счи­тывает исходные данные с хроматограммы и преобразует их в сборки НПО; к другим функциям относится: анализ участков рестрикции и ОРС, анализ гетерозигот на наличие мутаций, отсев векторов и транспозонов, анализ мо­тивов и скрытых мутаций, оценка качества последовательностей и, наконец, визуальная маркировка внесенных изменений, гарантирующая целостность данных.
Пакет «Вектор, НТИ»

Пакет «Вектор, НТИ» (Vector, NTI) совместим с ОС «Уиндоус 3.1» и совместно разработан организацией «СОАК» («Собрание образцов аме­риканской культуры» — American Type Culture Collection, АТСС) и корпора­цией «Информакс» (InforMax, Inc.). Это пакет для работы с базами знаний, призванный ускорить внедрение методов клонирования. Он может авто­матически оптимизировать проектирование новых артефактов ДНК и ре­комендовать очередные шаги процесса клонирования. Пользователь может устанавливать предпочтения этого процесса (например: выделение фраг­ментов, модификация концов и лигирование). Система включает в себя около 3000 правил генной инженерии.
Пакет «Маквектор»

Пакет «Маквектор» (MacVector) представляет собой разработанную для нужд молекулярной биологии систему с пользовательским интерфейсом типа «Макинтош», которая предназначена для создания удобной в работе среды для манипуляции с данными (а также их анализа) о составе после­довательностей ДНК и белков. Пакет заимствует пять функций поиска из программы «БЛАСТ» и включает в себя программу «КЛАСТЭЛ-В» для вы­равнивания последовательностей, а также управляемый посредством пикто­грамм редактор последовательностей, который объединен со встроенными функциями, выполняющими операции молекулярной биологии (например трансляции, предсказания структуры белков и анализа рестриктов, прай-меров, зондов и мотивов). Кроме того, пакет снабжен набором сервисных средств, позволяющих вычислять кривые плавления структур РНК и ДНК, предсказанные по их последовательностям.

Будущее коммерческих программных продуктов находится в руках тех поставщиков, которые понимают ключевые вопросы, с которыми сталки­ваются крупные промышленные потребители. Почти что все современные компании имеют внутренние корпоративные сети и поддерживают исполь­зование ППГФ и ИВБОЗ («Интернет»-протокол взаимодействия брокеров объектных запросов — Internet Inter-ORB Protocol, ПОР). Соответственно разрабатываемые для биоинформатики приложения должны как можно луч­ше соответствовать этим сетевым средам. Многие компании для успешно­го проведения исследований должны осуществлять интеграцию различных информационных и программных ресурсов. Большое число промышленных групп, принадлежащих к отрасли биоинформатики, выделяет значительные средства на развитие и обслуживание внутренних веб-серверов, которые дублируют услуги общедоступных веб-узлов служб биоинформатики. Две компании — «Нетджиникс» (NetGenics Inc.) и «Пангея системе» (Pangea Systems Inc.) — разработали биоинформатические системы, которые пред­лагают перспективу интеграции сервиса через сеть «Интранет».
«СИНЕРДЖИ»

Объектно-ориентированная система «СИНЕРДЖИ» (SYNERGY) — продукт «Нетджиникс» (штат Огайо, Кливленд) — включает в себя средства «Явы», ОАБОЗ и объектно-ориентированную базу данных и обеспечивает гибкую среду для управления проектами биоинформатики. «СИНЕРДЖИ» объединяет стандартные программы в единый пакет с помощью упаковщи­ков ОАБОЗа, которые создают упрощенный интерфейс между этими про­граммами и системой «СИНЕРДЖИ». Благодаря такому принципу разработ­чики могут легко и быстро включать в пакет ряд стандартных программ, а пользователи системы имеют возможность добавлять в него свои соб­ственные программы — посредством встроенных интерфейсных функций (упаковщиков) ОАБОЗа.
«Пангея системе»

Компания «Пангея системе» (штат Калифорния, Окленд) разработала программы «Джинмил» (GeneMill), «Джинуорлд» (GeneWorld) и «Джинте-заурус» (GeneThesaurus). Это ориентированные на работу в сети программы управления реляционными базами данных. В целом система «Пангея си­стеме» предназначена для управления проектами высокопроизводительного секвенирования и другими широкомасштабными проектами промышленной I еномики. «Джинмил» — система управления базой данных о технологиче­ском процессе секвенирования (обеспечивает управление проектами секве­нирования); «Джинуорлд» — средство анализа последовательностей белков и ДНК; «Джинтезаурус» — служба подписки на опубликованные статьи и аннотации с описанием последовательностей, предоставляющая доступ к общественным и частным информационным ресурсам. Система построе­на по модульному принципу и позволяет легко создавать интерфейсы с кор­поративными системами, применяя для этого открытый программируемый интерфейс «ПУЛЬС» (PULSE Pangea's Unified Life Science Environment — единая биологическая среда «Пангеи»).
Пакет «ЭМБОСС»

Пакет «ЭМБОСС» (EMBOSS European Molecular Biology Open Software Suite — открытый комплект программ европейских лабораторий молекулярной биологии) является объединенным набором программных па­кетов и отдельных программ анализа последовательностей. Он специально разработан для удовлетворения потребностей «Сенгеровского центра» и об­ществ пользователей сети европейских лабораторий молекулярной биоло­гии «ЕМБнет». В пакет входят приложения, обеспечивающие группировку ЯЭПов, быстрый поиск в базах данных по образцу последовательности, анализ регулярных комбинаций в последовательностях нуклеотидов, ана­лиз частот использования кодонов, опознавание генов и белковых мотивов.
Пакет «Альфреско»

Пакет «Альфреско» (Alfresco) — разработанное для сравнительного анализа геномов средство визуализации; для хранения и выборки дан­ных используется БД «ЭйсДБ». «Альфреско» позволяет сравнивать боль­шое число последовательностей подобных областей из геномов организмов различных биологических видов, а также визуально отображать результа­ты анализа, проводимого встроенными программами предсказания генов, поиска подобия, предсказания регулятивных последовательностей и т. д.
Программа «ДАЛИ»

Программу «ДАЛИ» (DALI Distance matrix ALIgnment — вырав­нивание матриц расстояний) применяют для определения количества белков с образцами свертки, подобными таковым у структуры белка запроса. Эта программа написана Л.Холмом и С.Сандером. Она работает доста­точно быстро и позволяет осуществлять полный просмотр «БДБ» с целью поиска структур, подобных недавно определенной структуре, и, кроме того, выполнять классификацию структур белковых доменов по данным множе­ственного сравнения.

Для удовлетворения потребностей ученого мира в эффективных авто­матизированных методах анализа данных имеется множество разнообраз­ных пакетов программ. Эти пакеты узко специализированы в отношении применяемого алгоритма и мо1ут быть легко загружены по сети в соответ­ствии с разносторонними запросами пользователя (см. табл. 5.2).
Пути использования баз данных

Накопленная информация о биологических функциях отдельных по­следовательностей из геномов опытных организмов может быть исполь­зована для предсказания функций подобных генов у других организмов. Последовательность интересующего нас гена сравнивают с каждой после­довательностью из базы данных и подобные последовательности иденти­фицируют. Если последовательность запроса может быть легко выровнена с находящейся в базе данных последовательностью с известной функцией, структурой или биохимической активностью, то делают предположение, что последовательность запроса имеет ту же самую функцию, структуру или биохимическую активность. Если выравнивание последовательностей показывает более 50 % идентичности, то такое предсказание принято счи­тать достаточно правдоподобным.

Основная цель поиска в базах данных (по последовательности запроса) состоит в том, чтобы найти гомологичный ген из генома другого организма. Так, ген, совпавший с последовательностью запроса с неизвестной функ­цией, может оказаться ключом к пониманию ее функции. И наоборот, по­следовательность запроса с известной функцией может быть использована для перебора последовательностей некоторого организма и отыскания гена, выполняющего аналогичную функцию.

Приводим список адресов некоторых программных пакетов:

GCG http://www.gcg.com/

EGCG http://www.sanger.ac.uk/software.EGCG/

Staden http://www.mrc-lmb.cam.ac.uk/pubseq/

NetGenics http://www.netgenics.com/

Pangea Systems http://www.pangeasystems.com/

Таблица 5.2. Наиболее популярные пакеты, предлагающие широкий набор средств анализа последовательностей ДНК и белков

Пакет

Возможности

Staden

Анализ последовательностей ДНК и белков. Имеет оконный интерфейс для рабочих станций «Юникс».

GeneMill,GeneWorld, GeneThesaurus

«Джинмил» — модульная система для управления технологическими процессами секвенирования. «Джинуорлд» анализирует последовательности ДНК и белков. «Джинтезаурус» обеспечивает доступ к открытым и частным информационным ресурсам.

Lasergene

Анализ кода, сопоставление регулярных комбинаций и участков, структурный и сравнительный анализ РНК и ДНК, анализ участков рестрикции, проектирование зондов и праймеров для ПЦР, редактирование последовательностей, сборка последовательностей, множественное и попарное выравнивание последовательностей, создание сетей и винтовых колес поиск в базах данных

SYNERGY

Объектно-ориентированный пакет, использует возможности «Явы», ОАБОЗ и объектно-ориентированную базу данных и обеспечивает гибкую среду управления проектами биоинформатики.

CINEMA

«СИНЕМА» (Color INteractive Editor for Multiple Alignments — цветной диалоговый редактор множественных выравниваний) — написанный на «Яве» сетевой пакет, предлагающий средства опознавания мотивов, поиска в базах данных (с помощью «БЛАСТ»), визуального представления пространственных структур, построения точечных диаграмм* и профилей гидропатии, трансляции с шестью рамками.

EMBOSS

Пакет «ЭМБОСС» специально разработан для легкой интеграции общедоступных программных пакетов и приложений для группировки ЯЭПов, анализа регулярных комбинаций в последовательностях нуклеотидов, анализа частот использования кодонов, опознавания генов и белковых мотивов и быстрого поиска в базах данных по образцу последовательности.

EGCG

Разработанная «Джинетикс компьютер груп» расширенная версия «ДКГ», включающая в себя более 70 программ сборки фрагментов, картографирования, поиска в базах данных, множественного анализа последовательностей, распознавания регулярных комбинаций, анализа последовательностей нуклеотидов и белков, анализа эволюционных связей и т. д.
1   ...   5   6   7   8   9   10   11   12   ...   20

Схожі:

Гриби – це одна з найбільших у природі груп організмів. Їх вивченням...
Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»...
*Кроманьйонець
Наука про минуле, що займається вивченням матеріальних предметів (артефактів) діяльності людини
Тема Гриби Загальна характеристика грибів. Різноманітність грибів
Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»...
1 Значення і теоретичні основи фінансового аналізу
Дана спеціальність передбачає вивчення процесів формування і виконання бюджетів різного рівня, механізму управління державним боргом,...
Оповідь, переказ про відоме, досліджене минуле наука, яка займається...
Рід — доісторична і ранньоісторична суспільно-організаційна спільнота, стадія еволюції Етносу, до якої належали кровно пов'язані...
Цієї презентації – Електродинаміка Медико біологічних систем. Створював...
Я, Лесюк Анастасія Юріївна приймала активну участь у класному і позакласному житті Українського медичного ліцею 11-В класу. Писала...
ОБҐРУНТУВАННЯ
Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах....
ОБҐРУНТУВАННЯ
Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах....
ПРОГРАМА З МАТЕМАТИКИ для 10 11 класів загальноосвітніх навчальних...
Програма призначена для організації навчання математики в класах з поглибленим вивченням математики. Вона розроблена на основі Державного...
1 Менеджмент при процесному підході – це
Досягнення високого рівня ефективності організації на основі використання знань та навичок підлеглих
Додайте кнопку на своєму сайті:
Портал навчання


При копіюванні матеріалу обов'язкове зазначення активного посилання © 2013
звернутися до адміністрації
bibl.com.ua
Головна сторінка