|
Скачати 2.37 Mb.
|
Базы данных последовательностей имеют свои собственные уникальные форматы, так что последние должны быть преобразованы к формату «ДКГ» для обеспечения совместимости с программами этого пакета. Аналогично все файлы данных, импортированные в пакет «ДКГ» для проведения анализа, должны соответствовать его формату. К сервисным средствам относятся программы поиска попарного подобия, множественного выравнивания последовательностей, анализа эволюционных отношений, поиска мотивов и профилей, предсказания вторичной структуры РНК, построения диаграмм гидропатии и антигенности, смысловой трансляции, сборки последовательностей, составления рестрикционных карт и т. д. Пакет «РДКГ» * Изначально пакет «Расширенный ДКГ» (EGCG) был задуман сотрудниками «ЕЛМБ» (Гейдельберг) как набор программ для поддержки проводимых «ЕЛМБ» научных исследований. В «РДКГ» входит более 70 программ, решающих такие задачи, как сборка фрагментов, картографирование, поиск в базах данных, множественный анализ последовательностей, распознавание регулярных комбинаций, анализ последовательностей белков и нуклео-тидов, анализ эволюционных связей и т. д. Пакет «Стаден» Пакет «Стаден» (Staden) представляет собой набор программ анализа последовательностей ДНК и белков. Он не имеет собственных баз данных, но работает с базой данных «ЕЛМБ» и некоторыми другими базами данных подобного формата. Пакет обладает оконным интерфейсом для рабочих станций «Юникс». Широкий диапазон функциональных возможностей пакета обеспечен служебными программами определения и поиска регулярных комбинаций мотивов в последовательностях белков и нуклеиновых кислот (например, некоторые стандартные процедуры позволяют находить участки сращений в иРНК, промоторы у Е. со И, гены тРНК и т. д. Кроме того, пользователи могут самостоятельно описывать регулярные комбинации такой же сложности). Сильная сторона пакета «Стаден» — наличие функции сборки последовательностей ДНК. В него включены алгоритмические методы для выполнения всех операций предварительной обработки первичных данных секвенирования с флуоресцентными метками, реализованные в виде программ визуального отображения следов (TREV), качественного монтажа последовательностей (PREGAP4) и удаления векторов (PREGAP4, VECTORCLIP); набора механизмов сборки; мощных алгоритмов редактирования и конечной обработки НПО (GAP4). В пакет вошли также новые программы обнаружения точечных мутаций (TRACEDIFF, GAP4). Кроме того, в пакете «Стаден» предусмотрены средства анализа окончательно обработанных последовательностей ДНК (NIP4) и сравнения последовательностей ДНК или белков (SIP4); помимо своих основных функций, эти служебные программы обеспечивают интерфейс к библиотекам последовательностей. Новые диалоговые программы (TEV, PREGAP4, GAP4, NIP4 и SIP4) снабжены графическими интерфейсами пользователя, однако пакет содержит также большое количество более старых, хотя все еще полезных программ, которые общаются с оператором посредством командной строки. Пакет «Лазерген» «Лазерген» (Lasergene) — пакет программ для ПК, который обеспечивает средства анализа кодирования, сопоставления регулярных комбинаций и участков, а также анализа структуры и состава РНК и ДНК; анализа участков рестрикции; проектирования зондов, а также праймеров для ПЦР; редактирования последовательностей; сборки последовательностей и управления НПО; множественного и попарного выравнивания последовательностей (включая построение и анализ точечных диаграмм); предсказания вторичной структуры и анализа гидропатии белков; создания сетей и винтовых колес; поиска в базах данных. «Лазерген» может быть установлен на ПК с ОС «Уиндоус» или на «Макинтош» и работать как для нужд отдельного пользователя, так и в сетевых рабочих средах. Наряду с перечисленными выше пакетами программ, были созданы многие другие программные пакеты, которые отличаются специализацией на отдельных областях анализа последовательностей ДНК. Некоторые из них описаны ниже. Пакет «Секвенатор» «Секвенатор» (Sequencher) — пакет программ сборки последовательностей, предназначенный для работы на «Макинтошах» и обслуживающий многие лаборатории, занятые секвенированием полных геномов. Пакет считывает исходные данные с хроматограммы и преобразует их в сборки НПО; к другим функциям относится: анализ участков рестрикции и ОРС, анализ гетерозигот на наличие мутаций, отсев векторов и транспозонов, анализ мотивов и скрытых мутаций, оценка качества последовательностей и, наконец, визуальная маркировка внесенных изменений, гарантирующая целостность данных. Пакет «Вектор, НТИ» Пакет «Вектор, НТИ» (Vector, NTI) совместим с ОС «Уиндоус 3.1» и совместно разработан организацией «СОАК» («Собрание образцов американской культуры» — American Type Culture Collection, АТСС) и корпорацией «Информакс» (InforMax, Inc.). Это пакет для работы с базами знаний, призванный ускорить внедрение методов клонирования. Он может автоматически оптимизировать проектирование новых артефактов ДНК и рекомендовать очередные шаги процесса клонирования. Пользователь может устанавливать предпочтения этого процесса (например: выделение фрагментов, модификация концов и лигирование). Система включает в себя около 3000 правил генной инженерии. Пакет «Маквектор» Пакет «Маквектор» (MacVector) представляет собой разработанную для нужд молекулярной биологии систему с пользовательским интерфейсом типа «Макинтош», которая предназначена для создания удобной в работе среды для манипуляции с данными (а также их анализа) о составе последовательностей ДНК и белков. Пакет заимствует пять функций поиска из программы «БЛАСТ» и включает в себя программу «КЛАСТЭЛ-В» для выравнивания последовательностей, а также управляемый посредством пиктограмм редактор последовательностей, который объединен со встроенными функциями, выполняющими операции молекулярной биологии (например трансляции, предсказания структуры белков и анализа рестриктов, прай-меров, зондов и мотивов). Кроме того, пакет снабжен набором сервисных средств, позволяющих вычислять кривые плавления структур РНК и ДНК, предсказанные по их последовательностям. Будущее коммерческих программных продуктов находится в руках тех поставщиков, которые понимают ключевые вопросы, с которыми сталкиваются крупные промышленные потребители. Почти что все современные компании имеют внутренние корпоративные сети и поддерживают использование ППГФ и ИВБОЗ («Интернет»-протокол взаимодействия брокеров объектных запросов — Internet Inter-ORB Protocol, ПОР). Соответственно разрабатываемые для биоинформатики приложения должны как можно лучше соответствовать этим сетевым средам. Многие компании для успешного проведения исследований должны осуществлять интеграцию различных информационных и программных ресурсов. Большое число промышленных групп, принадлежащих к отрасли биоинформатики, выделяет значительные средства на развитие и обслуживание внутренних веб-серверов, которые дублируют услуги общедоступных веб-узлов служб биоинформатики. Две компании — «Нетджиникс» (NetGenics Inc.) и «Пангея системе» (Pangea Systems Inc.) — разработали биоинформатические системы, которые предлагают перспективу интеграции сервиса через сеть «Интранет». «СИНЕРДЖИ» Объектно-ориентированная система «СИНЕРДЖИ» (SYNERGY) — продукт «Нетджиникс» (штат Огайо, Кливленд) — включает в себя средства «Явы», ОАБОЗ и объектно-ориентированную базу данных и обеспечивает гибкую среду для управления проектами биоинформатики. «СИНЕРДЖИ» объединяет стандартные программы в единый пакет с помощью упаковщиков ОАБОЗа, которые создают упрощенный интерфейс между этими программами и системой «СИНЕРДЖИ». Благодаря такому принципу разработчики могут легко и быстро включать в пакет ряд стандартных программ, а пользователи системы имеют возможность добавлять в него свои собственные программы — посредством встроенных интерфейсных функций (упаковщиков) ОАБОЗа. «Пангея системе» Компания «Пангея системе» (штат Калифорния, Окленд) разработала программы «Джинмил» (GeneMill), «Джинуорлд» (GeneWorld) и «Джинте-заурус» (GeneThesaurus). Это ориентированные на работу в сети программы управления реляционными базами данных. В целом система «Пангея системе» предназначена для управления проектами высокопроизводительного секвенирования и другими широкомасштабными проектами промышленной I еномики. «Джинмил» — система управления базой данных о технологическом процессе секвенирования (обеспечивает управление проектами секвенирования); «Джинуорлд» — средство анализа последовательностей белков и ДНК; «Джинтезаурус» — служба подписки на опубликованные статьи и аннотации с описанием последовательностей, предоставляющая доступ к общественным и частным информационным ресурсам. Система построена по модульному принципу и позволяет легко создавать интерфейсы с корпоративными системами, применяя для этого открытый программируемый интерфейс «ПУЛЬС» (PULSE — Pangea's Unified Life Science Environment — единая биологическая среда «Пангеи»). Пакет «ЭМБОСС» Пакет «ЭМБОСС» (EMBOSS — European Molecular Biology Open Software Suite — открытый комплект программ европейских лабораторий молекулярной биологии) является объединенным набором программных пакетов и отдельных программ анализа последовательностей. Он специально разработан для удовлетворения потребностей «Сенгеровского центра» и обществ пользователей сети европейских лабораторий молекулярной биологии «ЕМБнет». В пакет входят приложения, обеспечивающие группировку ЯЭПов, быстрый поиск в базах данных по образцу последовательности, анализ регулярных комбинаций в последовательностях нуклеотидов, анализ частот использования кодонов, опознавание генов и белковых мотивов. Пакет «Альфреско» Пакет «Альфреско» (Alfresco) — разработанное для сравнительного анализа геномов средство визуализации; для хранения и выборки данных используется БД «ЭйсДБ». «Альфреско» позволяет сравнивать большое число последовательностей подобных областей из геномов организмов различных биологических видов, а также визуально отображать результаты анализа, проводимого встроенными программами предсказания генов, поиска подобия, предсказания регулятивных последовательностей и т. д. Программа «ДАЛИ» Программу «ДАЛИ» (DALI — Distance matrix ALIgnment — выравнивание матриц расстояний) применяют для определения количества белков с образцами свертки, подобными таковым у структуры белка запроса. Эта программа написана Л.Холмом и С.Сандером. Она работает достаточно быстро и позволяет осуществлять полный просмотр «БДБ» с целью поиска структур, подобных недавно определенной структуре, и, кроме того, выполнять классификацию структур белковых доменов по данным множественного сравнения. Для удовлетворения потребностей ученого мира в эффективных автоматизированных методах анализа данных имеется множество разнообразных пакетов программ. Эти пакеты узко специализированы в отношении применяемого алгоритма и мо1ут быть легко загружены по сети в соответствии с разносторонними запросами пользователя (см. табл. 5.2). Пути использования баз данных Накопленная информация о биологических функциях отдельных последовательностей из геномов опытных организмов может быть использована для предсказания функций подобных генов у других организмов. Последовательность интересующего нас гена сравнивают с каждой последовательностью из базы данных и подобные последовательности идентифицируют. Если последовательность запроса может быть легко выровнена с находящейся в базе данных последовательностью с известной функцией, структурой или биохимической активностью, то делают предположение, что последовательность запроса имеет ту же самую функцию, структуру или биохимическую активность. Если выравнивание последовательностей показывает более 50 % идентичности, то такое предсказание принято считать достаточно правдоподобным. Основная цель поиска в базах данных (по последовательности запроса) состоит в том, чтобы найти гомологичный ген из генома другого организма. Так, ген, совпавший с последовательностью запроса с неизвестной функцией, может оказаться ключом к пониманию ее функции. И наоборот, последовательность запроса с известной функцией может быть использована для перебора последовательностей некоторого организма и отыскания гена, выполняющего аналогичную функцию. Приводим список адресов некоторых программных пакетов: GCG http://www.gcg.com/ EGCG http://www.sanger.ac.uk/software.EGCG/ Staden http://www.mrc-lmb.cam.ac.uk/pubseq/ NetGenics http://www.netgenics.com/ Pangea Systems http://www.pangeasystems.com/ Таблица 5.2. Наиболее популярные пакеты, предлагающие широкий набор средств анализа последовательностей ДНК и белков
|
Гриби – це одна з найбільших у природі груп організмів. Їх вивченням... Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»... |
*Кроманьйонець Наука про минуле, що займається вивченням матеріальних предметів (артефактів) діяльності людини |
Тема Гриби Загальна характеристика грибів. Різноманітність грибів Гриби – це одна з найбільших у природі груп організмів. Їх вивченням займається спеціальна наука – мікологія ( від грец. «мікос»... |
1 Значення і теоретичні основи фінансового аналізу Дана спеціальність передбачає вивчення процесів формування і виконання бюджетів різного рівня, механізму управління державним боргом,... |
Оповідь, переказ про відоме, досліджене минуле наука, яка займається... Рід — доісторична і ранньоісторична суспільно-організаційна спільнота, стадія еволюції Етносу, до якої належали кровно пов'язані... |
Цієї презентації – Електродинаміка Медико біологічних систем. Створював... Я, Лесюк Анастасія Юріївна приймала активну участь у класному і позакласному житті Українського медичного ліцею 11-В класу. Писала... |
ОБҐРУНТУВАННЯ Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах.... |
ОБҐРУНТУВАННЯ Україні проводиться модернізація організації документообігу, зважаючи на функціонування документів у традиційній та електронній формах.... |
ПРОГРАМА З МАТЕМАТИКИ для 10 11 класів загальноосвітніх навчальних... Програма призначена для організації навчання математики в класах з поглибленим вивченням математики. Вона розроблена на основі Державного... |
1 Менеджмент при процесному підході – це Досягнення високого рівня ефективності організації на основі використання знань та навичок підлеглих |