Промотор - ділянка, що прилягає до старту транскрипції. Містить регуляторні елементи, які орієнтуються з білками, забезпечують ініціацію транскрипції. Коровий промотор - ділянка приблизно -40 +50. Промоторна область - 5 ', яка фланкуює область аж до старту транскрипції.
Аналіз послідовностей більш 100 різних промоторів E.coli виявив подібну будову:
у районі старту транскрипції - пурину, часто «САТ»
у позиції «-10» гексамери TATAAT (послідовність «-10»)
у позиції "-35» гексамери TTGACA (послідовність «-35»)
відстань між послідовностями «-35» і «-10» ~ 16-18 нуклеотидів.
Комплекс сигма фактор - РНК полімераза (E.coli) має субодиничні склад. Крім сигма фактора в нього входять чотири субодиниці РНК полімерази: 2 альфа, бета і бета'. Вони виконують різні функції. Тільки сигма фактор відповідає за розпізнавання промоторні області.
Организм E.coli имеет несколько сигма факторов, специфичных для различных ситуаций, которые распознают промоторы разных групп генов. Располагая этими данными, и анализируя промотор с неизвестной функцией, можно предсказать, какой сигма фактор будет с ним взаимодействовать. Следовательно, можно предвидеть ситуацию, в которой будет экспрессироваться ген. Таким образом, сигма факторы с разным молекулярным весом являются ключевыми факторами, координирующими экспрессию генов в генных сетях регулирующих ответ на тепловой шок, дефицит азота и хемотаксис.
Рассмотрим другую особенность регуляции транскрипции эукариот. Она состоит в том, что многие гены организованы в опероны.
Оперон – это группа из нескольких генов, транскрибируемых одновременно. Транскрипция инициируется с одного промотора. Таким образом, в любой ситуации в клетке образуются равные количества белков, кодируемых генами одного оперона. На слайде представлена структура лактозного оперона. Он включает гены бета- галактозидазы, пермеазы и трансацетилазы. Белки пермеаза и бета галактозидаза вовлечены в метаболизм лактозы в клетке. Первый белок обеспечивает поступление лактозы в клетку. Второй – является ферментом, обеспечивающим расщепление лактозы. Благодаря тому, что гены экспрессируются в составе оперона, в клетке нарабатываются равные количества транспортных белков и ферментов. Это обеспечивает эффективное усвоение лактозы, поскольку в определенных ситуациях экспрессия оперона может быть активирована, а в других, наоборот, репрессируется.
У прокариот координированная экспрессия генов обеспечивается на транскрипционном уровне за счет:
- наличия нескольких типов сигма факторов
- объединения групп генов в опероны.
Транскрипционные механизмы регуляции координированной экспрессии генов у эукариот.
У эукариот инициация транскрипции осуществляется сложным комплексом белков. В его состав входят как полимераза 2, так и так называемые базальные транскрипционные факторы. Согласно одной из моделей, этот комплекс формируется пошагово. На первом этапе происходит распознавание белком TFIID особой последовательности – ТАТА бокса. Hа следующих этапах присоединяются белки TFIIB, TFIIF, TFIIE, TFIIH.
Важную роль в регуляции транскрипции генов эукариот играют транскрипционные факторы. Это белки, специфически связывающиеся с участками ДНК в различных районах гена. Cайты связывания транскрипционных факторов могут располагаться как непосредственно перед стартом транскрипции (промоторная область), так и в удаленных регуляторных районах (энхансерах, либо сайленсерах).
Транскрипционные факторы влияют на интенсивность транскрипции
- взаимодействуя с белками базального транскрипционного комплекса напрямую
- или через другие белки (коактиваторы или корепрессоры)
- а также участвуя в ремоделинге хроматина.
Одна из форм координированной экспрессии генов – тканеспецифичность. Был проведен анализ экспрессии 36182 транскриптов мыши в 61 ткани. Это количество, практически сравнимое с количеством генов в геноме мыши. Выявлено, что среднее количество транскриптов, приходящихся на одну ткань, составляет 8200, то есть четвертую часть. Таким образом, видно, что в каждом типе клеток экспрессируется только часть генов генома.
На рисунке представлены промоторные районы некоторых генов человека из генной сети дифференцировки и созревания эритроцитов.
Показано расположение сайта связывания транскрипционного фактора GATA1. Справа приведены последовательности сайтов связывания. Они выровнены друг относительно друга таким образом, что становится возможным построить консенсус этого сайта. Данные о первичных последовательностях сайтов очень важны. Их анализ позволяет разрабатывать методы распознавания в ДНК.
Одна из форм координированной экспрессии генов - включение или выключение кассеты генов в ответ на индуктор или репрессор.
Например, экспрессия генов может координировано индуцироваться при низком уровне холестерина и репрессироваться при высоком уровне.
Это гены из генной сети регуляции уровня холестерина в клетке. Ряд генов кодирует ферменты пути биосинтеза холестерина и при их активной экспрессии холестерина в клетке нарабатывается много. В кассету генов, регулируемых холестерином, входит также рецептор частиц ЛПНП. При активации экспрессии этого белка активируется поступление холестерина внутрь клетки.
Экспрессия генов реагирует на изменение уровня холестерина при участии транскрипционного фактора SREBP (sterol regulatory element binding protein). Этот фактор присутствует в клетке в форме неактивного предшественника preSREBP. PreSREBP связан с мембранами эндоплазматического ретикулума. Расщепление неактивного предшественника активизируется, когда уровень холестерина в клетке низкий и замедляется, когда уровень холестерина повышается. Таким образом, гены из этой генной сети экспрессируются координированно, благодаря наличию центрального регулятора – SREBP.
Взаимодействие транскрипционных факторов с ДНК осуществляется специфическим образом. На рисунке приведены модели взаимодействия факторов из семейства ядерных рецепторов с ДНК. Видно, что если транскрипционный фактор является мономером, сайт связывания имеет один консервативный участок (мотив).
Если транскрипционный фактор - димер, сайт связывания содержит два повторяющихся мотива.
Предсказание сайтов связывания в регуляторных районах генов позволяет проводить реконструкцию генных сетей in silico.
Фрагмент генной сети включает две группы генов. О первой группе известно, что они регулируются фактором E2F/DP1 и эти данные подтверждены в экспериментальных статьях. Вторая группа генов имеет потенциальные сайты связывания факторов E2F/DP1, выявленные на основе компьютерного анализа. Таким образом, эта группа генов внесена в
генную сеть на основе анализа in silico.
Для управления генными сетями сложных процессов необходимо наличие многих регуляторов. Так, для клеточного цикла выявлена группа из восьми транскрипционных факторов. Анализ регуляторных районов генов клеточного цикла свидетельствует о том, что для каждого транскрипционного фактора имеется определенная временная точка, когда он наиболее активен. На рисунке представлены круговые диаграммы, где показана плотность потенциальных сайтов определенного фактора в регуляторных районах генов, экспрессирующихся на той или иной стадии клеточного цикла.
Была оценена вероятность встречаемости пар сайтов связывания транскрипционных факторов из этой группы в промоторах генов клеточного цикла. Выявлено, что определенные сочетания сайтов встречаются неслучайно часто. Это свидетельствует о том, регуляции с помощью так называемых, композиционных элементов. В этом случае факторы взаимодействуют как с ДНК, так и друг с другом и их эффект на транскрипцию усиливается синергичным образом.
Еще один способ регуляции транскрипции генов: наличие инсуляторов.
Инсулятор – участок ДНК, который, будучи помещенным между двумя регуляторными элементами, может препятствовать активирующему либо подавляющему действию одного элемента на другой.
Роль инсулятора может выполнять участок прикрепления к ядерному матриксу (MAR =matrix attachment regions), при включении такого инсулятора между энхансером и промотором. Два регуляторных района оказываются в различных доменах, и не способны взаимодействовать.
Еще один механизм регуляции транскрипции, который может определять интенсивность экспрессии многих генов - ацетилирование гистонов.
Гистоновые белки имеют положительно заряженные концевые фрагменты, которые могут взаимодействовать с отрицательно заряженными фосфатами сахарофорсфатного остова ДНК. Это взаимодействие стабилизирует комплекс ДНК с белками. Ацетилирование (присоединение ацетильной группы СО3СО) концевых фрагментов гистоновых белков нейтрализует их положительный заряд. Как следствие, электростатическое взаимодействие белков с ДНК ослабляется. Появляется возможность взаимодействия ДНК с некоторыми транскрипционным факторами.
И наконец еще один механизм регуляции транскрипции – метилирование ДНК. В эукариотических клетках уровень метилирования ДНК часто коррелирует с уровнем экспрессии гена. Метилированные участки ДНК транскрибируются менее активно, чем неметилированные участки. Наиболее часто метилированию подвергаются цитозиновые нуклеотиды, стоящие после гуаниновых.
Активность экспрессии каждого отдельного гена зависит от всей совокупности механизмов, о которых говорилось выше. Коэкспрессируемые гены могут находиться на разных хромосомах, и тогда ведущую роль в координации их экспрессии играют транскрипционные факторы. Если же гены находятся на одной и той же хромосоме в непосредственной близости друг от друга, сходный паттерн их экспрессии, возможно, определяется такими механизмами, как метилирование ДНК, ацетилирование гистонов, наличие LCR и инсуляторов.
РОЗДІЛ VII.
БІОІНФОРМАТИКА ЯК СПОСІБ ПРИСКОРЕННЯ
ПРОЦЕСУ СТВОРЕННЯ ЛІКАРСЬКИХ ПРЕПАРАТІВ
У сучасному світі біоінформатика є унікальним інструментом, який дозволяє реально скоротити процес створення різних фармацевтичних препаратів. Якщо раніше термін проектування препарату становив 5-6 років, то біоінформатика здатна знизити його буквально за кілька місяців. Це досягається завдяки віртуальному комп'ютерному скринінгу, в процесі якого з допомогою потужної комп'ютерної техніки з'являється можливість дуже швидко знайти гени-мішені, спираючись на структуру макромолекули. Після появи біоінформатики виникла нова епоха у системі тестування фармацевтичних препаратів:
Однією з найактуальніших проблем у створенні лікарських засобів є проблема скорочення термінів виробництва, а також скорочення фінансових витрат. Згідно з сучасними оцінками, розробка одного препарату займає в середньому 10-12 років, а її вартість становить 350-500 млн доларів. Сумарні витрати фармацевтичних компаній на пошук нових речовин, які можуть стати кандидатами на роль нових ліків, становлять 7-9 мільярдів доларів на рік.
До появи біоінформатики як науки в процесі створення лікарських препаратів використовувались всього два методи (in vivo та in vitro), то з появою біоінформатики з'явилася можливість використовувати багаторівневий підхід у вивченні біологічних систем:
а) in vivo - тобто в живому об'єкті;
б) in vitro - тобто в штучно змодельованої середовищі;
в) in silico - тобто в повністю змодельованої на комп'ютері біологічній системі.
Терміни in vivo і in vitro добре прижилися серед експериментаторів, однак зміст їх використання досить відносний. Так, під in vivo молекулярний біолог, що вивчає аспекти синтезу білка, може випливати колонію штучно вирощених клітин, а під in vitro - систему безклітинного синтезу в пробірці. При цьому, для фізіолога, який вивчає механізми проведення нервового імпульсу, in vivo - це цілий організм, а in vitro - культура нервової тканини.
Термін in silico (від in silicon), тобто «На кремнії» з'явився для позначення всього, що пов'язане з комп'ютерними експериментами в 90-і роки XX століття. У молекулярній біології цим терміном позначаються процеси біоінформатики, які виконуються за допомогою комп'ютерів.
Підхід in silico також багаторівневий і включає в себе завдання з моделювання поведінки окремих молекул, біохімічних процесів і навіть функціонуванню окремих фізіологічних систем.
Весь процес створення нового лікарського з'єднання може бути розділений на 4 основних етапи:
пошук мішені дії нових ліків;
пошук біологічно активної речовини, що володіє потрібним фармакологічною дією;
дослідження цієї сполуки в експерименті in vitro та in vivo;
отримання дозволу Національної адміністрації з ліків та проведення випробувань у клініці.
Біоінформатика є базовою дисципліною, перш за все, при пошуку мішеней дії нових лікарських препаратів. В оцінці перспективності конкретної мішені враховуються також можливості знаходження відповідних лігандів (інгібіторів або активаторів). У процесі пошуку базових структур нових лігандів і на етапі оптимізації властивостей речовин-кандидатів широко використовуються комп'ютерні методи. Тобто саме біоінформатика біоінформатичний методи дозволяють скоротити і спростити найбільш довгий і складний процес у створенні поненціального лікарського препарату - пошук мішені, на яку краще за все будуть діяти потенційні кандидати на роль ліків.
Напрями біоінформатики
Геноміка - ініціалізація геному людини та порушень у ньому, що може призвести або до спадкових захворювань, або до схильності до них.
Протеоміка - напрям, що займається порівняльним вивченням клітинних протеоміки тобто наборів білків даної клітини в даній фазі її розвитку в певний момент часу.
Транскриптоміка - ініціалізація всіх матричних РНК, які кодують білки, визначення кількості кожної індивідуальної мРНК, визначення закономірностей експресії всіх генів, що кодують білки.
Метаболоміка - ініціалізація і кількісне визначення всіх метаболітів, синтезованих (або перебувають) в даних клітинах, тканинах, органах і в біологічних рідинах.
РНоміка - ініціалізація всіх не кодуючих РНК, визначення кількості кожної індивідуальної нкРНК - визначення закономірностей експресії всіх нкРНК.
За допомогою біоінформатики і її напрямків можна віртуально змоделювати взаємодія мішені з лігандом і подивитися, чи може той чи інший кандидат на ліки насправді будь-яким чином впливати а молекулу-мішень.
Якщо 3D структура молекули-мішені відома, то застосовують так звані прямі методи комп'ютерного конструювання ліків. У структурі макромолекули-мішені знаходять місце зв'язування ліганда і проводять його аналіз за допомогою молекулярної графіки (якщо є експериментальна інформація про місце зв'язування ліганда) або в комбінації з молекулярним докінгом (знаходження місця зв'язування шляхом молекулярного докінгу ліганда з макромолекулою-мішенню). Потім за цими даними про структуру активного центру проводять пошук нових лігандів в існуючих комп'ютерних банках даних тривимірних структур малих молекул.
У висновку можна сказати так - якщо десять років тому основна конкуренція між фармацевтичними фірмами на етапі пошуку була пов'язана з виявленням нової базової структури, то зараз конкуренція розгортається вже на більш ранній стадії - етапі пошуку макромолекули-мішені. Біоінформатика має величезне майбутнє, яке полягає у допомозі людям більш швидко і точно підібрати сировину для створення нового лікарського препарату.
|