Джин - Gene

Изображение выше содержит интерактивные ссылки.
Ген - это участок ДНК, который кодирует функцию. Хромосома состоит из длинной цепи ДНК , содержащей множество генов. Хромосома человека может иметь до 500 миллионов пар оснований ДНК с тысячами генов.

В биологии , A ген (от ГЕНОСА ( греческий ) означает поколение или рождение или пол ) является основной единицей наследственности и последовательность нуклеотидов в ДНК , которая кодирует в синтез из более генного продукта , либо РНК или белок .

Во время экспрессии гена ДНК сначала копируется в РНК . РНК может быть непосредственно функциональной или быть промежуточной матрицей для белка , выполняющего функцию. Передача генов потомству организма лежит в основе наследования фенотипических признаков . Эти гены составляют разные последовательности ДНК, называемые генотипами . Генотипы вместе с факторами окружающей среды и развития определяют, какими будут фенотипы. Большинство биологических признаков находится под влиянием полигенов (множества различных генов), а также взаимодействий ген-среда . Некоторые генетические черты видны мгновенно, такие как цвет глаз или количество конечностей, а некоторые нет, например, группа крови , риск определенных заболеваний или тысячи основных биохимических процессов, составляющих жизнь .

Гены могут приобретать мутации в своей последовательности, что приводит к различным вариантам, известным как аллели , в популяции . Эти аллели кодируют несколько разные версии белка, которые вызывают разные фенотипические признаки. Использование термина «имеющий ген» (например, «хорошие гены», «ген цвета волос») обычно относится к содержанию другого аллеля одного и того же общего гена. Гены развиваются благодаря естественному отбору / выживанию наиболее приспособленных и генетическому дрейфу аллелей.

Концепция гена продолжает уточняться по мере открытия новых явлений. Например, регуляторные области гена могут быть удалены от его кодирующих областей , а кодирующие области могут быть разделены на несколько экзонов . Некоторые вирусы хранят свой геном в РНК вместо ДНК, а некоторые генные продукты представляют собой функциональные некодирующие РНК . Таким образом, широкое, современное рабочее определение гена является любым дискретным локусом наследственной геномной последовательности, которые влияют на черты организма, будучи выражена в качестве функционального продукта или путем регуляцией экспрессии генов .

Термин « ген» был введен датским ботаником , физиологом растений и генетиком Вильгельмом Йохансеном в 1909 году. Он вдохновлен древнегреческим : γόνος, gonos , что означает потомство и продолжение рода.

История

Фотография Грегора Менделя
Грегор Мендель

Обнаружение дискретных унаследованных единиц

О существовании дискретных наследуемых единиц впервые предположил Грегор Мендель (1822–1884). С 1857 по 1864 год в Брно , Австрийская империя (нынешняя Чехия), он изучал закономерности наследования у 8000 обычных съедобных растений гороха , отслеживая различные признаки от родителя к потомству. Он описал их математически как 2 n  комбинаций, где n - количество различных характеристик в исходном горохе. Хотя он не использовал термин « ген» , он объяснил свои результаты терминами дискретных унаследованных единиц, которые приводят к наблюдаемым физическим характеристикам. Это описание было прообразом того, как Вильгельм Йоханнсен проводил различие между генотипом (генетическим материалом организма) и фенотипом (наблюдаемыми чертами этого организма). Мендель также был первым, кто продемонстрировал независимый ассортимент , различие между доминантными и рецессивными признаками, различие между гетерозиготами и гомозиготами , а также феномен прерывистой наследственности.

До работы Менделя доминирующей теорией наследственности была теория смешанного наследования , которая предполагала, что каждый родитель вносит свой вклад в процесс оплодотворения и что черты родителей смешиваются и смешиваются, чтобы произвести потомство. Чарльз Дарвин разработал теорию наследования, которую он назвал пангенезисом от греч. Pan («все, целое») и genesis («рождение») / genos («происхождение»). Дарвин использовал термин геммула для описания гипотетических частиц, которые будут смешиваться во время воспроизведения.

Работа Менделя осталась практически незамеченной после ее первой публикации в 1866 году, но была вновь открыта в конце 19 века Хуго де Фризом , Карлом Корренсом и Эрихом фон Чермаком , которые (утверждали, что они) пришли к аналогичным выводам в своих собственных исследованиях. В частности, в 1889 году Хьюго де Фрис опубликовал свою книгу « Внутриклеточный пангенезис» , в которой он постулировал, что разные персонажи имеют индивидуальных наследственных носителей и что наследование определенных черт в организмах происходит в виде частиц. Де Фрис назвал эти единицы «пангенезами» ( Pangens на немецком языке) в честь теории пангенезиса Дарвина 1868 года.

Двадцать лет спустя, в 1909 году Иогансен ввел «ген» термин и в 1906 году, Уильям Бейтсон , что из « генетики » в то время как Страсбургер , среди прочего, до сих пор используется термин «pangene» для фундаментальной физической и функциональной единицы наследственности .

Открытие ДНК

Прогресс в понимании генов и наследования продолжался на протяжении всего 20 века. Дезоксирибонуклеиновая кислота (ДНК) оказалась молекулярным хранилищем генетической информации в ходе экспериментов 1940-1950-х годов. Структура ДНК была изучена Розалинд Франклин и Морисом Уилкинсом с помощью рентгеновской кристаллографии , что привело Джеймса Д. Уотсона и Фрэнсиса Крика к публикации модели двухцепочечной молекулы ДНК, чьи спаренные нуклеотидные основания указали на убедительную гипотезу механизма генетическая репликация.

В начале 1950-х годов преобладала точка зрения, согласно которой гены в хромосоме действуют как дискретные сущности, неделимые путем рекомбинации и расположенные как бусинки на веревочке. Эксперименты Бензера с использованием мутантов, дефектных в области rII бактериофага Т4 (1955–1959), показали, что отдельные гены имеют простую линейную структуру и, вероятно, эквивалентны линейному участку ДНК.

В совокупности эти исследования установили центральную догму молекулярной биологии , согласно которой белки транслируются с РНК , которая транскрибируется с ДНК . С тех пор было показано, что у этой догмы есть исключения, такие как обратная транскрипция в ретровирусах . Современное изучение генетики на уровне ДНК известно как молекулярная генетика .

В 1972 году Уолтер Файерс и его команда первыми определили последовательность гена - белка оболочки бактериофага MS2 . Последующее развитие секвенирования ДНК с обрывом цепи в 1977 году Фредериком Сэнгером повысило эффективность секвенирования и превратило его в рутинный лабораторный инструмент. Автоматизированная версия метода Сэнгера использовалась на ранних этапах проекта « Геном человека» .

Современный синтез и его последователи

Теории, разработанные в начале 20 века для интеграции менделевской генетики с дарвиновской эволюцией , называются современным синтезом - термин, введенный Джулианом Хаксли .

Эволюционные биологи впоследствии изменили эту концепцию, например, Джордж С. Уильямс " ген-ориентированного зрения эволюции . Он предложил эволюционную концепцию гена как единицы из естественного отбора с определением: «то , что сегрегируется и рекомбинирует с заметной частотой.» С этой точки зрения молекулярный ген транскрибируется как единица, а эволюционный ген наследуется как единица. Родственные идеи, подчеркивающие центральную роль генов в эволюции, были популяризированы Ричардом Докинзом .

Молекулярная основа

Диаграмма химической структуры ДНК, показывающая, как двойная спираль состоит из двух цепей сахарно-фосфатного остова с основаниями, направленными внутрь, и, в частности, парой оснований от A до T и от C до G с водородными связями.
Химическая структура фрагмента из четырех пар оснований двойной спирали ДНК . В сахар - фосфатный магистральные сети в противоположных направлениях с основаниями , указывая внутрь, спаривание оснований А на Т и С к G с водородными связями .

ДНК

Подавляющее большинство организмов кодируют свои гены в длинных цепях ДНК (дезоксирибонуклеиновая кислота). ДНК состоит из цепочки, состоящей из четырех типов нуклеотидных субъединиц, каждая из которых состоит из пятиуглеродного сахара ( 2-дезоксирибозы ), фосфатной группы и одного из четырех оснований аденина , цитозина , гуанина и тимина .

Две цепи ДНК скручиваются друг с другом, образуя двойную спираль ДНК, в которой фосфатно-сахарный остов закручивается по спирали вокруг внешней стороны, а основания направлены внутрь, а основания аденина соединяются с тимином, а гуанин - с цитозином. Специфичность спаривания оснований обусловлена ​​тем, что аденин и тимин объединяются, образуя две водородные связи , тогда как цитозин и гуанин образуют три водородные связи. Две цепи в двойной спирали должны, следовательно, быть комплементарными , с их последовательностью оснований, совпадающей так, чтобы аденины одной цепи были спарены с тиминами другой цепи и так далее.

Благодаря химическому составу пентозных остатков оснований, цепи ДНК имеют направленность. Один конец полимера ДНК содержит открытую гидроксильную группу дезоксирибозы ; это известно как 3'-конец молекулы. Другой конец содержит открытую фосфатную группу; это конец 5 футов . Две нити двойной спирали движутся в противоположных направлениях. Синтез нуклеиновых кислот, включая репликацию ДНК и транскрипцию, происходит в направлении 5 '→ 3', потому что новые нуклеотиды добавляются посредством реакции дегидратации, которая использует экспонированный 3 'гидроксил в качестве нуклеофила .

Экспрессии генов , кодируемых в ДНК начинается переписывание гена в РНК , второго типа нуклеиновой кислоты, которая очень похожа на ДНК, но чьи мономеры содержат сахар рибоза , а не дезоксирибоза . РНК также содержит базовый урацил вместо тимина . Молекулы РНК менее стабильны, чем ДНК, и обычно одноцепочечные. Гены, кодирующие белки, состоят из серии трехнуклеотидных последовательностей, называемых кодонами , которые служат «словами» на генетическом «языке». Генетический код определяет соответствие во время белкового перевода между кодонами и аминокислотами . Генетический код практически одинаков для всех известных организмов.

Хромосомы

Микроскопическое изображение 46 хромосом с красными и зелеными полосами.
Изображение женского кариотипа человека, полученное флуоресцентной микроскопией , показывающее 23 пары хромосом. ДНК окрашивается в красный цвет, а участки, богатые домашними генами, окрашиваются в зеленый цвет. Самые большие хромосомы примерно в 10 раз больше самых маленьких.

Полный набор генов в организме или клетке известен как его геном , который может храниться на одной или нескольких хромосомах . Хромосома состоит из одной очень длинной спирали ДНК, на которой закодированы тысячи генов. Область хромосомы, в которой расположен конкретный ген, называется его локусом . Каждый локус содержит один аллель гена; однако члены популяции могут иметь разные аллели в локусе, каждый с немного отличающейся последовательностью генов.

Большинство эукариотических генов хранятся в наборе больших линейных хромосом. Хромосомы упакованы внутри ядра в комплекс с запасными белками, называемыми гистонами, чтобы сформировать единицу, называемую нуклеосомой . ДНК, упакованная и конденсированная таким образом, называется хроматином . Способ, которым ДНК хранится на гистонах, а также химические модификации самого гистона регулируют, доступна ли конкретная область ДНК для экспрессии генов . В дополнение к генам, эукариотические хромосомы содержат последовательности, обеспечивающие копирование ДНК без деградации концевых областей и сортировку в дочерние клетки во время деления клеток: точки начала репликации , теломеры и центромеры . Истоки репликации - это участки последовательности, в которых инициируется репликация ДНК для создания двух копий хромосомы. Теломеры - это длинные участки повторяющихся последовательностей, которые закрывают концы линейных хромосом и предотвращают деградацию кодирующих и регуляторных областей во время репликации ДНК . Длина теломер уменьшается каждый раз, когда геном реплицируется и участвует в процессе старения . Центромера необходима для связывания волокон веретена с целью разделения сестринских хроматид на дочерние клетки во время деления клеток .

Прокариоты ( бактерии и археи ) обычно хранят свои геномы на одной большой круглой хромосоме . Точно так же некоторые эукариотические органеллы содержат остаточную кольцевую хромосому с небольшим количеством генов. Прокариоты иногда дополняют свою хромосому дополнительными небольшими кругами ДНК, называемыми плазмидами , которые обычно кодируют только несколько генов и могут передаваться между людьми. Например, гены устойчивости к антибиотикам обычно кодируются бактериальными плазмидами и могут передаваться между отдельными клетками, даже клетками разных видов, посредством горизонтального переноса генов .

В то время как хромосомы прокариот относительно гены, хромосомы эукариот часто содержат участки ДНК, которые не выполняют очевидных функций. Простые одноклеточные эукариоты имеют относительно небольшое количество такой ДНК, тогда как геномы сложных многоклеточных организмов , включая человека, содержат абсолютное большинство ДНК без определенной функции. Эту ДНК часто называют « мусорной ДНК ». Однако более поздние исследования показывают, что, хотя ДНК, кодирующая белок, составляет всего 2% генома человека, может быть экспрессировано около 80% оснований в геноме, поэтому термин «мусорная ДНК» может быть неправильным.

Структура и функции

Состав

Изображение выше содержит интерактивные ссылки.
Структура эукариотического гена, кодирующего белок. Регуляторная последовательность контролирует, когда и где происходит экспрессия кодирующей области белка (красный). Области промотора и энхансера (желтые) регулируют транскрипцию гена в пре-мРНК, которая модифицируется для удаления интронов (светло-серый) и добавления 5'-кэпа и поли-A-хвоста (темно-серый). 5 ' и 3' нетранслируемые области мРНК (синий) регулируют трансляцию в конечный белковый продукт.

Структура гена состоит из многих элементов , из которых фактической последовательность , кодирующие белок , часто лишь небольшая часть. К ним относятся участки ДНК, которые не транскрибируются, а также нетранслируемые участки РНК.

Гены, фланкирующие открытую рамку считывания, содержат регуляторную последовательность , необходимую для их экспрессии. Во-первых, для генов требуется промоторная последовательность. Промотор распознается и связывается факторами транскрипции, которые рекрутируют и помогают РНК-полимеразе связываться с областью, чтобы инициировать транскрипцию. Распознавание обычно происходит в виде согласованной последовательности, такой как блок TATA . У гена может быть более одного промотора, в результате чего образуются информационные РНК ( мРНК ), которые различаются по тому, насколько далеко они простираются на 5'-конце. Гены с высокой степенью транскрипции имеют «сильные» промоторные последовательности, которые образуют сильные ассоциации с факторами транскрипции, тем самым инициируя транскрипцию с высокой скоростью. Другие гены имеют «слабые» промоторы, которые образуют слабые ассоциации с факторами транскрипции и реже инициируют транскрипцию. Районы эукариотических промоторов намного сложнее и их труднее идентифицировать, чем прокариотические промоторы.

Кроме того, гены могут иметь регуляторные области на много тысяч оснований выше или ниже открытой рамки считывания, которые изменяют экспрессию. Они действуют путем связывания с факторами транскрипции, которые затем вызывают образование петли ДНК, так что регуляторная последовательность (и связанный фактор транскрипции) становится ближе к сайту связывания РНК-полимеразы. Например, энхансеры увеличивают транскрипцию, связывая активаторный белок, который затем помогает рекрутировать РНК-полимеразу на промотор; наоборот, сайленсеры связывают белки- репрессоры и делают ДНК менее доступной для РНК-полимеразы.

Транскрибируемая пре-мРНК содержит нетранслируемые области на обоих концах, которые содержат сайты связывания для рибосом , РНК-связывающих белков , миРНК , а также терминатор , а также стартовый и стоп-кодоны . Кроме того, большинство открытых рамок считывания эукариот содержат нетранслируемые интроны , которые удаляются, и экзоны , которые соединяются вместе в процессе, известном как сплайсинг РНК . Наконец, концы генных транскриптов определяются сайтами расщепления и полиаденилирования (CPA) , где вновь продуцируемая пре-мРНК расщепляется, и к 3'-концу добавляется цепочка из ~ 200 аденозинмонофосфатов. Поли (А) хвост защищает зрелый мРНК от деградации и имеет другие функции, влияющие на перевод, локализацию и транспортировку транскрипта из ядра. Сплайсинг с последующим CPA генерирует окончательную зрелую мРНК , которая кодирует белок или продукт РНК. Хотя общие механизмы, определяющие расположение генов человека, известны, определение точных факторов, регулирующих эти клеточные процессы, является областью активных исследований. Например, известные особенности последовательности в 3'-UTR могут объяснить только половину всех концов генов человека.

Многие прокариотические гены организованы в опероны с множеством последовательностей, кодирующих белок, которые транскрибируются как единое целое. Гены оперона транскрибируются как непрерывная информационная РНК , называемая полицистронной мРНК . Термин цистрон в этом контексте эквивалентен гену. Транскрипция мРНК оперона часто контролируется репрессором, который может находиться в активном или неактивном состоянии в зависимости от присутствия конкретных метаболитов. Когда активны, репрессор связывается с ДНК - последовательностью в начале оперона, называется областью оператора , а также репрессирует транскрипцию в опероне ; когда репрессор неактивен, может происходить транскрипция оперона (см., например, оперон Lac ). Продукты оперонных генов обычно имеют связанные функции и участвуют в одной и той же регуляторной сети .

Функциональные определения

Точно определить, какой участок последовательности ДНК составляет ген, сложно. Регуляторные области гена, такие как энхансеры , не обязательно должны быть близки к кодирующей последовательности на линейной молекуле, потому что промежуточная ДНК может быть петлей, чтобы сблизить ген и его регуляторную область. Точно так же интроны гена могут быть намного больше, чем его экзоны. Регуляторные области могут даже находиться на совершенно разных хромосомах и работать в транс, позволяя регуляторным областям на одной хромосоме вступать в контакт с генами-мишенями на другой хромосоме.

Ранние работы в области молекулярной генетики предложили концепцию, согласно которой один ген производит один белок . Эта концепция (первоначально называвшаяся гипотезой « один ген - один фермент» ) возникла из влиятельной статьи 1941 года Джорджа Бидла и Эдварда Татума об экспериментах с мутантами гриба Neurospora crassa . Норман Горовиц , один из первых коллег по исследованиям Neurospora , в 2004 году вспоминал, что «эти эксперименты положили начало науке о том, что Бидл и Татум назвали биохимической генетикой . На самом деле они оказались первым оружием в том, что стало молекулярной генетикой и всеми последующими разработками ». Концепция «один ген - один белок» была усовершенствована с момента открытия генов, которые могут кодировать несколько белков с помощью альтернативного сплайсинга и кодирующих последовательностей, разделенных на короткие участки по всему геному, мРНК которых конкатенированы транс-сплайсингом .

Иногда используется широкое рабочее определение, чтобы охватить сложность этих разнообразных явлений, где ген определяется как объединение геномных последовательностей, кодирующих согласованный набор потенциально перекрывающихся функциональных продуктов. Это определение классифицирует гены по их функциональным продуктам (белкам или РНК), а не по их конкретным локусам ДНК, а регуляторные элементы классифицируются как связанные с генами области.

Перекрытие между генами

Также возможно, что гены перекрывают одну и ту же последовательность ДНК и считаются отдельными, но перекрывающимися генами . Текущее определение перекрывающегося гена различается у эукариот, прокариот и вирусов. У эукариот они недавно были определены как «когда по крайней мере один нуклеотид является общим между внешними границами первичных транскриптов двух или более генов, так что мутация основания ДНК в точке перекрытия повлияет на транскрипты всех генов, участвующих в перекрывать." В прокариотах и ​​вирусах они недавно были определены как «когда кодирующие последовательности двух генов имеют общий нуклеотид либо на одной, либо на противоположных цепях».

Экспрессия гена

Во всех организмах требуются два шага, чтобы прочитать информацию, закодированную в ДНК гена, и произвести определенный белок. Сначала ДНК гена транскрибируется в информационную РНК ( мРНК ). Во-вторых, эта мРНК транслируется в белок. Гены, кодирующие РНК, должны пройти первый этап, но не транслируются в белок. Процесс производства биологически функциональной молекулы РНК или белка называется экспрессией гена , а полученная молекула называется генным продуктом .

Генетический код

Молекула РНК, состоящая из нуклеотидов.  Группы из трех нуклеотидов указаны как кодоны, каждый из которых соответствует определенной аминокислоте.
Схема одноцепочечной молекулы РНК, иллюстрирующая серию трехосновных кодонов . Каждый трехнуклеотидный кодон соответствует аминокислоте при трансляции в белок.

Нуклеотидная последовательность ДНК гена определяет аминокислотную последовательность белка через генетический код . Наборы из трех нуклеотидов, известные как кодоны , каждый соответствуют определенной аминокислоте. Принцип, согласно которому три последовательных основания кода ДНК для каждой аминокислоты, был продемонстрирован в 1961 году с использованием мутаций сдвига рамки считывания в гене rIIB бактериофага Т4 (см . Эксперимент Крика, Бреннера и др. ).

Кроме того, « стартовый кодон » и три « стоп-кодона » указывают начало и конец области, кодирующей белок . Есть 64 возможных кодоны (четыре возможных нуклеотидов в каждом из трех положений, следовательно , 4 3  возможных кодонов) и только 20 стандартных аминокислоты; следовательно, код является избыточным, и несколько кодонов могут указывать на одну и ту же аминокислоту. Соответствие между кодонами и аминокислотами почти универсально среди всех известных живых организмов.

Транскрипция

Транскрипция дает одноцепочечную молекулу РНК , известную как информационная РНК , нуклеотидная последовательность которой комплементарна ДНК, из которой она была транскрибирована. МРНК действует как промежуточное звено между геном ДНК и его конечным белковым продуктом. ДНК гена используется в качестве матрицы для создания комплементарной мРНК. МРНК соответствует последовательности кодирующей цепи ДНК гена, потому что она синтезируется как комплемент цепи матрицы . Транскрипция выполняется ферментом, называемым РНК-полимеразой , который считывает цепочку матрицы в направлении от 3 ' до 5'  и синтезирует РНК от 5 ' до 3' . Чтобы инициировать транскрипцию, полимераза сначала распознает и связывает промоторную область гена. Таким образом, основным механизмом регуляции гена является блокирование или изоляция промоторной области либо путем прочного связывания репрессорными молекулами, которые физически блокируют полимеразу, либо путем организации ДНК так, чтобы промоторная область была недоступна.

У прокариот транскрипция происходит в цитоплазме ; для очень длинных транскриптов трансляция может начинаться с 5'-конца РНК, в то время как 3'-конец все еще транскрибируется. У эукариот транскрипция происходит в ядре, где хранится ДНК клетки. Молекула РНК, продуцируемая полимеразой, известна как первичный транскрипт и претерпевает посттранскрипционные модификации перед экспортированием в цитоплазму для трансляции. Одна из модификаций , выполненных является сплайсинга из интронов , которые являются последовательности в области транскрибируется , которые не кодируют белок. Альтернативные механизмы сплайсинга могут привести к зрелым транскриптам одного и того же гена, имеющим разные последовательности и, таким образом, кодирующим разные белки. Это основная форма регуляции в эукариотических клетках, а также встречается у некоторых прокариот.

Перевод

Ген, кодирующий белок в ДНК, транскрибируемый и транслируемый в функциональный белок, или ген, не кодирующий белок, транскрибируемый в функциональную РНК
Гены, кодирующие белок, транскрибируются в промежуточный продукт мРНК , а затем транслируются в функциональный белок . РНК-кодирующие гены транскрибируются в функциональную некодирующую РНК . ( PDB : 3BSE , 1OBB , 3TRA )

Трансляция - это процесс, при котором зрелая молекула мРНК используется в качестве матрицы для синтеза нового белка . Трансляция осуществляется рибосомами , большими комплексами РНК и белка, ответственными за проведение химических реакций добавления новых аминокислот к растущей полипептидной цепи путем образования пептидных связей . Генетический код считывается по трем нуклеотидам одновременно в единицах, называемых кодонами , посредством взаимодействия со специализированными молекулами РНК, называемыми транспортной РНК (тРНК). Каждая тРНК имеет три неспаренных основания, известных как антикодон , которые комплементарны кодону, который она считывает на мРНК. ТРНК также ковалентно присоединена к аминокислоте, указанной комплементарным кодоном. Когда тРНК связывается со своим комплементарным кодоном в цепи мРНК, рибосома присоединяет свой аминокислотный груз к новой полипептидной цепи, которая синтезируется от аминоконца до карбоксильного конца . Во время и после синтеза большинство новых белков должны свернуться в свою активную трехмерную структуру, прежде чем они смогут выполнять свои клеточные функции.

Регулирование

Гены регулируются таким образом, что они экспрессируются только тогда, когда продукт необходим, поскольку экспрессия требует ограниченных ресурсов. Клетка регулирует экспрессию своих генов в зависимости от внешней среды (например, доступных питательных веществ , температуры и других стрессов ), внутренней среды (например, цикла деления клетки , метаболизма , статуса инфекции ) и своей специфической роли в многоклеточном организме. Экспрессию генов можно регулировать на любом этапе: от инициации транскрипции до процессинга РНК и посттрансляционной модификации белка. Регуляция генов метаболизма лактозы в E. coli ( lac- оперон ) была первым подобным механизмом, описанным в 1961 году.

Гены РНК

Типичный ген, кодирующий белок, сначала копируется в РНК в качестве промежуточного продукта при производстве конечного белкового продукта. В других случаях молекулы РНК являются фактическими функциональными продуктами, например, при синтезе рибосомной РНК и транспортной РНК . Некоторые РНК, известные как рибозимы , способны выполнять ферментативную функцию , а микроРНК играет регулирующую роль. Последовательности ДНК , из которых транскрибируются такие РНК, известны как гены некодирующих РНК .

Некоторые вирусы хранят весь свой геном в виде РНК и совсем не содержат ДНК. Поскольку они используют РНК для хранения генов, их клеточные хозяева могут синтезировать их белки, как только они инфицированы и без задержки в ожидании транскрипции. С другой стороны, РНК- ретровирусы , такие как ВИЧ , требуют обратной транскрипции их генома из РНК в ДНК, прежде чем их белки могут быть синтезированы. РНК-опосредованная эпигенетическая наследственность также наблюдалась у растений и очень редко у животных.

Наследование

Иллюстрация аутосомно-рецессивного наследования.  У каждого родителя есть один голубой аллель и один белый аллель.  Каждый из их 4 детей наследует по одному аллелю от каждого родителя, так что один ребенок имеет два аллеля синего цвета, один ребенок имеет два аллеля белого цвета, а два ребенка имеют по одному аллелю каждого из них.  Только ребенок с обоими синими аллелями показывает этот признак, потому что он рецессивный.
Наследование гена, имеющего два разных аллеля (синий и белый). Ген расположен на аутосомной хромосоме . Белый аллель рецессивен синему аллелю. Вероятность каждого исхода в детском поколении составляет четверть, или 25 процентов.

Организмы наследуют свои гены от родителей. Бесполые организмы просто наследуют полную копию генома своих родителей. Половые организмы имеют две копии каждой хромосомы, потому что они наследуют по одному полному набору от каждого родителя.

Менделирующее наследование

Согласно менделевскому наследованию , вариации фенотипа организма (наблюдаемые физические и поведенческие характеристики) частично обусловлены вариациями его генотипа (определенного набора генов). Каждый ген определяет конкретный признак с различной последовательностью гена ( аллелей ), приводя к различным фенотипам. Большинство эукариотических организмов (например, растения гороха, над которыми работал Мендель) имеют по два аллеля для каждого признака, по одному унаследованному от каждого родителя.

Аллели в локусе могут быть доминантными или рецессивными ; Доминантные аллели дают начало своим соответствующим фенотипам при соединении с любым другим аллелем того же самого признака, тогда как рецессивные аллели вызывают соответствующий им фенотип только при соединении с другой копией того же аллеля. Если вы знаете генотипы организмов, вы можете определить, какие аллели являются доминантными, а какие - рецессивными. Например, если аллель, определяющий высокие стебли у растений гороха, доминирует над аллелем, определяющим короткие стебли, то растения гороха, которые наследуют один высокий аллель от одного родителя и один короткий аллель от другого родителя, также будут иметь высокие стебли. Работа Менделя продемонстрировала, что аллели независимо сортируются при производстве гамет или половых клеток , обеспечивая вариацию в следующем поколении. Хотя менделевское наследование остается хорошей моделью для многих признаков, определяемых отдельными генами (включая ряд хорошо известных генетических нарушений ), оно не включает физические процессы репликации ДНК и деления клеток.

Репликация ДНК и деление клеток

Рост, развитие и размножение организмов зависит от деления клеток ; процесс, при котором одна клетка делится на две обычно идентичные дочерние клетки . Для этого сначала необходимо создать дубликат каждого гена в геноме в процессе, называемом репликацией ДНК . Копии создаются специализированными ферментами, известными как ДНК-полимеразы , которые «читают» одну цепь двойной спирали ДНК, известной как матричная цепь, и синтезируют новую комплементарную цепь. Поскольку двойная спираль ДНК удерживается вместе за счет спаривания оснований , последовательность одной цепи полностью определяет последовательность ее комплемента; следовательно, фермент должен прочитать только одну цепь, чтобы получить точную копию. Процесс репликации ДНК полуконсервативен ; то есть копия генома, унаследованная каждой дочерней клеткой, содержит одну исходную и одну вновь синтезированную цепь ДНК.

Скорость репликации ДНК в живых клетках сначала была измерена как скорость удлинения ДНК фага Т4 в инфицированной фагом E. coli, и она оказалась впечатляюще быстрой. В период экспоненциального увеличения ДНК при 37 ° C скорость удлинения составляла 749 нуклеотидов в секунду.

После завершения репликации ДНК клетка должна физически разделить две копии генома и разделиться на две отдельные мембраносвязанные клетки. У прокариот  ( бактерий и архей ) это обычно происходит посредством относительно простого процесса, называемого бинарным делением , в котором каждый кольцевой геном прикрепляется к клеточной мембране и разделяется на дочерние клетки, когда мембрана инвагинирует, чтобы разделить цитоплазму на две связанные с мембраной части. . Бинарное деление происходит чрезвычайно быстро по сравнению со скоростью деления клеток у эукариот . Деление эукариотических клеток - более сложный процесс, известный как клеточный цикл ; Репликация ДНК происходит во время фазы этого цикла, известной как S-фаза , тогда как процесс сегрегации хромосом и расщепления цитоплазмы происходит во время M-фазы .

Молекулярное наследование

Дублирование и передача генетического материала от одного поколения клеток к другому - это основа молекулярного наследования и связь между классической и молекулярной картинами генов. Организмы наследуют характеристики своих родителей, потому что клетки потомства содержат копии генов в клетках своих родителей. У организмов, размножающихся бесполым путем , потомство будет генетической копией или клоном родительского организма. У организмов, размножающихся половым путем , особая форма деления клеток, называемая мейозом, дает клетки, называемые гаметами, или половые клетки, которые являются гаплоидными или содержат только одну копию каждого гена. Гаметы, производимые самками, называются яйцами или яйцеклетками, а гаметы, производимые самцами, называются спермой . Две гаметы сливаются, образуя диплоидную оплодотворенную яйцеклетку , единственную клетку, которая имеет два набора генов, с одной копией каждого гена от матери и одной от отца.

В процессе деления мейотических клеток иногда может происходить событие, называемое генетической рекомбинацией или кроссинговером , при котором длина ДНК на одной хроматиде заменяется длиной ДНК на соответствующей гомологичной несестринской хроматиде. Это может привести к перегруппировке других связанных аллелей. Менделевский принцип независимого ассортимента утверждает, что каждый из двух родительских генов для каждого признака будет независимо сортироваться на гаметы; какой аллель организм наследует по одному признаку, не связан с тем, какой аллель он наследует по другому признаку. На самом деле это верно только для генов, которые не находятся на одной хромосоме или расположены очень далеко друг от друга на одной и той же хромосоме. Чем ближе два гена лежат на одной хромосоме, тем теснее они будут связаны в гаметах и ​​тем чаще будут появляться вместе (это называется генетической связью ). Гены, которые очень близки, по сути, никогда не разделяются, потому что крайне маловероятно, что между ними произойдет точка кроссовера.

Молекулярная эволюция

Мутация

Репликация ДНК по большей части чрезвычайно точна, однако ошибки ( мутации ) все же случаются. Частота ошибок в эукариотических клетках может составлять всего 10 -8 на нуклеотид на репликацию, тогда как для некоторых РНК-вирусов она может достигать 10 -3 . Это означает, что каждое поколение, каждый геном человека накапливает 1-2 новые мутации. Небольшие мутации могут быть вызваны репликацией ДНК и последствиями повреждения ДНК и включают точечные мутации, при которых изменяется одно основание, и мутации со сдвигом рамки считывания, в которых вставляется или удаляется одно основание. Любая из этих мутаций может изменить ген по ошибке (изменить кодон для кодирования другой аминокислоты) или по бессмыслице (преждевременный стоп-кодон ). Более крупные мутации могут быть вызваны ошибками рекомбинации, вызывающими хромосомные аномалии, включая дупликацию , делецию, перестройку или инверсию больших участков хромосомы. Кроме того, механизмы репарации ДНК могут вносить мутационные ошибки при восстановлении физического повреждения молекулы. Ремонт, даже с мутацией, более важен для выживания, чем восстановление точной копии, например, при восстановлении двухцепочечных разрывов .

Когда в популяции вида присутствует несколько разных аллелей гена, это называется полиморфным . Большинство различных аллелей функционально эквивалентны, однако некоторые аллели могут давать разные фенотипические признаки . Наиболее распространенный аллель гена называется диким типом , а редкие аллели - мутантами . Генетическая вариация в относительных частотах различных аллелей в популяции обусловлена как естественный отбор и генетический дрейф . Аллель дикого типа не обязательно является предком менее распространенных аллелей и не обязательно более подходящим .

Большинство мутаций внутри генов нейтральны и не влияют на фенотип организма ( молчащие мутации ). Некоторые мутации не изменяют аминокислотную последовательность, потому что несколько кодонов кодируют одну и ту же аминокислоту ( синонимичные мутации ). Другие мутации могут быть нейтральными, если они приводят к изменениям аминокислотной последовательности, но белок по-прежнему функционирует аналогично новой аминокислоте (например, консервативные мутации ). Однако многие мутации являются вредными или даже летальными и удаляются из популяций путем естественного отбора. Генетические нарушения являются результатом вредных мутаций и могут быть вызваны спонтанной мутацией у пораженного человека или могут передаваться по наследству. Наконец, небольшая часть мутаций приносит пользу , улучшая приспособленность организма и чрезвычайно важна для эволюции, поскольку их направленный отбор ведет к адаптивной эволюции .

Гомология последовательностей

Выравнивание последовательностей гистоновых белков млекопитающих , продуцируемое ClustalO.

Гены с самым недавним общим предком и, следовательно, с общим эволюционным происхождением, известны как гомологи . Эти гены появляются либо в результате дупликации генов в геноме организма, где они известны как паралогичные гены, либо являются результатом дивергенции генов после события видообразования , где они известны как ортологичные гены, и часто выполняют те же или аналогичные функции. в родственных организмах. Часто предполагается, что функции ортологичных генов более схожи, чем функции паралоговых генов, хотя разница минимальна.

Связь между генами можно измерить, сравнивая выравнивание последовательностей их ДНК. Степень сходства последовательностей между гомологичными генами называется консервативной последовательностью . Большинство изменений в последовательности гена не влияют на его функцию, поэтому гены накапливают мутации с течением времени в результате нейтральной молекулярной эволюции . Кроме того, любой отбор гена приведет к тому, что его последовательность будет расходиться с другой скоростью. Гены под стабилизирующим отбор будут ограничены , и поэтому изменяются более медленно , в то время как гены при направленном выборе последовательности изменений более быстро. Различия в последовательностях генов можно использовать для филогенетического анализа, чтобы изучить, как эти гены эволюционировали и как связаны между собой организмы, от которых они произошли.

Истоки новых генов

Эволюционная судьба повторяющихся генов.

Наиболее распространенным источником новых генов в эукариотических линиях является дупликация генов , которая создает вариацию количества копий существующего гена в геноме. Полученные гены (паралоги) могут затем расходиться по последовательности и функциям. Сформированные таким образом наборы генов составляют семейство генов . Дублирование и утрата генов в семье обычны и представляют собой основной источник эволюционного биоразнообразия . Иногда дупликация гена может привести к нефункциональной копии гена, или функциональная копия может быть подвержена мутациям, которые приводят к потере функции; такие нефункциональные гены называются псевдогенами .

«Орфанные» гены , последовательность которых не похожа на существующие, встречаются реже, чем дубликаты генов. Человеческий геном содержит от 18 до 60 генов без идентифицируемых гомологов за пределами человека. Гены-сироты возникают в основном либо в результате появления de novo из ранее некодирующей последовательности , либо в результате дупликации гена с последующим таким быстрым изменением последовательности, что исходное родство становится необнаружимым. Гены de novo обычно короче и проще по структуре, чем большинство эукариотических генов, с небольшим количеством интронов или вообще без них. В течение долгих эволюционных периодов рождение гена de novo может отвечать за значительную часть таксономически ограниченных семейств генов.

Горизонтальный перенос генов относится к передаче генетического материала через механизм, отличный от репродукции . Этот механизм является обычным источником новых генов у прокариот , иногда считается, что он больше способствует генетической изменчивости, чем дупликации генов. Это распространенное средство распространения устойчивости к антибиотикам , вирулентности и адаптивных метаболических функций. Хотя горизонтальный перенос генов у эукариот встречается редко, вероятные примеры были идентифицированы с геномами протистов и водорослей, содержащими гены бактериального происхождения.

Геном

Генома является общее генетический материал организма и включает в себя как гены и не-кодирующих последовательностей . Эукариотические гены можно аннотировать с помощью FINDER.

Количество генов

Отображение количества генов репрезентативных растений (зеленый), позвоночных (синий), беспозвоночных (оранжевый), грибов (желтый), бактерий (фиолетовый) и вирусов (серый). На вставке справа показаны меньшие геномы, увеличенные в 100 раз по площади.

Размер генома и количество кодируемых им генов сильно различаются между организмами. Наименьшие геномы встречаются у вирусов и вироидов (которые действуют как единственный некодирующий ген РНК). И наоборот, растения могут иметь чрезвычайно большие геномы, при этом рис содержит> 46 000 генов, кодирующих белок. Общее количество генов, кодирующих белок ( протеом Земли ), оценивается в 5 миллионов последовательностей.

Хотя количество пар оснований ДНК в геноме человека известно с 1960-х годов, расчетное количество генов со временем изменилось по мере того, как определения генов и методы их обнаружения были уточнены. Первоначальные теоретические предсказания количества человеческих генов достигли 2 000 000 человек. Ранние экспериментальные измерения показали, что существует 50 000–100 000 транскрибированных генов ( метки экспрессированной последовательности ). Впоследствии секвенирование в Human Genome Project показало, что многие из этих транскриптов были альтернативными вариантами одних и тех же генов, а общее количество генов, кодирующих белок, было пересмотрено до ~ 20 000 с 13 генами, закодированными в митохондриальном геноме. С проектом аннотации GENCODE эта оценка продолжает падать до 19 000. В геноме человека только 1-2% состоит из последовательностей, кодирующих белок, а оставшаяся часть представляет собой «некодирующую» ДНК, такую ​​как интроны , ретротранспозоны и некодирующие РНК . Каждый многоклеточный организм имеет все свои гены в каждой клетке своего тела, но не каждый ген функционирует в каждой клетке.

Основные гены

Генные функции в минимальном геноме из синтетического организма , Syn 3 .

Основные гены - это набор генов, которые считаются критически важными для выживания организма. Это определение предполагает обильную доступность всех необходимых питательных веществ и отсутствие стресса окружающей среды. Важна лишь небольшая часть генов организма. У бактерий примерно 250–400 генов необходимы для Escherichia coli и Bacillus subtilis , что составляет менее 10% их генов. Половина этих генов являются ортологами обоих организмов и в значительной степени участвуют в синтезе белка . У почкующихся дрожжей Saccharomyces cerevisiae количество основных генов несколько выше - 1000 генов (~ 20% их генов). Хотя это число труднее измерить у высших эукариот, мыши и люди, по оценкам, имеют около 2000 основных генов (~ 10% их генов). Синтетический организм Syn 3 имеет минимальный геном из 473 основных генов и почти необходимых генов (необходимых для быстрого роста), хотя функции 149 неизвестны.

Основные гены включают гены домашнего хозяйства (критические для основных функций клетки), а также гены, которые экспрессируются в разное время в развитии или жизненном цикле организмов . Гены домашнего хозяйства используются в качестве экспериментального контроля при анализе экспрессии генов , поскольку они конститутивно экспрессируются на относительно постоянном уровне.

Генетическая и геномная номенклатура

Номенклатура генов была установлена ​​Комитетом по номенклатуре генов HUGO (HGNC), комитетом Организации генома человека , для каждого известного человеческого гена в виде утвержденного имени и символа гена (сокращенное сокращение ), доступ к которому можно получить через база данных, поддерживаемая HGNC. Символы выбираются так, чтобы они были уникальными, и каждый ген имеет только один символ (хотя утвержденные символы иногда меняются). Символы предпочтительно должны согласовываться с другими членами семейства генов и с гомологами у других видов, особенно у мыши из-за ее роли в качестве общего модельного организма .

Генная инженерия

Сравнение традиционной селекции растений с трансгенной и цисгенной генетической модификацией.

Генная инженерия - это модификация генома организма с помощью биотехнологии . С 1970-х годов было разработано множество методов специально для добавления, удаления и редактирования генов в организме. Недавно разработанные методы геномной инженерии используют сконструированные ферменты нуклеазы для создания целенаправленной репарации ДНК в хромосоме, чтобы либо разрушить, либо отредактировать ген, когда разрыв будет восстановлен. Родственный термин синтетическая биология иногда используется для обозначения обширной генной инженерии организма.

Генная инженерия в настоящее время является обычным инструментом исследования модельных организмов . Например, гены легко добавляются к бактериям, и линии мышей с нокаутом, у которых нарушена функция конкретного гена, используются для исследования функции этого гена. Многие организмы были генетически модифицированы для использования в сельском хозяйстве , промышленной биотехнологии и медицине .

Для многоклеточных организмов обычно создается эмбрион, который превращается во взрослый генетически модифицированный организм . Однако геномы клеток взрослого организма можно редактировать с помощью методов генной терапии для лечения генетических заболеваний.

Смотрите также

использованная литература

Цитаты

Источники

Основной учебник
Глоссарий
Глава 1: Клетки и геномы
1.1: Универсальные характеристики клеток на Земле
Глава 2: Клеточная химия и биосинтез
2.1: Химические компоненты клетки
Глава 3: Белки
Глава 4: ДНК и хромосомы
4.1: Структура и функции ДНК
4.2: Хромосомная ДНК и ее упаковка в хроматиновом волокне
Глава 5: Репликация, восстановление и рекомбинация ДНК
5.2: Механизмы репликации ДНК
5.4: Ремонт ДНК
5.5: Общая рекомбинация
Глава 6: Как клетки считывают геном: от ДНК к белку
6.1: ДНК в РНК
6.2: РНК в белок
Глава 7: Контроль экспрессии генов
7.1: Обзор генного контроля
7.2: ДНК-связывающие мотивы в белках-регуляторах генов
7.3: Как работают генетические переключатели
7.5: Посттранскрипционный контроль
7.6: Как эволюционируют геномы
Глава 14: Преобразование энергии: митохондрии и хлоропласты
14.4: Генетические системы митохондрий и пластид
Глава 18: Механика деления клеток
18.1: Обзор фазы M
18.2: Митоз
Глава 20: Зародышевые клетки и оплодотворение
20.2: Мейоз

дальнейшее чтение

внешние ссылки