Ошибка катастрофа - Error catastrophe

Катастрофа ошибки относится к кумулятивной потере генетической информации в родословной организмов из-за высокой скорости мутаций. Частота мутаций, выше которой возникает катастрофа ошибки, называется порогом ошибки . Оба термина были введены Манфредом Эйгеном в его математической эволюционной теории квазивидов .

Этот термин наиболее широко используется для обозначения накопления мутаций до такой степени, что организм или вирус становится неуязвимым, когда он не может произвести достаточно жизнеспособного потомства для поддержания популяции. Такое использование термина Эйгена было принято Лоуренсом Лоебом и его коллегами для описания стратегии летального мутагенеза для лечения ВИЧ с использованием мутагенных аналогов рибонуклеозидов.

Ранее термин был введен в 1963 году Лесли Оргелом в теории клеточного старения, в которой ошибки в трансляции белков, участвующих в трансляции белков , усиливали ошибки до тех пор, пока клетка не становилась нежизнеспособной. Эта теория не получила эмпирической поддержки.

Катастрофа ошибки предсказывается в определенных математических моделях эволюции и также наблюдалась эмпирически.

Как и любой организм, вирусы «совершают ошибки» (или мутируют ) во время репликации. Возникающие в результате мутации увеличивают биоразнообразие среди населения и помогают подорвать способность иммунной системы хозяина распознавать его при последующей инфекции. Чем больше мутаций производит вирус во время репликации, тем больше вероятность того, что он избежит распознавания иммунной системой, и тем более разнообразной будет его популяция (см. Статью о биоразнообразии для объяснения избирательных преимуществ этого). Однако, если он производит слишком много мутаций, он может потерять некоторые из своих биологических свойств, которые эволюционировали в его пользу, в том числе способность к воспроизводству вообще.

Возникает вопрос: сколько мутаций может произойти во время каждой репликации, прежде чем популяция вирусов начнет терять самоидентичность?

Базовая математическая модель

Рассмотрим вирус, генетическая идентичность которого представлена ​​цепочкой нулей и единиц (например, 11010001011101 ....). Предположим, что строка имеет фиксированную длину L и что при репликации вирус копирует каждую цифру одну за другой, допуская ошибку с вероятностью q независимо от всех остальных цифр.

Из-за мутаций, возникающих в результате ошибочной репликации, существует до 2 л различных штаммов, полученных от родительского вируса. Пусть x i обозначает концентрацию штамма i ; пусть a i обозначает скорость, с которой воспроизводится деформация i ; и пусть Q ij обозначает вероятность мутации вируса из штамма i в штамм j .

Тогда скорость изменения концентрации x j определяется выражением

На этом этапе мы проводим математическую идеализацию: мы выбираем наиболее подходящую деформацию (ту, которая имеет наибольшую скорость воспроизводства a j ) и предполагаем, что она уникальна (т. Е. Что выбранный a j удовлетворяет условию a j > a i для всех i ); а затем мы группируем оставшиеся штаммы в одну группу. Пусть концентрации этих двух групп равны x, y с коэффициентами воспроизводства a> b соответственно; пусть Q будет вероятностью того, что вирус из первой группы ( x ) мутирует в члена второй группы ( y ), и пусть R будет вероятностью того, что член второй группы вернется в первую (через маловероятный и очень специфический мутация). Уравнения, управляющие развитием популяций, следующие:

Нас особенно интересует случай, когда L очень велико, поэтому мы можем спокойно пренебречь R и вместо этого рассмотреть:

Тогда, полагая z = x / y, мы имеем

.

Предполагая, что z достигает постоянной концентрации с течением времени, z успокаивается, чтобы удовлетворить

(который выводится установкой производной z по времени равной нулю).

Таким образом, важный вопрос заключается в том, при каких значениях параметров сохраняется (продолжает существовать) исходная популяция? Популяция сохраняется тогда и только тогда, когда значение z в установившемся состоянии строго положительно. т.е. тогда и только тогда, когда:

Этот результат чаще выражается в терминах отношения a: b и частоты ошибок q отдельных цифр: установите b / a = (1-s) , тогда условие станет

Логарифмируя с обеих сторон и аппроксимируя малые q и s, получаем

сокращение состояния до:

РНК-вирусы, репликация которых близка к порогу ошибки, имеют размер генома порядка 10 4 (10000) пар оснований . ДНК человека имеет длину около 3,3 миллиарда (10 9 ) базовых единиц. Это означает, что механизм репликации ДНК человека должен быть на несколько порядков точнее, чем РНК вирусов РНК.

Презентация, основанная на теории информации

Чтобы избежать катастрофических ошибок, количество информации, потерянной в результате мутации, должно быть меньше количества информации, полученной в результате естественного отбора. Этот факт может быть использован для получения по существу тех же уравнений, что и более распространенное дифференциальное представление.

Потерянная информация может быть определена количественно как длина генома L, умноженная на частоту ошибок репликации q . Вероятность выживания S определяет количество информации, внесенной естественным отбором, а информация - это отрицательный логарифм вероятности. Следовательно, геном может выжить без изменений только тогда, когда

Например, очень простой геном, где L = 1 и q = 1 - это геном с одним битом, который всегда мутирует. Так как тогда Lq равно 1, отсюда следует, что S должно быть ½ или меньше. Это соответствует половине выживших потомков; а именно половинка с правильным геномом.

Приложения

Некоторые вирусы, такие как полиомиелит или гепатит С, действуют очень близко к критической скорости мутации (т. Е. К самому большому q , которое допускает L ). Лекарства были созданы для увеличения скорости мутаций вирусов, чтобы подтолкнуть их к критической границе, чтобы они потеряли самоидентификацию. Однако, учитывая критику основного предположения математической модели, этот подход проблематичен.

Результат представляет собой загадку уловки-22 для биологов, парадокс Эйгена : в общем, для точной репликации требуются большие геномы (высокая скорость репликации достигается с помощью ферментов ), но большой геном требует высокой точности q для сохранения. Что приходит первым и как это происходит? Иллюстрация сложности: L может быть только 100, если q ' равно 0,99 - очень малая длина строки с точки зрения генов.

Смотрите также

использованная литература

внешние ссылки