Секвенирование белков - Protein sequencing

Использование протеин-пептидного секвенатора Beckman-Spinco, 1970 г.

Секвенирование белков - это практический процесс определения аминокислотной последовательности всего или части белка или пептида . Это может служить для идентификации белка или характеристики его посттрансляционных модификаций . Как правило, частичное секвенирование белка , обеспечивает достаточную информацию (один или несколько тегов последовательности) , чтобы идентифицировать его со ссылкой на базы данных белковых последовательностей , полученных из концептуального перевода из генов .

Двумя основными прямыми методами секвенирования белков являются масс-спектрометрия и деградация по Эдману с использованием секвенатора белков ( секвенатора ). В настоящее время методы масс-спектрометрии наиболее широко используются для секвенирования и идентификации белков, но деградация по Эдману остается ценным инструментом для характеристики N- конца белка .

Определение аминокислотного состава

Часто желательно знать неупорядоченный аминокислотный состав белка до попытки найти упорядоченную последовательность, так как это знание может быть использовано для облегчения обнаружения ошибок в процессе секвенирования или для различения неоднозначных результатов. Знание частоты встречаемости определенных аминокислот также может быть использовано для выбора протеазы, используемой для переваривания белка. Также можно определить неправильное включение низких уровней нестандартных аминокислот (например, норлейцина) в белки. Обобщенный метод определения частоты встречаемости аминокислот, часто называемый аминокислотным анализом, выглядит следующим образом:

  1. Гидролиз известного количества белка на составляющие его аминокислоты.
  2. Разделите и определите количество аминокислот каким-либо образом.

Гидролиз

Гидролиз осуществляется путем нагревания образца белка в 6 М соляной кислоте до 100–110 ° C в течение 24 часов или дольше. Белки с большим количеством объемных гидрофобных групп могут потребовать более длительных периодов нагрева. Однако эти условия настолько сильны, что некоторые аминокислоты ( серин , треонин , тирозин , триптофан , глутамин и цистеин ) разлагаются. Чтобы обойти эту проблему, Biochemistry Online предлагает нагревать отдельные образцы в течение разного времени, анализировать каждый полученный раствор и экстраполировать обратно на нулевое время гидролиза. Расталл предлагает ряд реагентов для предотвращения или уменьшения разложения, таких как тиоловые реагенты или фенол для защиты триптофана и тирозина от воздействия хлора, а также предварительно окисляющий цистеин. Он также предлагает измерить количество выделившегося аммиака, чтобы определить степень гидролиза амида .

Разделение и количественный анализ

Аминокислоты можно разделить с помощью ионообменной хроматографии, а затем дериватизировать, чтобы облегчить их обнаружение. Чаще всего аминокислоты дериватизируют, а затем разделяют с помощью ВЭЖХ с обращенной фазой .

Пример ионообменной хроматографии дан NTRC с использованием сульфированного полистирола в качестве матрицы, добавления аминокислот в кислотный раствор и пропускания через колонку буфера со стабильно увеличивающимся pH . Аминокислоты элюируются, когда pH достигает их соответствующих изоэлектрических точек . После разделения аминокислот определяют их соответствующие количества, добавляя реагент, который образует окрашенное производное. Если количество аминокислот превышает 10 нмоль, для этого можно использовать нингидрин ; он дает желтый цвет при взаимодействии с пролином и ярко-фиолетовый цвет с другими аминокислотами. Концентрация аминокислоты пропорциональна поглощению полученного раствора. В очень малых количествах, вплоть до 10 пмоль, флуоресцентные производные могут быть образованы с использованием таких реагентов, как ортофтальдегид (OPA) или флуоресцин .

Для получения производных перед колонкой можно использовать реагент Эдмана для получения производного, которое определяется УФ-светом. Более высокая чувствительность достигается при использовании реагента, образующего флуоресцентное производное. Дериватизированные аминокислоты подвергают обращенно-фазовой хроматографии, обычно с использованием колонки с диоксидом кремния C8 или C18 и оптимизированного градиента элюирования . Элюирующие аминокислоты обнаруживают с помощью УФ-детектора или флуоресцентного детектора, а площади пиков сравнивают с таковыми для дериватизированных стандартов, чтобы количественно определить каждую аминокислоту в образце.

N- концевой аминокислотный анализ

Метод Сэнгер пептида концевых групп анализа: дериватизация N - терминальном конце с реагентом Сангера (DNFB), В общей сложности кислотный гидролиз динитрофенил пептида

Определение того, какие аминокислотные , формирует N -terminus из пептидной цепи полезно по двум причинам: чтобы помочь упорядочению последовательностей отдельных пептидных фрагментов в целую цепь, и потому , что первый раунд деградации по Эдману часто загрязнен примесями и , следовательно , делает не дают точного определения N -концевой аминокислоты. Ниже приводится обобщенный метод анализа N- концевых аминокислот:

  1. Взаимодействуйте с пептидом с реагентом, который будет селективно метить концевую аминокислоту.
  2. Гидролизовать белок.
  3. Определите аминокислоту с помощью хроматографии и сравнения со стандартами.

Существует множество различных реагентов, которые можно использовать для мечения концевых аминокислот. Все они реагируют с аминогруппами и, следовательно, также будут связываться с аминогруппами в боковых цепях аминокислот, таких как лизин - по этой причине необходимо быть осторожным при интерпретации хроматограмм, чтобы убедиться, что выбрано правильное пятно. Двумя наиболее распространенными реагентами являются реагент Сенгера ( 1-фтор-2,4-динитробензол ) и производные дансила, такие как дансилхлорид . Также можно использовать фенилизотиоцианат , реагент для разложения по Эдману . Здесь применяются те же вопросы, что и при определении аминокислотного состава, за исключением того, что окрашивание не требуется, поскольку реагенты производят окрашенные производные, и требуется только качественный анализ. Таким образом, аминокислоту не нужно элюировать из хроматографической колонки, а просто сравнивать со стандартом. Еще одно соображение, которое следует принять во внимание, заключается в том, что, поскольку любые аминогруппы будут реагировать с реагентом для метки, нельзя использовать ионообменную хроматографию, а вместо нее следует использовать тонкослойную хроматографию или жидкостную хроматографию высокого давления .

С-концевой аминокислотный анализ

Количество доступных методов анализа C-концевых аминокислот намного меньше, чем количество доступных методов анализа N-концевых аминокислот. Наиболее распространенный метод - это добавление карбоксипептидаз к раствору белка, регулярный отбор образцов и определение конечной аминокислоты путем анализа графика зависимости концентраций аминокислот от времени. Этот метод будет очень полезен в случае полипептидов и N-концов, блокированных белком. С-концевое секвенирование может значительно помочь в проверке первичных структур белков, предсказанных на основе последовательностей ДНК, и в обнаружении пострансляционного процессинга генных продуктов из известных последовательностей кодонов.

Деградация Эдмана

Деградации по Эдману является очень важной реакции для секвенирования белка, поскольку она позволяет упорядоченная аминокислотный состав белка , чтобы быть обнаружены. В настоящее время широко используются автоматические секвенаторы Эдмана, которые могут секвенировать пептиды длиной примерно до 50 аминокислот. Схема реакции для секвенирования белка деградацией по Эдману приведена ниже; некоторые шаги будут подробно описаны позже.

  1. Разрушьте любые дисульфидные мостики в белке с помощью восстановителя, такого как 2-меркаптоэтанол . Для предотвращения повторного образования связей может потребоваться защитная группа, такая как йодуксусная кислота .
  2. Разделите и очистите отдельные цепи белкового комплекса, если их больше одной.
  3. Определите аминокислотный состав каждой цепи.
  4. Определите концевые аминокислоты каждой цепи.
  5. Разбейте каждую цепь на фрагменты длиной менее 50 аминокислот.
  6. Разделите и очистите фрагменты.
  7. Определите последовательность каждого фрагмента.
  8. Повторите то же самое с другим рисунком декольте.
  9. Постройте последовательность общего белка.

Расщепление пептидными фрагментами

Пептиды длиной более 50-70 аминокислот не могут быть надежно секвенированы деградацией по Эдману. Из-за этого длинные белковые цепи необходимо разбивать на небольшие фрагменты, которые затем можно секвенировать индивидуально. Переваривание осуществляется либо эндопептидазами, такими как трипсин или пепсин, либо химическими реагентами, такими как цианогенбромид . Различные ферменты дают разные модели расщепления, и перекрытие между фрагментами можно использовать для построения общей последовательности.

Реакция

Секвенируемый пептид адсорбируется на твердой поверхности. Одна из распространенных подложек - это стекловолокно, покрытое полибреном , катионным полимером . Реагент Эдмана, фенилизотиоцианат (PITC), добавляют к адсорбированному пептиду вместе со слабощелочным буферным раствором 12% триметиламина . Он реагирует с аминогруппой N-концевой аминокислоты.

Конечная аминокислота затем может быть выборочно отделена добавлением безводной кислоты. Затем производное изомеризуется с образованием замещенного фенилтиогидантоина , который можно отмыть и идентифицировать с помощью хроматографии, и цикл можно повторить. Эффективность каждого этапа составляет около 98%, что позволяет надежно определить около 50 аминокислот.

Аппарат для секвенирования белков Beckman-Coulter Porton LF3000G

Секвенсор белков

Белок секвенатор это машина , которая выполняет расщепление по Эдману в автоматическом режиме. Образец белка или пептида иммобилизуют в реакционном сосуде секвенатора белка и проводят деградацию по Эдману. Каждый цикл высвобождает и дериватизирует одну аминокислоту с N- конца белка или пептида, а затем высвобожденное производное аминокислоты идентифицируется с помощью ВЭЖХ. Процесс секвенирования повторяется для всего полипептида до тех пор, пока не будет установлена ​​вся измеряемая последовательность, или в течение заранее определенного количества циклов.

Идентификация масс-спектрометрией

Идентификация белка - это процесс присвоения имени интересующему белку (POI) на основе его аминокислотной последовательности. Как правило, только часть последовательности белка необходимо определить экспериментально, чтобы идентифицировать белок со ссылкой на базы данных последовательностей белков, выведенных из последовательностей ДНК их генов. Дальнейшая характеристика белка может включать подтверждение фактических N- и C-концов POI, определение вариантов последовательности и идентификацию любых присутствующих посттрансляционных модификаций.

Протеолитические переваривания

Описана общая схема идентификации белков.

  1. POI выделяют, как правило, с помощью SDS-PAGE или хроматографии .
  2. Выделенный POI может быть химически модифицирован для стабилизации остатков цистеина (например, S-амидометилирование или S-карбоксиметилирование).
  3. POI переваривается специфической протеазой с образованием пептидов. Трипсин , который избирательно расщепляет C-концевую сторону остатков лизина или аргинина, является наиболее часто используемой протеазой. Его преимущества включают i) частоту остатков Lys и Arg в белках, ii) высокую специфичность фермента, iii) стабильность фермента и iv) пригодность триптических пептидов для масс-спектрометрии.
  4. Пептиды можно обессолить для удаления ионизируемых примесей и подвергнуть масс-спектрометрии MALDI-TOF . Прямое измерение масс пептидов может предоставить достаточную информацию для идентификации белка (см. Массовый фингерпринт пептидов ), но дальнейшая фрагментация пептидов внутри масс-спектрометра часто используется для получения информации о последовательностях пептидов. Альтернативно, пептиды можно обессолить и разделить с помощью ВЭЖХ с обращенной фазой и ввести в масс-спектрометр через источник ESI . LC-ESI-MS может предоставить больше информации, чем MALDI-MS для идентификации белков, но требует больше инструментального времени.
  5. В зависимости от типа масс-спектрометра, фрагментация пептидных ионов может происходить с помощью различных механизмов, таких как диссоциация, вызванная столкновением (CID) или распад после источника (PSD). В каждом случае структура фрагментных ионов пептида предоставляет информацию о его последовательности.
  6. Информация, включая измеренную массу предполагаемых пептидных ионов и их фрагментных ионов, затем сопоставляется с расчетными значениями массы из концептуального (in-silico) протеолиза и фрагментации баз данных белковых последовательностей. Успешное совпадение будет найдено, если его оценка превышает пороговое значение, определенное параметрами анализа. Даже если фактический белок не представлен в базе данных, устойчивое к ошибкам сопоставление позволяет предполагаемую идентификацию белка на основе сходства с гомологичными белками. Для выполнения этого анализа доступны различные программные пакеты.
  7. Пакеты программного обеспечения обычно создают отчет, показывающий идентичность (код доступа) каждого идентифицированного белка, его оценку соответствия и предоставляют меру относительной силы совпадения, когда идентифицировано несколько белков.
  8. Диаграмма сопоставленных пептидов в последовательности идентифицированного белка часто используется для демонстрации покрытия последовательности (% белка, обнаруженного как пептиды). Если предполагается, что POI значительно меньше, чем соответствующий белок, диаграмма может предложить, является ли POI N- или C-концевым фрагментом идентифицированного белка.

De novo секвенирование

Характер фрагментации пептида позволяет напрямую определять его последовательность путем секвенирования de novo . Эта последовательность может использоваться для сопоставления баз данных последовательностей белков или для исследования посттрансляционных или химических модификаций. Это может предоставить дополнительные доказательства для идентификации белков, выполненной, как указано выше.

N- и C-концы

Пептиды, сопоставленные во время идентификации белка, не обязательно включают N- или C-концы, предсказанные для сопоставленного белка. Это может быть результатом того, что N- или C-концевые пептиды трудно идентифицировать с помощью MS (например, они слишком короткие или слишком длинные), посттрансляционно модифицированы (например, N-концевое ацетилирование) или действительно отличаются от предсказанных. Посттрансляционные модификации или усеченные концы могут быть идентифицированы путем более тщательного изучения данных (т.е. секвенирования de novo ). Также может быть полезно повторное расщепление с использованием протеаз различной специфичности.

Посттрансляционные модификации

Хотя подробное сравнение данных MS с прогнозами, основанными на известной последовательности белка, может использоваться для определения посттрансляционных модификаций, также могут использоваться целевые подходы к сбору данных. Например, специфическое обогащение фосфопептидов может помочь в идентификации сайтов фосфорилирования в белке. Альтернативные методы фрагментации пептидов в масс-спектрометре, такие как ETD или ECD , могут дать информацию о комплементарной последовательности.

Определение всей массы

Полная масса белка - это сумма масс его аминокислотных остатков плюс масса молекулы воды с поправкой на любые посттрансляционные модификации. Хотя белки ионизируются хуже, чем пептиды, полученные из них, белок в растворе может быть подвергнут ESI-MS, и его масса может быть измерена с точностью до 1 части к 20000 или лучше. Этого часто бывает достаточно, чтобы подтвердить концы (таким образом, что измеренная масса белка совпадает с предсказанной на основе его последовательности) и сделать вывод о наличии или отсутствии многих посттрансляционных модификаций.

Ограничения

Протеолиз не всегда дает набор легко анализируемых пептидов, покрывающих всю последовательность POI. Фрагментация пептидов в масс-спектрометре часто не дает ионы, соответствующие расщеплению по каждой пептидной связи. Таким образом, выведенная последовательность для каждого пептида не обязательно является полной. Стандартные методы фрагментации не различают остатки лейцина и изолейцина, поскольку они изомерные.

Поскольку деградация по Эдману происходит от N-конца белка, она не будет работать, если N-конец был химически модифицирован (например, путем ацетилирования или образования пироглутаминовой кислоты). Деградация по Эдману обычно не используется для определения положения дисульфидных мостиков. Он также требует количества пептида 1 пикомоль или выше для различимых результатов, что делает его менее чувствительным, чем масс-спектрометрия .

Прогнозирование по последовательностям ДНК / РНК

В биологии белки производятся путем трансляции информационной РНК (мРНК) с последовательностью белка, происходящей из последовательности кодонов в мРНК. Сама мРНК образуется в результате транскрипции генов и может быть дополнительно модифицирована. Эти процессы достаточно изучены, чтобы использовать компьютерные алгоритмы для автоматизации предсказаний последовательностей белков на основе последовательностей ДНК, например, из проектов секвенирования ДНК всего генома, и привели к созданию больших баз данных последовательностей белков, таких как UniProt . Предсказанные белковые последовательности являются важным ресурсом для идентификации белков с помощью масс-спектрометрии.

Исторически короткие белковые последовательности (от 10 до 15 остатков), определенные деградацией по Эдману, транслировались обратно в последовательности ДНК, которые можно было использовать в качестве зондов или праймеров для выделения молекулярных клонов соответствующего гена или комплементарной ДНК. Затем определяли последовательность клонированной ДНК и использовали ее для определения полной аминокислотной последовательности белка.

Инструменты биоинформатики

Существуют инструменты биоинформатики для помощи в интерпретации масс-спектров (см. Секвенирование пептидов De novo ), для сравнения или анализа белковых последовательностей (см. Анализ последовательностей ) или поиска в базах данных с использованием пептидных или белковых последовательностей (см. BLAST ).

Смотрите также

Рекомендации

дальнейшее чтение

  • Стин Х., Манн М (сентябрь 2004 г.). «ABC (и XYZ) пептидного секвенирования». Обзоры природы Молекулярная клеточная биология . 5 (9): 699–711. DOI : 10.1038 / nrm1468 . PMID  15340378 .