AlphaFold - AlphaFold

AlphaFold - это программа искусственного интеллекта (AI), разработанная Google DeepMind, которая выполняет предсказания структуры белка . Программа разработана как система глубокого обучения .

У программного обеспечения AlphaFold AI было две основные версии. Команда исследователей, использовавшая AlphaFold 1 (2018), заняла первое место в общем рейтинге 13-й критической оценки методов прогнозирования структуры белка (CASP) в декабре 2018 года. Программа оказалась особенно успешной в прогнозировании наиболее точной структуры для целей, оцененных как самый сложный для организаторов конкурса, когда из белков с частично подобной последовательностью не было доступно существующих шаблонных структур .

Команда, использовавшая AlphaFold 2 (2020), повторила свое место в конкурсе CASP в ноябре 2020 года. Команда достигла уровня точности намного выше, чем любая другая группа. Он набрал более 90 баллов примерно для двух третей белков в тесте глобального расстояния CASP (GDT) , тесте, который измеряет степень, в которой структура, предсказанная вычислительной программой, похожа на структуру, определенную лабораторным экспериментом, причем 100 - полное совпадение, в пределах расстояния, используемого для расчета GDT.

Результаты AlphaFold 2 в CASP были охарактеризованы как «поразительные» и трансформирующие. Некоторые исследователи отметили, что точность недостаточно высока для трети его прогнозов, и что он не раскрывает механизм или правила сворачивания белка, чтобы проблема сворачивания белка считалась решенной. Тем не менее, технические достижения пользовались всеобщим уважением.

15 июля 2021 года статья AlphaFold2 была опубликована в Nature в качестве публикации для предварительного доступа вместе с программным обеспечением с открытым исходным кодом и доступной для поиска базой данных протеомов видов .

Проблема сворачивания белков

три отдельные полипептидные цепи на разных уровнях сворачивания и кластер цепей
Аминокислотные цепи, известные как полипептиды , складываются, образуя белок.

Белки состоят из цепочек аминокислот, которые спонтанно складываются в процессе, называемом сворачиванием белка , с образованием трехмерных (3-D) структур белков. Трехмерная структура имеет решающее значение для биологической функции белка. Однако понимание того, как аминокислотная последовательность может определять трехмерную структуру, является очень сложной задачей, и это называется «проблемой сворачивания белка». «Проблема сворачивания белка» включает понимание термодинамики межатомных сил, которые определяют свернутую стабильную структуру, механизма и пути, по которому белок может достичь своего окончательного свернутого состояния с чрезвычайной скоростью, и того, как можно предсказать нативную структуру белка. от его аминокислотной последовательности.

Структуры белков в настоящее время определяются экспериментально с помощью таких методов, как рентгеновская кристаллография , криоэлектронная микроскопия и ядерный магнитный резонанс , которые являются дорогостоящими и трудоемкими. Такие усилия определили структуры около 170 000 белков за последние 60 лет, в то время как известно более 200 миллионов белков для всех форм жизни. Если можно предсказать структуру белка только по аминокислотной последовательности, это очень поможет продвинуть научные исследования. Однако парадокс Левинталя показывает, что, хотя белок может сворачиваться за миллисекунды, время, необходимое для случайного расчета всех возможных структур для определения истинной нативной структуры, больше, чем возраст известной вселенной, что сделало предсказание структур белка сложной задачей. по биологии для ученых.

За прошедшие годы исследователи применили множество вычислительных методов для решения проблемы предсказания структуры белков , но их точность не была близка к экспериментальным методам, за исключением небольших простых белков, что ограничивает их ценность. CASP , который был запущен в 1994 году , чтобы бросить вызов научного сообщества производить свои лучшие предсказания структуры белка, обнаружил , что GDT десятки только около 40 из 100 может быть достигнут для самых сложных белков 2016. AlphaFold начали конкурировать в 2018 году CASP использования искусственный интеллект (ИИ) глубокое изучение техники.

Алгоритм

Известно, что DeepMind обучил программу более чем 170 000 белков из общедоступного хранилища последовательностей и структур белков. Программа использует форму сети внимания , метод глубокого обучения , который фокусируется на том, чтобы алгоритм искусственного интеллекта выявлял части более крупной проблемы, а затем объединял их воедино для получения общего решения. Общее обучение проводилось на вычислительной мощности от 100 до 200 графических процессоров . Обучение системы на этом оборудовании заняло «несколько недель», после чего программе потребуется «несколько дней», чтобы сойтись для каждой структуры.

AlphaFold 1, 2018 г.

AlphaFold 1 (2018) был построен на основе работы, разработанной различными группами в 2010-х годах, работы, в ходе которой были изучены большие банки данных связанных последовательностей ДНК, которые теперь доступны от многих разных организмов (большинство из которых не имеют известных трехмерных структур), чтобы попытаться найти изменения в различных остатках. это оказалось коррелированным, даже несмотря на то, что остатки не были последовательными в основной цепи. Такие корреляции предполагают, что остатки могут быть близки друг к другу физически, даже если они не близки в последовательности, что позволяет оценить карту контактов . Основываясь на недавней работе до 2018 года, AlphaFold 1 расширил это, чтобы оценить распределение вероятностей того, насколько близки могут быть остатки, превратив карту контактов в карту вероятных расстояний. Он также использовал более продвинутые методы обучения, чем раньше, для разработки вывода. Комбинируя статистический потенциал, основанный на этом распределении вероятностей, с вычисленной локальной свободной энергией конфигурации, команда затем смогла использовать градиентный спуск для решения, которое лучше всего подходит для обоих.

Технически Торриси и др. В 2019 году резюмировали подход AlphaFold версии 1 следующим образом:

Центральным элементом AlphaFold является предсказатель карты расстояний, реализованный как очень глубокая остаточная нейронная сеть с 220 остаточными блоками, обрабатывающими представление размерности 64 × 64 × 128, что соответствует входным характеристикам, вычисленным из двух фрагментов из 64 аминокислот. Каждый остаточный блок состоит из трех слоев, включая расширенный сверточный слой 3 × 3 - блоки циклически расширяются до значений 1, 2, 4 и 8. Всего модель имеет 21 миллион параметров. Сеть использует комбинацию 1D и 2D входов, включая эволюционные профили из разных источников и особенности совместной эволюции. Наряду с картой расстояний в виде очень мелкозернистой гистограммы расстояний AlphaFold предсказывает углы Φ и Ψ для каждого остатка, которые используются для создания исходной предсказанной трехмерной структуры. Авторы AlphaFold пришли к выводу, что глубина модели, большой размер обрезки, большой обучающий набор из примерно 29000 белков, современные методы глубокого обучения и богатство информации из прогнозируемой гистограммы расстояний помогли AlphaFold достичь высокой точности прогнозирования карты контактов. .

AlphaFold 2, 2020 г.

Блочная конструкция AlphaFold 2. Два модуля трансформации, основанные на внимании, можно увидеть в центре дизайна. (Источник:)

По словам команды DeepMind, версия программы 2020 года ( AlphaFold 2 , 2020) значительно отличается от исходной версии, выигравшей CASP 13 в 2018 году.

Команда DeepMind определила, что ее предыдущий подход, сочетающий локальную физику с направляющим потенциалом, полученным из распознавания образов, имел тенденцию переоценивать взаимодействия между остатками, которые были рядом в последовательности, по сравнению с взаимодействиями между остатками, находящимися дальше друг от друга по цепи. В результате AlphaFold 1 имел тенденцию отдавать предпочтение моделям с немного большей вторичной структурой ( альфа-спирали и бета-листы ), чем в действительности (форма переобучения ).

Дизайн программного обеспечения, использованный в AlphaFold 1, содержал ряд модулей, каждый из которых обучался отдельно, которые использовались для создания направляющего потенциала, который затем объединялся с физическим энергетическим потенциалом. AlphaFold 2 заменил это системой подсетей, объединенных в единую дифференцируемую сквозную модель, полностью основанную на распознавании образов, которая обучалась интегрированным способом как единая интегрированная структура. Локальная физика в форме уточнения энергии на основе модели AMBER применяется только в качестве финального шага уточнения после того, как прогноз нейронной сети сойдется, и лишь слегка корректирует прогнозируемую структуру.

Ключевая часть системы 2020 два модуля, как полагает, на основе трансформатор дизайн, которые используются для постепенного детализировать вектор информации для каждой связи (или « ребро » в терминологии граф-теории) между аминокислотным остатком из белок и другой аминокислотный остаток (эти отношения представлены массивом, показанным зеленым цветом); и между каждым положением аминокислоты и каждой отдельной последовательностью при выравнивании входной последовательности (эти отношения представлены массивом, показанным красным). Внутри эти уточняющие преобразования содержат уровни, которые имеют эффект объединения релевантных данных и фильтрации нерелевантных данных («механизм внимания») для этих отношений контекстно-зависимым способом, полученным из обучающих данных. Эти преобразования повторяются, обновленная информация, выводимая на одном этапе, становится вводом следующего, при этом уточненная информация остатка / остатка вводится в обновление информации остатка / последовательности, а затем улучшенная информация остатка / последовательности вводится в обновление информация об остатке / остатке. По мере продвижения итерации, согласно одному отчету, «алгоритм внимания ... имитирует способ, которым человек может собрать пазл: сначала соединить кусочки в небольшие группы - в данном случае кластеры аминокислот - а затем искать способы их соединения». сгустки в большее целое ".

Результат этих итераций затем информирует модуль прогнозирования окончательной структуры, который также использует преобразователи, и затем сам подвергается итерации. В примере, представленном DeepMind, модуль предсказания структуры достиг правильной топологии для целевого белка на своей первой итерации, получив оценку GDT_TS, равную 78, но с большим количеством (90%) стереохимических нарушений, т.е. нефизических валентных углов или длины. При последующих итерациях количество стереохимических нарушений уменьшалось. К третьей итерации GDT_TS прогноза приближалось к 90, а к восьмой итерации количество стереохимических нарушений приближалось к нулю.

В ноябре 2020 года команда AlphaFold заявила, что, по их мнению, AlphaFold может получить дальнейшее развитие с возможностью дальнейшего повышения точности.

Соревнования

Результаты, достигнутые для предсказания белка с помощью лучших реконструкций в соревнованиях CASP 2018 (маленькие кружки) и CASP 2020 (большие кружки), по сравнению с результатами, достигнутыми в предыдущие годы. (Источник :)
Малиновая линия тренда показывает, как несколько моделей, включая AlphaFold 1, достигли значительного скачкообразного изменения в 2018 году по сравнению с ранее достигнутыми темпами прогресса, особенно в отношении последовательностей белков, которые считаются наиболее трудно предсказуемыми. .
(Качественные улучшения были сделаны в более ранние годы, но только когда изменения приводят структуры в пределах 8 Å от их экспериментальных положений, они начинают влиять на показатель CASP GDS-TS).
Оранжевая линия тренда показывает, что к 2020 году серверы онлайн-прогнозирования смогли учиться и соответствовать этой производительности, в то время как лучшие другие группы (зеленая кривая) в среднем смогли внести в нее некоторые улучшения. Тем не менее, черная кривая тренда показывает, насколько AlphaFold 2 снова превзошла этот показатель в 2020 году по всем направлениям.
Детальный разброс точек данных указывает на степень согласованности или вариативности, достигнутую AlphaFold. Выбросы представляют собой несколько последовательностей, для которых не удалось сделать столь успешный прогноз.

CASP13

В декабре 2018 года DeepMind AlphaFold занял первое место в общем рейтинге 13-й критической оценки методов прогнозирования структуры белка (CASP).

Программа особенно успешно предсказывала наиболее точную структуру для целей, оцененных организаторами соревнований как наиболее сложные, где не было существующих шаблонных структур из белков с частично подобной последовательностью. AlphaFold дал лучший прогноз для 25 из 43 целевых белков в этом классе, получив средний балл 58,9 по шкале CASP Global Distance Test (GDT) , опередив 52,5 и 52,4 у двух следующих лучших команд, которые также были использование глубокого обучения для оценки контактных расстояний. В целом по всем целям программа получила 68,5 балла GDT.

В январе 2020 года реализации и иллюстративный код AlphaFold 1 был выпущен с открытым исходным кодом на GitHub . но, как указано в файле «Прочтите меня» на этом веб-сайте: «Этот код нельзя использовать для прогнозирования структуры произвольной белковой последовательности. Его можно использовать для прогнозирования структуры только в наборе данных CASP13 (ссылки ниже). Код создания функций тесно связан с нашей внутренней инфраструктурой, а также с внешними инструментами, поэтому мы не можем сделать его открытым ». Следовательно, по сути, депонированный код не подходит для общего использования, а подходит только для белков CASP13. Компания не объявила о планах сделать свой код общедоступным с 5 марта 2021 года.

CASP14

В ноябре 2020 года новая версия DeepMind, AlphaFold 2, выиграла CASP14. В целом AlphaFold 2 сделал лучший прогноз для 88 из 97 целей.

По критерию точности предпочтительного глобального теста расстояния (GDT) программа достигла среднего балла 92,4 (из 100), что означает, что более половины ее прогнозов получили оценку выше 92,4% из-за наличия их атомов в большем количестве атомов. или менее в нужном месте, уровень точности сопоставим с экспериментальными методами, такими как рентгеновская кристаллография . В 2018 году AlphaFold 1 достигла такого уровня точности только в двух из всех своих прогнозов. 88% прогнозов в конкурсе 2020 года имели оценку GDT_TS более 80. По группе задач, отнесенных к наиболее сложным, AlphaFold 2 получил средний балл 87.

88% прогнозов AlphaFold 2, измеряемых среднеквадратичным отклонением (RMS-D) размещения альфа-углеродных атомов в основной цепи белка, которое, как правило, определяется характеристиками наиболее подходящих выбросов. имел среднеквадратичное отклонение менее 4 Å для набора перекрывающихся атомов C-альфа. 76% прогнозов были лучше 3 Å, а 46% имели среднеквадратичную точность для атомов C-альфа лучше 2 Å, со средним среднеквадратичным отклонением в прогнозе 2,1 Å для набора перекрывающихся атомов CA. AlphaFold 2 также добился точности моделирования поверхностных боковых цепей, описанных как «действительно действительно экстраординарные».

Чтобы дополнительно проверить AlphaFold-2, организаторы конференции обратились к четырем ведущим экспериментальным группам за структурами, которые они считали особенно сложными и не могли определить. Во всех четырех случаях трехмерные модели, созданные AlphaFold 2, были достаточно точными, чтобы определить структуры этих белков путем молекулярного замещения . Среди них был целевой T1100 (Af1503), небольшой мембранный белок, изучаемый экспериментаторами в течение десяти лет.

Из трех структур, которые AlphaFold 2 наименее успешно предсказал, две были получены методами ЯМР белков , которые определяют структуру белка непосредственно в водном растворе, тогда как AlphaFold в основном обучался структурам белков в кристаллах . Третий существует в природе как многодоменный комплекс, состоящий из 52 идентичных копий одного и того же домена , и AlphaFold не был запрограммирован на рассмотрение этой ситуации. Для всех мишеней с одним доменом, за исключением только одного очень большого белка и двух структур, определенных с помощью ЯМР, AlphaFold 2 получил оценку GDT_TS более 80.

Ответы

AlphaFold 2 скоринг более чем 90 в CASP «s испытания глобального расстояния (GDT) считается значительным достижением в вычислительной биологии и большого прогресса на пути к многолетнему большой проблемой биологии. Лауреат Нобелевской премии и структурный биолог Венки Рамакришнан назвал результат «ошеломляющим прорывом в проблеме сворачивания белка», добавив, что «это произошло за десятилетия до того, как многие люди в этой области предсказали бы это. Будет интересно увидеть, как это коренным образом изменит биологические исследования ».

Благодаря пресс-релизам CASP и DeepMind, успех AlphaFold 2 привлек широкое внимание средств массовой информации. Помимо новостей в специализированных научных изданиях, таких как Nature , Science , MIT Technology Review и New Scientist , эта история широко освещалась в крупных национальных газетах, а также в общих новостных службах и еженедельных публикациях, таких как Fortune , The Economist , Bloomberg , Der Spiegel и The Spectator . В лондонской газете «Таймс» эта статья стала фото-лидером на первой полосе с двумя дополнительными страницами внутреннего освещения и редакционной статьи. Частой темой было то, что способность точно предсказывать белковые структуры на основе составляющей аминокислотной последовательности, как ожидается, будет иметь широкий спектр преимуществ в области наук о жизни, включая ускорение открытия передовых лекарств и обеспечение лучшего понимания болезней. Сообщая об этом событии, MIT Technology Review отмечает, что ИИ «решил грандиозную проблему биологии пятидесятилетней давности». В той же статье было отмечено, что алгоритм ИИ может «предсказывать форму белков с точностью до атома».

Как резюмирует Der Spiegel, оговорки по поводу этого освещения сосредоточены в двух основных областях: «Еще многое предстоит сделать» и «Мы даже не знаем, как они это делают».

Хотя 30-минутная презентация AlphaFold 2 была проведена во второй день конференции CASP (1 декабря) руководителем проекта Джоном Джампером, она была описана как «чрезвычайно высокоуровневая, насыщенная идеями и инсинуациями, но почти полностью лишенная информации. деталей ». В отличие от других исследовательских групп, представленных на CASP14, презентация DeepMind не была записана и не является общедоступной. Ожидается, что DeepMind опубликует научную статью с описанием AlphaFold 2 в сборнике трудов конференции CASP; но неизвестно, выйдет ли это за рамки того, что было сказано в презентации.

В беседе с El País исследователь Альфонсо Валенсия сказал: «Самое важное, что нам дает этот прогресс, - это знать, что у этой проблемы есть решение, что ее можно решить ... Нам известен только результат. Google не предоставляет программное обеспечение. и это разочаровывающая часть достижения, потому что это не принесет прямой пользы науке ». Тем не менее, поскольку выпуски Google и DeepMind могут помочь другим командам в разработке подобных систем ИИ, это является «косвенным» преимуществом. В конце 2019 года DeepMind выпустила большую часть кода первой версии AlphaFold с открытым исходным кодом; но только тогда, когда работа над гораздо более радикальным AlphaFold 2 шла полным ходом. Другой вариант, который он мог бы выбрать, мог бы заключаться в том, чтобы сделать предсказание структуры AlphaFold 2 доступным в виде онлайн-службы подписки на черный ящик. По оценкам, сходимость для одной последовательности потребует около 10 000 долларов оптового вычислительного времени . Но это лишит исследователей доступа к внутренним состояниям системы, возможности более качественно узнать, что приводит к успеху AlphaFold 2, и возможности для новых алгоритмов, которые могли бы быть более легкими и эффективными, но при этом достигать таких результатов. Опасения по поводу отсутствия прозрачности со стороны DeepMind были противопоставлены пяти десятилетиям крупных государственных инвестиций в открытый банк данных белков, а затем и в открытые репозитории последовательностей ДНК , без которых данных для обучения AlphaFold 2 не существовало бы.

Примечательно, что 18 июня 2021 года Демис Хассабис написал в Твиттере: «Краткая информация о некоторых захватывающих успехах в #AlphaFold! Мы упорно работали над нашим полным методическим документом (в настоящее время на рассмотрении) с сопутствующим открытым исходным кодом и предоставлением широкий бесплатный доступ к AlphaFold для научного сообщества. Скоро будет больше! "

Однако пока не ясно, в какой степени предсказания структуры, сделанные AlphaFold 2, будут соответствовать белкам, связанным в комплексы с другими белками и другими молекулами. Это не было частью конкурса CASP, в котором участвовала AlphaFold, и не было неожиданностью, на которую она была рассчитана внутри компании. Если структуры, которые AlphaFold 2 действительно предсказал, были для белков, которые имели сильные взаимодействия либо с другими копиями самих себя, либо с другими структурами, это были те случаи, когда предсказания AlphaFold 2 были наименее точными и наименее надежными. Поскольку значительная часть наиболее важных биологических машин в клетке состоит из таких комплексов или связана с тем, как структуры белков изменяются при контакте с другими молекулами, эта область будет по-прежнему находиться в фокусе значительного экспериментального внимания.

Поскольку о внутренних паттернах известно так мало, что AlphaFold 2 учится делать свои прогнозы, еще не ясно, в какой степени программа может быть нарушена в способности идентифицировать новые складки, если такие складки недостаточно хорошо представлены в существующем белке. структуры, известные в базах данных структур. Также не очень хорошо известно, в какой степени белковые структуры в таких базах данных, в подавляющем большинстве белков, которые удалось кристаллизовать с помощью рентгеновских лучей, являются репрезентативными для типичных белков, которые еще не кристаллизовались. Также неясно, насколько репрезентативны замороженные белковые структуры в кристаллах по сравнению с динамическими структурами, обнаруженными в клетках in vivo . Трудности AlphaFold 2 со структурами, полученными методами ЯМР белков, не могут быть хорошим знаком.

Говоря о его потенциале в качестве инструмента для открытия лекарств , Стивен Карри отмечает, что, хотя разрешение структур AlphaFold 2 может быть очень хорошим, точность моделирования сайтов связывания должна быть еще выше: обычно исследования молекулярного докинга требуют, чтобы положения атомов были точность в пределах 0,3 Å , но предсказанная структура белка имеет в лучшем случае только RMSD 0,9 Å для всех атомов. Таким образом, структуры AlphaFold 2 могут быть лишь ограниченным подспорьем в таких контекстах. Более того, по словам обозревателя Science Дерека Лоу , поскольку предсказание связывания малых молекул даже в этом случае все еще не очень хорошее, вычислительное предсказание мишеней лекарств просто не в состоянии стать «основой» корпоративных открытий лекарств - так что » определение структуры белка просто не является ограничивающим шагом в открытии лекарств в целом ». Также было отмечено, что даже имея структуру белка, понять, как он функционирует, что он делает и как это вписывается в более широкие биологические процессы, все еще может быть очень сложной задачей. Тем не менее, если лучшее знание структуры белка может привести к лучшему пониманию механизмов отдельных заболеваний и, в конечном итоге, к лучшим мишеням для лекарств или лучшему пониманию различий между моделями человека и животных, в конечном итоге это может привести к улучшениям.

Наконец, некоторые отметили, что даже идеальный ответ на проблему предсказания белка все равно оставит вопросы о проблеме сворачивания белка - детальное понимание того, как процесс сворачивания на самом деле происходит в природе (и как иногда они могут складываться неправильно ).

Но даже с такими оговорками AlphaFold 2 был описан как огромный технический шаг вперед и интеллектуальное достижение.

База данных структуры белков

База данных по структуре белков AlphaFold
Содержание
Типы данных
захвачены
предсказание структуры белка
Организмы люди; модельные организмы
Контакт
Исследовательский центр EMBL-EBI
Первичное цитирование
Доступ
Веб-сайт https://www.alphafold.ebi.ac.uk/
Скачать URL да
Инструменты
Интернет да
Разное
Лицензия CC-BY 4.0
Политика курирования автоматический

База данных Protein Structure AlphaFold был запущен 22 июля 2021 года в качестве совместных усилий AlphaFold и EMBL-EBI . На момент запуска база данных содержит предсказанные AlphaFold модели белковых структур почти полного протеома UniProt человека и 20 модельных организмов , что составляет более 365 000 белков. AlphaFold планирует добавить в коллекцию больше последовательностей. По состоянию на июль 2021 года UniProt-KB и InterPro были обновлены, чтобы отображать прогнозы AlphaFold, когда они доступны. База данных не включает белки с менее чем 16 или более чем 2700 аминокислотными остатками , но для людей они доступны во всем пакетном файле.

Приложения

SARS-CoV-2

AlphaFold использовался для прогнозирования структур белков SARS-CoV-2 , возбудителя COVID-19 . Структуры этих белков ожидали экспериментального обнаружения в начале 2020 года. Результаты были изучены учеными из Института Фрэнсиса Крика в Соединенном Королевстве перед публикацией в более широком исследовательском сообществе. Команда также подтвердила точное предсказание экспериментально определенного спайкового белка SARS-CoV-2, который был опубликован в Protein Data Bank , международной базе данных с открытым доступом, прежде чем опубликовать вычисленные структуры недостаточно изученных белковых молекул. Команда признала, что, хотя эти белковые структуры могут и не быть предметом текущих терапевтических исследований, они улучшат понимание сообществом вируса SARS-CoV-2. В частности, предсказание AlphaFold 2 структуры белка ORF3a было очень похоже на структуру, определенную исследователями из Калифорнийского университета в Беркли с помощью криоэлектронной микроскопии . Считается, что этот специфический белок помогает вирусу вырваться из клетки-хозяина после его репликации. Также считается, что этот белок играет роль в запуске воспалительной реакции на инфекцию.

Опубликованные работы

AlphaFold исследования

Производные исследования

  • Ян, Цзяньи; Анищенко, Иван; Парк, Ханбом; Пэн, Чжэнлин; Овчинников, Сергей; Бейкер, Дэвид (21 января 2020 г.). «Улучшенное предсказание структуры белка с использованием предсказанных ориентаций между остатками» . Труды Национальной академии наук Соединенных Штатов Америки . 117 (3): 1496–1503. bioRxiv  10.1101 / 846279 . DOI : 10.1073 / pnas.1914677117 . PMC  6983395 . PMID  31896580 .
  • Биллингс, Венди М .; Геделиус, Брайс; Миллкам, Тодд; Вингейт, Дэвид; Корте, Деннис Делла (04.11.2019). "ProSPr: демократизированная реализация сети предсказания расстояния между белками Alphafold". п. 830273. bioRxiv  10.1101 / 830273 .S2CID  209578310
  • Пэк, Минкён; ДиМайо, Фрэнк; Анищенко, Иван; Даупарас, Юстас; Овчинников, Сергей; Ли, Гю Ри; Ван, Цзюэ; Цун, Цянь; Кинч, Лиза Н .; Шеффер, Р. Дастин; Миллан, Клаудиа; Парк, Ханбом; Адамс, Карсон; Глассман, Калеб Р .; ДеДжиованни, Энди; Перейра, Хосе Х .; Родригес, Андрия В .; ван Дейк, Альбердина А .; Ebrecht, Ana C .; Opperman, Diederik J .; Загмейстер, Тео; Бюльхеллер, Кристоф; Павков-Келлер, Чай; Rathinaswamy, Manoj K .; Далвади, Удит; Yip, Calvin K .; Берк, Джон Э .; Гарсия, К. Кристофер; Гришин, Ник В .; Адамс, Пол Д .; Прочтите, Рэнди Дж .; Бейкер, Дэвид (15 июля 2021 г.). «Точное предсказание белковых структур и взаимодействий с использованием трехдорожечной нейронной сети» . Наука . 373 (6557): 871–876. Bibcode : 2021Sci ... 373..871B . DOI : 10.1126 / science.abj8754 . PMID  34282049 .

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки

AlphaFold 1

AlphaFold 2