Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

AlphaFold

Подписчиков: 0, рейтинг: 0
three individual polypeptide chains at different levels of folding and a cluster of chains
氨基酸折疊形成蛋白質
File:CASP results 2020.png
CASP 2018 競賽(小圓圈)和 CASP 2020 競賽(大圓圈)

AlphaFold(直譯:阿爾法折疊)是Alphabet旗下Google旗下DeepMind开发的一款蛋白質結構預測程式。該程序被設計為一個深度學習系統。

AlphaFold人工智能有2個主要版本:AlphaFold 1(2018)和AlphaFold 2(2020)。前者使用AlphaFold 1在2018年12月的第13屆CASP(英語:Critical Assessment of protein Structure Prediction,直譯:蛋白質結構預測的關鍵評估)的排名中第一。該程序特別成功地預測了被競賽組織者評為最困難的目標的最準確結構,其中沒有來自具有部分相似序列的蛋白質的現有模板結構。

蛋白质通过卷曲折叠會构成三维结构,蛋白质的功能正由其結構決定。了解蛋白質結構有助於開發治療疾病的藥物。DeepMind稱,AlphaFold能在数天内识别蛋白质的形状,而此前學界識別蛋白质形状經常需花費數年時間。2020年11月,在第14届CASP(英語:Critical Assessment of protein Structure Prediction,直譯:蛋白質結構預測的關鍵評估)競賽中,AlphaFold 2(2020)表現良好,中位分数为92.4(满分100分)。它的准确度远远高于其他任何程序

2021年7月15日,AlphaFold2 論文在《自然》雜誌上作為高級訪問出版物與開源軟件和可搜索的物種蛋白質組數據庫一起發表。

AlphaFold蛋白質結構數據庫

AlphaFold蛋白質結構數據庫於2021年7月22日啟動,這是AlphaFold和歐洲分子生物學實驗室歐洲生物信息研究所的共同努力。AlphaFold提供對超過2億個蛋白質結構預測的開放訪問,以加速科學研究。在啟動時,該數據庫包含人類和20種模式生物的幾乎完整UniProt蛋白質組的AlphaFold預測蛋白質結構模型,總計超過365,000種蛋白質(該數據庫不包括少於16個或多於2700個氨基酸殘基蛋白質,但對人類而言,殘基蛋白質可在文件中獲得。)。

AlphaFold目標是覆蓋UniRef90中1億個蛋白質大部分集合。截至2022年5月15日,已有992,316個可用。

蛋白質折疊問題

蛋白質由蛋白質一級結構組成,蛋白質折疊的過程中蛋白質會自發折疊形成蛋白質三級結構。蛋白質結構對蛋白質生物學功能至關重要。然而,了解氨基酸序列如何確定蛋白質三級結構極具挑戰性,這被稱為「蛋白質折疊問題」。「蛋白質折疊問題」涉及折疊穩定結構的原子間力熱力學、蛋白質以極快速達到其最終折疊狀態的機制和途徑,以及如何從氨基酸序列預測蛋白質天然結構。

蛋白質結構過去通過諸如X射線晶體學低溫電子顯微鏡核磁共振等技術進行實驗確定,這些技術既昂貴又耗時。

過去60年努力只確定了約170,000種蛋白質結構,而所有生命形式中已知蛋白質超過2億種。

如果可以僅從氨基酸序列預測蛋白質結構,將極大地促進科學研究。然而利文索爾佯謬表明,雖蛋白質可在幾毫秒內折疊,但隨機計算所有可能的結構以確定真正的天然結構所需的時間比已知宇宙的年齡要長,這使得預測蛋白質為科學家們構建了生物學中的一項重大挑戰。

多年來,研究人員應用了許多計算方法來解決蛋白質結構預測問題,但除了小而簡單的蛋白質外,它們準確性還遠遠遠沒有接近實驗技術,從而限制了科學研究。

CASP於1994年發起,旨在挑戰科學界做出最好的蛋白質結構預測,結果對於最困難的到2016年的蛋白質發現GDT分數也只能達到100滿分的40分。

2018年,AlphaFold使用人工智能深度學習技術參加CASP

算法

應用

AlphaFold已被用於預測SARS-CoV-2COVID-19的病原體)的蛋白質結構。 這些蛋白質的結構在2020年初有待實驗檢測。在將結果發佈到更大的研究界之前,英國弗朗西斯·克里克研究所(Francis Crick Institute)的科學家們對結果進行了檢查。該團隊還證實了對實驗確定的SARS-CoV-2刺突蛋白的準確預測,該蛋白在國際開放存取數據庫蛋白質資料庫(Protein Data Bank)中共享,然後發布了計算確定的未充分研究的蛋白質分子的結構。

參見

外部链接

AlphaFold(2018年)

AlphaFold 2(2020年)


Новое сообщение