实时警报通知:微信告警通知的重要性解析
677
2023-01-06
AlphaFold证明人工智能可以解决基本科学问题
预测蛋白质的三维结构是一场计算噩梦(computational nightmare)。1969年,Cyrus Levinthal估计,一种蛋白质有10300种可能的构象组合,这将需要比已知宇宙的年龄更长的时间来用蛮力计算进行评估。而AlphaFold则可以在几天内就完成。
随着科学的发展进步,AlphaFold的发现与James Watson和Francis Crick的DNA双螺旋模型(DNA double helix model),或者最近Jennifer Doudna和Emmanuelle Charpentier的CRISPR-Cas9基因组编辑技术一样,在科学上取得了突破。
几年前,曾有一个团队试图教人工智能去掌握一个有3000年历史的游戏,但最终如何训练人工智能来回答困扰生物学家50年的问题呢?数据科学家、人工智能公司PureStrategy的创始人Briana Brownell说,这就是人工智能的妙处:同样的算法可以用于非常不同的事情。
“每当你遇到问题,你想用人工智能来解决时,”她说,“你需要弄清楚如何将正确的数据输入模型,然后将正确的输出类型转换回现实世界。”
她说,DeepMind的成功与其说是挑选正确的神经网络的功能,不如说是“它们选择了如何以足够复杂的方式设置问题,以神经网络为基础的建模能够真正回答问题。”
除了具有未知结构的蛋白质序列的数据库外,该系统还接受了大约170000个已知实验蛋白质结构的公共数据集的训练。
Brownell说:“如果你看看他们两年前,和这次不同的是,人工智能系统的结构是不同的。这一次,他们发现了如何将真实世界转化为数据……并创建了一个可以转换回现实世界的输出。”
像任何人工智能系统一样,AlphaFold可能需要处理训练数据中的偏差。例如,Brownell说,AlphaFold使用的是蛋白质结构的可用信息,这些信息已经通过其他方式进行了测量。然而,也有许多蛋白质具有未知的三维结构。因此,她说,可以想象,一种偏见可能会蔓延到那些我们有更多结构数据的蛋白质。
Thornton说,很难预测AlphaFold的突破要花多长时间才能转化为实际应用。她说:“我们只有人体20000种蛋白质中约10%的实验结构。一个强大的人工智能模型可以揭示其他90%的结构。”
发表评论
暂时没有评论,来抢沙发吧~