機(jī)械進(jìn)修和年夜數(shù)據(jù)贊助化學(xué)家在浩大的化學(xué)藥品宇宙中尋覓更好的藥物
在2016年,Sunovion制藥公司交給一些老員工一項(xiàng)特別義務(wù)。在美國(guó)馬薩諸塞州的公司總部,化學(xué)家們被請(qǐng)求停止一項(xiàng)尋覓新藥最好先導(dǎo)化合物的游戲。在他們的任務(wù)站中有包含幾百種化學(xué)構(gòu)造的網(wǎng)格,個(gè)中只要十種標(biāo)有相干生物學(xué)信息。專家們必需基于他們辛勞學(xué)到的化學(xué)構(gòu)造及生物常識(shí)來(lái)選出其他能夠作為候選藥物的份子。在11位選手中,10位為這項(xiàng)義務(wù)冥思苦想了數(shù)小時(shí),但剩下的一位選手卻在幾毫秒內(nèi)就輕松完成,由于這名選手是一種盤算機(jī)算法。
系內(nèi)行星Ross 128b繞一顆高溫矮星運(yùn)轉(zhuǎn),它的外面能夠存在液態(tài)水。圖片起源:Vasava
這一盤算機(jī)法式由Willem van Hoorn發(fā)明,他是應(yīng)用人工智能設(shè)計(jì)藥物的新公司Exscientia的化學(xué)信息學(xué)擔(dān)任人。這一公司位于英國(guó)鄧迪,愿望能與Sunovion樹立初步協(xié)作關(guān)系,為此下了很高的賭注。“我的信用危在夙夜遲早。”Hoorn表現(xiàn)。二十輪游戲停止后,他高分勝出,也終究松了一口吻。他的算法仿佛是應(yīng)用了一些化學(xué)黑魔法;由于最初唯一一名藥物發(fā)明專家擊敗了機(jī)械。
從那時(shí)起,Exscientia公司便和Sunovion持續(xù)協(xié)作開辟精力病醫(yī)治藥物。Sunovion的盤算化學(xué)主管Scott Brown表現(xiàn):“這場(chǎng)比賽切實(shí)其實(shí)贊助我們收買了化學(xué)研討決議計(jì)劃者。”
Exscientia公司是工業(yè)和學(xué)術(shù)界中一日千里的、應(yīng)用盤算機(jī)摸索遼闊化學(xué)藥品宇宙的浩瀚團(tuán)隊(duì)之一。化學(xué)家們估量約有10^60種具有藥物特征的化合物可以或許被分解,這些小份子的數(shù)量乃至跨越了太陽(yáng)系一切原子的總數(shù)。他們?cè)竿?jīng)由過(guò)程盤算機(jī)算法對(duì)有數(shù)的化合物停止掛號(hào)、分類并比擬其特征,從而贊助研討者疾速、低本錢地找到針對(duì)某一靶點(diǎn)的最好候選藥物。支撐者們表現(xiàn)如許的戰(zhàn)略可以或許使藥物更平安,削減在臨床試驗(yàn)中掉敗的藥物數(shù)目,同時(shí)使得新醫(yī)治辦法的發(fā)明成為能夠。另外還有助于開啟未摸索過(guò)和曾被以為無(wú)價(jià)值的化學(xué)范疇。
但是仍有很多藥物化學(xué)家對(duì)此持疑惑立場(chǎng),不信任奧妙、龐雜的化學(xué)可以或許簡(jiǎn)略縮減為幾行代碼。乃至某些人工智能的擁戴者也認(rèn)可很多測(cè)驗(yàn)考試都以掉敗了結(jié):盤算機(jī)生成的化合物中充滿著難以分解的構(gòu)造,如3-或4-原子環(huán),同時(shí)還有很多不平安的活性基團(tuán)。van Hoorn以為:“假如研討者不懂得該范疇,只是簡(jiǎn)略履行某些盤算辦法會(huì)發(fā)生掉敗成果,他們想出的化合物純屬笑話。”但他也表現(xiàn)專業(yè)人員的介入也許可以或許贊助這些熱情的設(shè)計(jì)者。“我認(rèn)為假如盤算機(jī)迷信家與真實(shí)的化學(xué)家協(xié)作,某些設(shè)法主意是可以或許完成的。”
摸索化學(xué)宇宙
在化合物的宇宙中飛行須要有地圖的贊助。在2001年,瑞士伯爾尼年夜學(xué)的化學(xué)家Jean-Louis Reymond開端應(yīng)用盤算機(jī)來(lái)繪制一幅盡量周全的化學(xué)宇宙地圖。經(jīng)由16年盡力,他構(gòu)建降生界上最年夜的小份子數(shù)據(jù)庫(kù),即一個(gè)包括1660億種化合物的宏大虛擬聚集。這一數(shù)據(jù)庫(kù)被定名為GDB-17,包含全體相符化學(xué)道理的、由少于17個(gè)原子組成的無(wú)機(jī)份子,這一數(shù)量是Reymond的盤算性能夠處置的下限。Reymond表現(xiàn):“僅僅是用盤算機(jī)構(gòu)成數(shù)據(jù)庫(kù)中化合物的清單就須要10個(gè)小時(shí)以上。”
為了理清多余的潛伏藥物原始信息,Reymond想出了一種使化合物宇宙體系化的方法。受元素周期表的啟示,他將各化合物在多維空間內(nèi)分類,相鄰化合物具有鄰近特征。各化合物的地位由42種特征來(lái)決議,例如每種化合物中所含的碳原子數(shù)。
每種投放到市場(chǎng)中的藥物都有不計(jì)其數(shù)種與其化學(xué)構(gòu)造根本雷同的化合物,其差異僅僅在于一個(gè)氫原子或一個(gè)雙鍵。這個(gè)中某些化合物能夠比獲批的藥物后果更好。化學(xué)家弗成能在沒(méi)有外界贊助的情形下斟酌到一切這些變體。正如Reymond所言:“僅用紙筆毫不能夠獲得一切這些異構(gòu)體。”
而Reymond和他的團(tuán)隊(duì)可以或許經(jīng)由過(guò)程搜刮化合物之間類似性,來(lái)判定與已同意藥物鄰近、有潛伏醫(yī)治價(jià)值的其他化合物。以某種藥物作為動(dòng)身點(diǎn),團(tuán)隊(duì)可以或許在三分鐘內(nèi)挑選數(shù)據(jù)庫(kù)中的1660億種化合物來(lái)尋覓后續(xù)候選藥物。在一次概念驗(yàn)證明驗(yàn)中,Reymond以一種能與乙酰膽堿受體(與神經(jīng)體系和肌肉功效掉調(diào)相干的主要靶點(diǎn))聯(lián)合的已知份子為動(dòng)身點(diǎn) ,編制出包含344種化合物的名單。該團(tuán)隊(duì)分解了個(gè)中三種化合物,而且發(fā)明兩種可以或許有用激活受體,也許可以或許用于醫(yī)治老年人肌肉萎縮。Reymond表現(xiàn)這類辦法像是應(yīng)用地圖來(lái)找金子,他說(shuō):“你須要某種方法來(lái)選擇去哪里挖。”
別的一種方法用盤算機(jī)在多個(gè)地位尋覓金子,而不用太在乎終點(diǎn)。用藥物發(fā)明的專業(yè)術(shù)語(yǔ)來(lái)講,這意味著用盤算機(jī)挑選宏大的化合物庫(kù)來(lái)尋覓能與特定卵白聯(lián)合的小份子。起首,研討者必需應(yīng)用X射線晶體學(xué)取得某個(gè)卵白的快照,來(lái)決議它聯(lián)合位點(diǎn)的外形。然后,應(yīng)用份子對(duì)接算法,盤算化學(xué)家可以或許從化合物庫(kù)中尋覓出給定位點(diǎn)的最好婚配。
跟著盤算機(jī)技巧飛速成長(zhǎng),這些算法的才能也獲得了晉升。加州年夜學(xué)舊金山分校的化學(xué)家們?cè)贐rian Shoichet的率領(lǐng)下在2016年經(jīng)由過(guò)程尋覓一種新型止痛藥展示了這類辦法的潛力。該團(tuán)隊(duì)從300萬(wàn)種市場(chǎng)上買獲得的化合物中挑選可以或許選擇性激活μ-阿片受體旌旗燈號(hào)通路的候選藥物,以此來(lái)加重痛苦悲傷同時(shí)不搗亂親密相干的β-克制卵白旌旗燈號(hào)通路,該通路與阿片類藥物的反作用(如呼吸頻率降低及便秘)相干。研討者們敏捷將規(guī)模從一個(gè)偉大的化合物庫(kù)減少到唯一23種高排名的化合物用于后續(xù)研討。
化學(xué)藥物宇宙 圖片起源:nature
在一個(gè)試管中,七種候選化合物顯示出幻想的活性。個(gè)中一種在后續(xù)研討中被制成化合物PZM21,可以或許感化于μ-阿片受體而不激活β-克制卵白。位于舊金山、由Shoichet配合創(chuàng)建的生物科技公司Epiodyne正在依據(jù)這些發(fā)明開辟更平安的止痛藥。Shoichet籌劃應(yīng)用異樣的辦法尋覓可以或許調(diào)理其他G卵白偶聯(lián)受體(GPCRs)的化合物, 該家族的卵白在一切藥物靶點(diǎn)中占到40%。
他的團(tuán)隊(duì)同時(shí)對(duì)含有一億種化合物的虛擬星云停止類似的試驗(yàn),這些化合物從未被分解但其分解進(jìn)程應(yīng)當(dāng)較簡(jiǎn)略。工業(yè)藥物開辟者也在用異樣的辦法停止測(cè)試:位于馬薩諸塞州的生物科技公司Nimbus Therapeutics將一些存在于天然界卻難以從情況(如泥土)平分離的虛擬化合物歸入對(duì)接挑選。能否可以或許發(fā)明藥物還沒(méi)有定論,但該公司的首席履行官Don Nicholson針對(duì)至多一項(xiàng)藥物設(shè)計(jì)法式表現(xiàn):“這將是我們?nèi)w婚配藥物的起源。”
這些虛擬挑選的初步成果搖動(dòng)了Shoichet關(guān)于化學(xué)藥物宇宙的焦點(diǎn)假定之一:只要完美的、藥物豐碩的區(qū)域才是值得存眷的。已劃分的份子星系充滿著有生物活性的化合物,以致于一些人以為在其他處所尋覓是糟蹋時(shí)光。“在我的職業(yè)生活中我一直信任推理進(jìn)程,這么做是有事理的,雖然能夠沒(méi)有許多證據(jù)來(lái)證實(shí)。” Shoichet表現(xiàn)。但是他還沒(méi)有揭橥的、對(duì)一億種化合物的挑選成果惹起了他對(duì)化學(xué)藥物宇宙中很少被摸索區(qū)域的興致。“我開端以為那些星系中藏滿了金子。”
盤算機(jī)的“聰明”
這些數(shù)據(jù)搜刮辦法被實(shí)驗(yàn)和測(cè)試,但用于任務(wù)的盤算機(jī)只能屈服劇本指令。盤算藥物發(fā)明的最前沿是機(jī)械進(jìn)修,算法可以或許應(yīng)用數(shù)據(jù)和經(jīng)歷來(lái)告知本身哪一種化合物與哪一個(gè)靶點(diǎn)聯(lián)合,發(fā)明人類沒(méi)法發(fā)覺(jué)的形式。十幾家公司紛紜開端發(fā)明藥物搜刮算法,并與年夜型制藥企業(yè)協(xié)作停止測(cè)試。
Exscientia的首席履行官Andrew Hopkins為這些辦法的才能做出了強(qiáng)無(wú)力的證實(shí)。臨床前測(cè)試發(fā)明和優(yōu)化候選藥物均勻須要4.5年,化學(xué)家們經(jīng)常分解上千種化合物能力獲得有價(jià)值的先導(dǎo)化合物(即便如許真正投入市場(chǎng)的愿望也異常迷茫)。Exscientia辦法應(yīng)用了多種算法(個(gè)中包含給Sunovion公司研發(fā)高管留下深入印象的那一種)也許可以或許將時(shí)光線延長(zhǎng)到一年,同時(shí)縮減藥物發(fā)明項(xiàng)目中須要斟酌的化合物數(shù)量。
在2015年,Exscientia完成了年夜日本住友制藥公司(位于日本年夜阪, Sunovion是其旗下的公司)為期12個(gè)月的研發(fā)項(xiàng)目。研討者練習(xí)他們的人工智能對(duì)象來(lái)尋覓同時(shí)調(diào)理兩個(gè)G卵白偶聯(lián)受體的小份子,發(fā)明要找到一種好的候選藥物僅須要分解小400種化合物。Hopkins表現(xiàn)最初挑選到的藥物如今已預(yù)備停止精力疾病的臨床實(shí)驗(yàn)。從蒲月起,公司曾經(jīng)與巴黎賽諾菲公司和英國(guó)葛蘭素史克公司簽訂了數(shù)億美元的合約。
除判定先導(dǎo)化合物以外,機(jī)械進(jìn)修算法還能贊助藥物開辟者決議將哪些化合物抹殺在搖籃中,加利福尼亞州圣布魯諾一家人工智能藥物設(shè)計(jì)公司Numerate的首席技巧官Brandon Allgood表現(xiàn)。假如一種化合物沒(méi)法經(jīng)由過(guò)程毒性或接收性測(cè)試,那從一開端就沒(méi)有需要制造或測(cè)試它。“人工智能只須要幾毫秒來(lái)決議能否消除這類化合物。” Allgood說(shuō),在開端應(yīng)用人工智能對(duì)象研討化學(xué)物資宇宙前,他曾進(jìn)修宇宙學(xué)。Numerate本年已與制藥公司殺青兩筆生意業(yè)務(wù),個(gè)中一筆與位于法國(guó)敘雷訥的施維雅公司協(xié)作,將人工智能發(fā)明的藥物投入心臟衰竭和心律掉常的臨床試驗(yàn)中。
雖然工業(yè)投資疾速增加,但盤算辦法仍有待證實(shí)。固然Reymond的數(shù)據(jù)庫(kù)比其他庫(kù)加倍宏大,但它僅包含了化學(xué)藥物宇宙中渺小的一部門(拜見(jiàn)“化學(xué)藥物宇宙”)。雖然他的數(shù)據(jù)庫(kù)中已包含1660億種化合物,但他仍須要持續(xù)摸索,正如一個(gè)測(cè)驗(yàn)考試數(shù)清夜空中一切星星的宇航員才方才只數(shù)了一個(gè)。基于將樣品與卵白相婚配的挑選須要精確的晶體構(gòu)造能力獲得最好的成果,而生成這些數(shù)據(jù)須要時(shí)光、金錢和經(jīng)歷。
這些辦法同時(shí)很難處置靜態(tài)的卵白,沒(méi)法靠得住地對(duì)候選者的優(yōu)秀性停止排序。從機(jī)械進(jìn)修算法的角度而言,它們的表示取決于為其供給基礎(chǔ)的培訓(xùn)數(shù)據(jù)集,當(dāng)它們碰到與之前見(jiàn)過(guò)的份子類似度極低的化合物,算法的表示便會(huì)很蹩腳。除此以外,全部法式好像黑箱功課,沒(méi)法得知機(jī)械進(jìn)修為什么猜測(cè)某個(gè)化合物是優(yōu)越的婚配。
很多盤算辦法還有一個(gè)末路人的地方就是經(jīng)常給出難以在試驗(yàn)室分解的化合物。化學(xué)家不能不辛苦的想方法分解候選化合物,能夠要消費(fèi)幾個(gè)月乃至更長(zhǎng)。即使如斯,分解的份子也不克不及包管有感化。Reymond的辦法今朝猜測(cè)化合物活性的精確率唯一5~10%,這意味著化學(xué)家不能不辛勞測(cè)驗(yàn)考試多達(dá)20種化合物來(lái)找到個(gè)中一種相符希冀的。Reymond 表現(xiàn):“我們摸索化學(xué)藥物宇宙的瓶頸是在于分解化合物的才能。”為懂得決這個(gè)成績(jī),他比來(lái)將他的化學(xué)物資宇宙縮減到1000萬(wàn)種易分解,同時(shí)仍籠罩普遍特點(diǎn)的份子。
美國(guó)馬薩諸塞州Relay Therapeutics公司的首席迷信官M(fèi)ark Murcko以為盤算化學(xué)家應(yīng)當(dāng)少存眷新的算法戰(zhàn)略而將留意力放在進(jìn)步算法的培訓(xùn)數(shù)據(jù)集。他表現(xiàn):“我所曉得的讓一個(gè)猜測(cè)模子變得更精確的好辦法之一就是給它更多更好的數(shù)據(jù)。” Relay和其他公司勉勵(lì)化學(xué)家和盤算迷信家親密協(xié)作,分解由人類和算法配合建議的化合物,同時(shí)依據(jù)獲得的成果來(lái)進(jìn)改良將來(lái)的決議計(jì)劃。
關(guān)于Hopkins,如許的協(xié)作相當(dāng)主要。盤算機(jī)迷信家曾消費(fèi)數(shù)十年來(lái)寫可以或許克服圍棋年夜師的法式。在1997年,IBM的深藍(lán)擊敗了Garry Kasparov。但是如許的掉敗其實(shí)不意味著圍棋的停止。相反,Kasparov設(shè)置了一場(chǎng)雙人競(jìng)賽,每隊(duì)有一小我類一小我工智能。Hopkins 表現(xiàn):“人類和人工智能一路能勝過(guò)任何人,異樣也勝過(guò)任何算法。” 他愿望用異樣的方法將數(shù)據(jù)剖析、發(fā)明性和知識(shí)相聯(lián)合來(lái)轉(zhuǎn)變藥物發(fā)明,“我信任我們?nèi)缃裾幵贙asparov與深藍(lán)結(jié)合的時(shí)辰”。
*原文以The drug-maker's guide to the galaxy為題目,宣布在2017年12月26日的《天然》消息特寫上。原文作者為阿謝爾?穆拉德(Asher Mullard)。