近日,我校藥學(xué)院唐赟教授團隊在Journal of Medicinal Chemistry上發(fā)表了題為“CLaSP: A Contrastive Learning-Guided Latent Scoring Platform for Comprehensive Drug-Likeness Evaluation”的研究論文。該研究報道一個全新的成藥性預(yù)測模型,通過整合ADMET性質(zhì)、理化性質(zhì)以及可合成性,為候選藥物分子帶來更綜合、更具解釋性的成藥性評分。

新藥研發(fā)是一個高風(fēng)險,高投入,高回報的過程。據(jù)統(tǒng)計,平均每10000個化合物中只有1個化合物最終可能成為藥物。臨床前的藥物相似性(drug-likeness)研究通過評估化合物的安全性、有效性和藥代動力學(xué)等關(guān)鍵屬性,能夠快速而精確地判斷其作為潛在藥物的可行性。傳統(tǒng)的藥物相似性評估多以經(jīng)驗法則為基礎(chǔ)(如Ro5及其擴展),雖便于快速篩選,卻因閾值剛性、缺乏量化判別而難以精細區(qū)分候選物的優(yōu)劣。后續(xù)提出的加權(quán)函數(shù)方法(如QED)雖然實現(xiàn)了定量評分,但對毒性等關(guān)鍵安全性維度考慮不足,易導(dǎo)致評價不全面。基于上述痛點,亟需一種統(tǒng)一、可推廣且可解釋的藥物相似性評價范式,既能整合ADMET與理化先驗,又能在數(shù)據(jù)驅(qū)動下給出可執(zhí)行的優(yōu)化指引。
為應(yīng)對上述挑戰(zhàn),唐赟教授團隊在既有工作的基礎(chǔ)上(ADMET-score,2019;DBPP-Predictor,2024)取得了進一步突破,建立了一種基于三元組對比學(xué)習(xí)的變分自編碼框架(CLVAE)的方法用于藥物相似性評估。該方法以分子的ADMET性質(zhì)為核心,融合經(jīng)典理化性質(zhì)與可合成性,通過半監(jiān)督的三元組對比損失訓(xùn)練構(gòu)建結(jié)構(gòu)良好的“類藥”潛空間,并通過潛空間坐標(biāo)導(dǎo)出可解釋的成藥性評分。該評分方法在多個基準(zhǔn)數(shù)據(jù)集的評估中優(yōu)于現(xiàn)有方法,且可給出評分成因與方向性優(yōu)化建議。在案例研究中,該方法準(zhǔn)確刻畫了Wee1抑制劑的性質(zhì)優(yōu)化軌跡,顯示出良好的應(yīng)用潛力。平臺可通過https://lmmd.ecust.edu.cn/CLaSP/在線訪問。
作者系統(tǒng)比較了不同的降維方法用于構(gòu)建潛在的成藥性評價空間,線性降維方法(PCA)表現(xiàn)最差,在常見的描述符中,PCA方法的前三維的方差解釋性不足10%,丟失了大量的潛在分子信息。而作者構(gòu)建的CLVAE方法取得了最佳表現(xiàn)。

圖1:CLVAE(A)、VAE(B)、PCA(C)、T-SNE(D)、UMAP(E)方法類藥空間構(gòu)建對比圖
作者在多類數(shù)據(jù)集上系統(tǒng)評估了CLaSP:以FDA批準(zhǔn)藥物與其他國家/地區(qū)批準(zhǔn)藥物(Worlddrug)為正例集;以ChEMBL、ZINC(可購買化合物數(shù)據(jù)庫)和GDB17(虛擬化學(xué)空間)為對照庫;并引入WITHDRAWN(已撤市藥物)與Investigation(在研藥物)等真實集合進行外部檢驗。結(jié)果顯示,CLaSP能輸出可與藥物優(yōu)化流程直接對接的綜合評分,在不同數(shù)據(jù)來源與化學(xué)空間上均表現(xiàn)出良好的判別力與適用性,具有較強的應(yīng)用潛力(圖2)。

圖2:CLaSP、QED、DBPP評分在不同數(shù)據(jù)集上的表現(xiàn)
為驗證評分體系的應(yīng)用價值,作者針對Wee1抑制劑開展了案例研究:與不良反應(yīng)事件相關(guān)的AZD1775與ZN-c3在CLaSP評分中處于較低水平;相較之下,優(yōu)化后的化合物32、34以及目前在研的化合物3獲得更高評分,顯示出良好的優(yōu)化潛力(圖3)。

圖3:CLaSP評分在Wee1抑制劑的案例研究
CLaSP以三元組對比學(xué)習(xí)的VAE統(tǒng)一整合ADMET、理化與可合成性信息,構(gòu)建可解釋的類藥潛空間并生成量化評分,在多基準(zhǔn)與Wee1案例中驗證有效,有望為早期篩選、系列優(yōu)選與先導(dǎo)優(yōu)化提供可量化、可解釋的決策參考。
華東理工大學(xué)藥學(xué)院的研究生李新民是論文的第一作者,我校藥學(xué)院唐赟教授為通訊作者。研究工作得到國家重點研發(fā)計劃、國家自然科學(xué)基金等科研項目資助。
論文鏈接:https://pubs.acs.org/doi/10.1021/acs.jmedchem.5c01618