深度學(xué)習(xí)模型可預(yù)測細(xì)胞每分鐘發(fā)育變化
鐘發(fā)育變化為構(gòu)建“數(shù)字胚胎”奠定基礎(chǔ)
記者張夢然
點(diǎn)擊播報(bào)本文,約
美國麻省理工學(xué)院、密歇根大學(xué)和東北大學(xué)聯(lián)合團(tuán)隊(duì)在最新《自然·方法》雜志上發(fā)表論文,介紹了一種名為“MultiCell”的幾何深度學(xué)習(xí)模型。該模型首次實(shí)現(xiàn)了在單細(xì)胞分辨率下,預(yù)測果蠅胚胎發(fā)育過程中,每個(gè)細(xì)胞在每分鐘的行為變化。未來可在此基礎(chǔ)上設(shè)計(jì)出通用的多細(xì)胞發(fā)育預(yù)測模型,構(gòu)建“數(shù)字胚胎”,用于藥物篩選甚至指導(dǎo)人工組織設(shè)計(jì)。
一個(gè)胚胎如何從一團(tuán)細(xì)胞變成有頭有尾、有器官的完整生命體,是發(fā)育生物學(xué)領(lǐng)域持續(xù)百年的核心謎題。雖然科學(xué)家早已知道細(xì)胞會(huì)分裂、移動(dòng)、折疊,但具體到某一個(gè)細(xì)胞在下一分鐘會(huì)有什么動(dòng)態(tài)行為,卻一直難以預(yù)測。
模型采用四維全胚胎數(shù)據(jù)進(jìn)行訓(xùn)練和測試,這些數(shù)據(jù)具有亞微米級(jí)分辨率和較高的幀率,每個(gè)胚胎包含約5000個(gè)被標(biāo)注邊界和細(xì)胞核的細(xì)胞。在測試中,模型不僅能判斷細(xì)胞是否會(huì)發(fā)生特定行為,還能精確預(yù)測行為發(fā)生的時(shí)間是幾分鐘后。團(tuán)隊(duì)將這一方法與“阿爾法折疊”預(yù)測的蛋白質(zhì)結(jié)構(gòu)相類比:阿爾法折疊是從氨基酸序列推斷蛋白質(zhì)三維結(jié)構(gòu),“MultiCell”則是從細(xì)胞群落的幾何特征,預(yù)測多細(xì)胞系統(tǒng)的自組織過程。不過,由于胚胎發(fā)育是持續(xù)演變的動(dòng)態(tài)過程,后者遠(yuǎn)比前者復(fù)雜。
團(tuán)隊(duì)將該方法應(yīng)用于果蠅早期胚胎發(fā)育的關(guān)鍵階段——原腸胚形成。模型在3個(gè)胚胎視頻上訓(xùn)練后,被用于預(yù)測第4個(gè)新胚胎的演化過程。結(jié)果顯示,模型在預(yù)測細(xì)胞連接丟失方面的準(zhǔn)確率約90%;在預(yù)測細(xì)胞內(nèi)陷、分裂或重排行為時(shí),也表現(xiàn)了較高的準(zhǔn)確率。
團(tuán)隊(duì)表示,“MultiCell”是首個(gè)能在多細(xì)胞自組裝過程中,實(shí)現(xiàn)各類細(xì)胞行為單細(xì)胞精度預(yù)測的算法。鑒于其可捕捉細(xì)胞動(dòng)力學(xué)上存在的微妙差異,未來將助力早期診斷或藥物篩選。
不過,該方法仍面臨一些問題,包括數(shù)據(jù)稀缺,以及當(dāng)前模型僅基于幾何信息,未整合基因表達(dá)、蛋白質(zhì)定位等。之后加入這些維度,有望更全面揭示物理與生物信息的互動(dòng)。
【總編輯圈點(diǎn)】
預(yù)測單個(gè)細(xì)胞行為,其實(shí)也是解析整個(gè)生命體的第一步,在探索生命奧秘的道路上人類又取得了一大進(jìn)展。科學(xué)家現(xiàn)在能高精確預(yù)測每個(gè)細(xì)胞在下一分鐘會(huì)做什么,而最令人興奮的地方則是其應(yīng)用前景:臨床診斷中,醫(yī)生可能通過分析細(xì)胞行為的微小異常,在疾病癥狀出現(xiàn)前就作出早期預(yù)警;藥物研發(fā)領(lǐng)域,這種技術(shù)可以作為平臺(tái)來模擬藥物效果,大幅提升研發(fā)效率。更長遠(yuǎn)看,它甚至可能助力人工組織設(shè)計(jì)和器官再生。
222
