一個國際研究團隊開發了突破性的技術,結合人工智慧和基因分析,更精準地預測疾病風險。這項發表於《自然》期刊的研究,利用名為lentiMPRA的技術,分析了人類基因組中數十萬個控制基因表達的DNA片段,並通過機器學習模型MPRALegNet預測基因的活性,準確度堪比實驗結果。
以往分析這些稱為順式調節元件 (CREs) 的DNA片段十分困難,但lentiMPRA 技術利用獨特的DNA條形碼標記CREs,能同時分析它們的活性,效率大幅提升。研究人員將此技術應用於肝細胞、淋巴細胞和誘導多能幹細胞,發現 MPRALegNet模型能準確預測 CREs的活性,並揭示了不同細胞類型中基因表達的差異。
更重要的是,MPRALegNet能識別關鍵的DNA序列,這些序列決定著基因的開啟和關閉,有助於理解特定因子如何影響基因表達,例如研究發現HNF4和GATA基序分別對肝細胞和淋巴細胞的基因活性至關重要。
這項研究為探索人類疾病的分子機制開闢了新道路,例如分析基因多態性,即 DNA 序列的變異,這些變異可能導致個體差異和疾病易感性。通過結合大規模實驗數據和機器學習,這項技術為基因組學和個性化醫療的未來發展奠定了基礎,預計將在疾病預測、診斷和治療方面發揮重要作用。