【佳學基因檢測】基因解碼建立全面的增強子及靶基因關系數(shù)據(jù)庫提高基因檢測結(jié)果的解讀能力
明確遠端調(diào)控元件的靶基因?qū)τ诮忉尰虮磉_及基因突變對人體生命活動的發(fā)生,包括致病基因鑒定靶向藥物的選擇對于目前以數(shù)據(jù)庫為基礎的基因檢測極為困難。但是這一目標極為重要。通過實驗獲得的增強子靶基因關系數(shù)據(jù)會局限于一小部分增強子和/或細胞類型。由于缺乏系統(tǒng)評估,全基因組測序后分析的方法的正確性仍然讓很多人持懷疑態(tài)度?!斗峭怙@子基因信息區(qū)域的基因解碼方法》結(jié)合了多種空間和信息學方法來明確增強子位置,通過大數(shù)據(jù)的方式將來自500種細胞類型的數(shù)據(jù)集聚起來,以間立增強子與其調(diào)控目標基因的聯(lián)系。生成了1860個人類基因組范圍的遠端增強子與其目標基因的關系圖,形成ENTDEF數(shù)據(jù)庫,便于更多基因檢測機構(gòu)調(diào)用,并通過生物信息方法形成基因檢測報告。為了展示這一數(shù)據(jù)關系集的正確性,《非外顯子基因信息區(qū)域的基因解碼方法》課題組對來自87個芯片測序數(shù)據(jù)中的34個轉(zhuǎn)錄因子的基因調(diào)控數(shù)據(jù)進行分析,評估了預測數(shù)據(jù)的正確性。
截止到2022年年中,《基因檢測市場調(diào)查機構(gòu)》發(fā)現(xiàn)除了基因解碼機構(gòu)以外,99.9%的基因檢測公司通過全外顯子測試獲得人體的基因信息數(shù)據(jù),以用于罕見病、基因病的致病基因鑒定,僅有一定以基因解碼技術(shù)為核心的臨床醫(yī)學檢驗中心,堅持除全外顯子以外基因序列的重要性。堅持了基因調(diào)控序列對于疾病發(fā)生的重要性的認識。根據(jù)《非外顯子基因信息區(qū)域的基因解碼方法》增強子、沉默子及和絕緣體是關鍵的基因組順式調(diào)節(jié)元件,通過與它們控制的目標基因、靶基因的啟動子物理接觸,在基因表達的時空控制中發(fā)揮關鍵作用。啟動子位于轉(zhuǎn)錄起始區(qū)(TSS)的上游,促進對轉(zhuǎn)錄因子和RNA聚合酶II(RNAPII)的吸引和結(jié)合,以指導基因轉(zhuǎn)錄的啟動和方向,而增強子和沉默子可以位于基因組中的任何位置,通常位于遠端區(qū)域,如上游、下游,或者在目標基因或無關基因的內(nèi)含子中。通過與靶基因啟動子的相互作用,增強子與激活蛋白結(jié)合并刺激轉(zhuǎn)錄速率,而沉默子與阻遏蛋白結(jié)合并降低轉(zhuǎn)錄速率。在某些情況下,增強子/沉默子和啟動子之間的相互作用是不需要的,絕緣體可以阻止它們的相互作用。順式調(diào)控元件和啟動子連接受組織特異性轉(zhuǎn)錄因子和輔助因子(如p300和介體)的約束,指導基因組轉(zhuǎn)錄的內(nèi)容、時間和方式,從而控制發(fā)育和分化過程中的細胞命運決定。為簡單起見,以下《非外顯子基因信息區(qū)域的基因解碼方法》將這些遠端順式調(diào)節(jié)元件稱為一般的“增強子”(>5kb來自轉(zhuǎn)錄起始位點[TSS])。