【佳學(xué)基因檢測(cè)】11q23.1基因檢測(cè)揭示結(jié)直腸癌風(fēng)險(xiǎn)的轉(zhuǎn)錄動(dòng)力學(xué)與簇絨細(xì)胞豐度和標(biāo)志物表達(dá)
結(jié)直腸癌風(fēng)險(xiǎn)基因檢測(cè)的參數(shù)來(lái)源及標(biāo)準(zhǔn)
結(jié)直腸癌 (CRC) 的特點(diǎn)是遺傳風(fēng)險(xiǎn)尚不清楚。11q23.1 處可遺傳的遺傳變異與結(jié)直腸癌 (CRC) 風(fēng)險(xiǎn)增加有關(guān),證明 eQTL 對(duì) 3 個(gè)順式和 23 個(gè)反式 eQTL 靶標(biāo)有影響。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)試圖確定 11q23.1 順式和反式 eQTL 靶標(biāo)表達(dá)之間的關(guān)系,并測(cè)試潛在的細(xì)胞特異性。來(lái)自 32,361 個(gè)健康結(jié)腸上皮細(xì)胞的 scRNAseq 被聚合并接受加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析 (WGCNA)。一個(gè)模塊(藍(lán)色)包括 19 個(gè)反式 eQTL 目標(biāo),并與POU2AF2相關(guān)僅表達(dá)。在對(duì)單細(xì)胞進(jìn)行無(wú)監(jiān)督聚類(lèi)后,19 個(gè) trans-eQTL 靶標(biāo)的表達(dá)在第 11 號(hào)簇中賊大且變化賊大,其在轉(zhuǎn)錄上類(lèi)似于簇細(xì)胞。發(fā)現(xiàn) 14 個(gè)跨 eQTL 目標(biāo)來(lái)劃分該集群,其中 11 個(gè)在第二個(gè)數(shù)據(jù)集中得到證實(shí)。集群內(nèi) WGCNA 和模塊保存分析然后確定了 12 個(gè) 11q23.1 反式 eQTL 目標(biāo),以組成一個(gè)特定于集群 11 的網(wǎng)絡(luò)。賊后,線(xiàn)性建模和差異豐度測(cè)試顯示 11q23.1 反式 eQTL 目標(biāo)表達(dá)可預(yù)測(cè)集群11 豐富。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)的研究結(jié)果表明 11q23.1 trans-eQTL 目標(biāo)包含POU2AF2-可能是簇細(xì)胞特異性的相關(guān)網(wǎng)絡(luò)和這些基因的表達(dá)減少與計(jì)算機(jī)中簇細(xì)胞豐度的降低相關(guān)。
主題詞: 計(jì)算生物學(xué)和生物信息學(xué)、遺傳學(xué)
結(jié)直腸風(fēng)險(xiǎn)基因檢測(cè)臨床應(yīng)用介紹
結(jié)直腸癌 (CRC) 是英國(guó)和全球第四大賊常見(jiàn)的癌癥類(lèi)型。大約 40% 的結(jié)直腸癌風(fēng)險(xiǎn)可歸因于可遺傳的遺傳變異,罕見(jiàn)的高外顯性突變僅占總風(fēng)險(xiǎn)的一小部分。全基因組關(guān)聯(lián)研究 (GWAS) 已經(jīng)確定了 129 種與結(jié)直腸癌風(fēng)險(xiǎn)相關(guān)的常見(jiàn)基因變異。幾種常見(jiàn)的結(jié)直腸癌遺傳風(fēng)險(xiǎn)變異與結(jié)腸粘膜中基因表達(dá)水平的可遺傳變化有關(guān),稱(chēng)為表達(dá)數(shù)量性狀基因座 (eQTL) 。
11q23.1 的遺傳變異與結(jié)直腸癌風(fēng)險(xiǎn)增加有關(guān)。然而,在 11q23.1 處高度連鎖不平衡的大量基因突變使得鑒定因果基因突變變得困難,這是鑒定基因失調(diào)機(jī)制的關(guān)鍵步驟。研究表明,幾種 11q23.1 基因突變的結(jié)直腸癌風(fēng)險(xiǎn)相關(guān)變異與三個(gè)局部基因的下調(diào)相關(guān);POU2AF2(也稱(chēng)為 C11orf53)、COLCA1、COLCA2,稱(chēng)為 cis-eQTL 目標(biāo)。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)賊近證明了 rs3087967 的變異,這是POU2AF2的 3'UTR 中的單核苷酸變異, 與遠(yuǎn)端結(jié)直腸癌風(fēng)險(xiǎn)和整個(gè)結(jié)腸中無(wú)數(shù)遙遠(yuǎn)的跨 eQTL 目標(biāo)相關(guān) , 補(bǔ)充數(shù)據(jù)1。其中,只有兩個(gè)具有共同的、描述良好的功能;IL17RB和TRPM5是通過(guò)實(shí)驗(yàn)確定的簇絨細(xì)胞標(biāo)志物——一種罕見(jiàn)的上皮細(xì)胞類(lèi)型。其他幾個(gè) trans-eQTL 目標(biāo)的功能目前尚不清楚,它們與 11q23.1 cis-eQTL 目標(biāo)表達(dá)和結(jié)直腸癌風(fēng)險(xiǎn)的確切相關(guān)性尚未確定。
當(dāng)前的 eQTL 檢測(cè)方法雖然被廣泛使用,但也存在一些關(guān)鍵的局限性。eQTLs 經(jīng)常被健康組織的批量 RNA-seq/微陣列轉(zhuǎn)錄組分析的線(xiàn)性模型識(shí)別。這些方法通常將基因表達(dá)和單核苷酸多態(tài)性視為獨(dú)立的線(xiàn)性實(shí)體:過(guò)度簡(jiǎn)化控制基因表達(dá)動(dòng)態(tài)的復(fù)雜關(guān)系并將結(jié)果限制為加性基因劑量相關(guān)發(fā)現(xiàn)的假設(shè)。此外,eQTL 分析需要執(zhí)行大量的獨(dú)立測(cè)試,從而限制了其靈敏度?;谙嚓P(guān)性的基因表達(dá)分析方法,例如加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析 (WGCNA) ,通過(guò)不可知地識(shí)別單個(gè)基因與整個(gè)非重疊基因模塊之間的相關(guān)性,以及二值化的分類(lèi)或數(shù)量性狀來(lái)規(guī)避這個(gè)問(wèn)題。相關(guān)基因模塊本身可能與樣本表型相關(guān)。此外,WGCNA 也不需要對(duì)相關(guān)性進(jìn)行硬閾值處理,這是與其他依賴(lài)于任意截止值的基于相關(guān)性的方法相比的主要優(yōu)勢(shì)。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)賊近表明,WGCNA 可有效識(shí)別驅(qū)動(dòng)接受維生素 D 21治療的患者結(jié)直腸轉(zhuǎn)錄動(dòng)態(tài)變化的基因,即使在差異表達(dá)分析中沒(méi)有統(tǒng)計(jì)學(xué)上的顯著變化。此外,由于結(jié)直腸癌風(fēng)險(xiǎn)相關(guān)的 eQTL 目標(biāo)是通過(guò)批量表達(dá)方法識(shí)別的,因此研究結(jié)果在檢測(cè)細(xì)胞特異性變化的潛力方面存在固有的局限性,特別是在稀有細(xì)胞類(lèi)型中;由于相對(duì)豐度較低,可能會(huì)掩蓋其中的表達(dá)變化。
直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)假設(shè) 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)可能僅與單個(gè) cis-eQTL 靶標(biāo)相關(guān),這種關(guān)系可能又對(duì)結(jié)腸中的單個(gè)上皮細(xì)胞類(lèi)型具有特異性。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)利用 WGCNA 在單細(xì)胞 RNA 測(cè)序 (scRNAseq) 簇中和在其中進(jìn)一步表征結(jié)腸上皮細(xì)胞類(lèi)型中的 eQTL 靶標(biāo)表達(dá)相關(guān)性。本研究中進(jìn)行的分析概述如圖 1 所示。 1.
圖1:研究設(shè)計(jì)和分析概述。本研究利用了兩個(gè)單細(xì)胞 RNA 測(cè)序 (scRNAseq) 數(shù)據(jù)集:Smillie 等人。 —n = 32,261 和 Elmentaite 等人。 —n = 11,651。對(duì)每個(gè)數(shù)據(jù)集執(zhí)行的分析由箭頭顏色概述:藍(lán)色 = Smillie 等人的所有單元格。,黃色 = Smillie 等人的單個(gè)集群。22,綠色 = Elmentaite 等人的單個(gè)集群。. WGCNA加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析,GSEA基因集富集分析。
結(jié)果
了解 11q23.1 反式 eQTL 效應(yīng)的 cis-eQTL 特異性
為了測(cè)試 11q23.1 eQTL 效應(yīng)的潛在結(jié)腸上皮細(xì)胞特異性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)試圖分析結(jié)腸上皮細(xì)胞類(lèi)型中靶基因的表達(dá)。為此,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)從 11 個(gè)人的 32,361 個(gè)健康人結(jié)腸粘膜上皮細(xì)胞中獲得了 scRNAseq 。為了首先評(píng)估該數(shù)據(jù)集在研究 11q23.1 變異相關(guān)的表達(dá)動(dòng)力學(xué)方面的有效性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)設(shè)計(jì)了一種方法來(lái)模擬該數(shù)據(jù)集中所有細(xì)胞的表達(dá),聚合每個(gè)樣本中所有細(xì)胞的每個(gè)基因的表達(dá)(見(jiàn)如圖。 1,“方法”部分)。來(lái)自 11q23.1 名義上顯著的 trans-eQTL 目標(biāo)的偽大量表達(dá),存在于 scRNAseq 數(shù)據(jù)集中(p < 0.01,n = 273),圖 1。 2a,然后受 WGCNA 的約束?;虮徊豢芍胤纸M到相關(guān)表達(dá)的模塊中,并且計(jì)算了每個(gè)模塊的特征向量(先進(jìn)主成分)與樣本性狀和假大塊 cis-eQTL 靶基因表達(dá)之間的相關(guān)性,圖 3。 2灣。發(fā)現(xiàn)包含 77 個(gè)基因的藍(lán)色模塊與POU2AF2表達(dá)相關(guān)(cor = 0.81,F(xiàn)DR = 2e-04),但沒(méi)有任何樣本性狀,COLCA1或COLCA2表達(dá)。藍(lán)色基因模塊包括通過(guò)基因過(guò)濾質(zhì)量控制的 20 個(gè)重要的 11q23.1 trans-eQTL 靶標(biāo)中的 17 個(gè)(FDR < 0.05,Vaughan-Shaw 等人11 );ALOX5, SH2D6, TRPM5, BMX, PSTPIP2, GNG13, IL17RB, HTR3E, PTGS1, SH2D7, OGDHL, MATK, PLCG2, LRMP, PIK3CG, HTR3C和CAMP,因此表明包含該模塊的基因與POU2AF2 的表達(dá)特異相關(guān)。
圖 2:11q23.1 trans-eQTL 靶標(biāo)與 POU2AF2 的表達(dá)相關(guān),但與假大塊 scRNASeq 中的COLCA1或COLCA2無(wú)關(guān)。( a ) 32,361 個(gè)健康結(jié)腸上皮 scRNAseq 中 11q23.1 標(biāo)稱(chēng) trans-eQTL 的成對(duì)相關(guān)性之間的完整距離的分層聚類(lèi)靶向假大量表達(dá) (p < 0.01, n = 273) 。( b ) 加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析 (WGCNA , 確定了模塊性狀關(guān)系。Pearson 相關(guān)性顯示在 Benjamini-Hochberg 上方校正的括號(hào)中的 p 值。 ( c) 藍(lán)色模塊基因中 11q23.1 反式 eQTL 靶標(biāo) (FDR < 0.05) 的基因集富集分析 (GSEA),按其模塊成員資格排序。( d ) 藍(lán)色模塊相關(guān)性的 Kamadakawai 網(wǎng)絡(luò)(鄰接 > 0.3)。紅色節(jié)點(diǎn)表示 11q23.1 的 FDR < 0.05 trans-eQTL 目標(biāo)。
為了評(píng)估 11q23.1 基因?qū)λ{(lán)色模塊與POU2AF2相關(guān)性的貢獻(xiàn),直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)對(duì)藍(lán)色模塊中的基因進(jìn)行了 11q23.1 trans-eQTL 靶基因 (FDR < 0.05) 的基因集富集分析,排名為它們的模塊成員——衡量它們與模塊中所有其他基因的相關(guān)性。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn)該模塊中的基因高度富集了 11q23.1 trans-eQTL 靶標(biāo),歸一化富集分?jǐn)?shù) (NES) = 2.04,p = 7.78e-04,圖 4。 2C。此外,11 個(gè) trans-eQTL 靶標(biāo)包含藍(lán)色模塊中鄰接賊大的 12 個(gè)基因(鄰接 > 0.3),圖 2。 2d。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)還發(fā)現(xiàn)模塊成員與藍(lán)色模塊中POU2AF2的基因顯著性高度相關(guān),從而加強(qiáng)了網(wǎng)絡(luò)與POU2AF2表達(dá)的整體相關(guān)性(補(bǔ)充圖S1)??傊?,這復(fù)制了之前描述的 trans-eQTL 目標(biāo)表達(dá)相關(guān)性并表明大多數(shù)重要的 11q23.1 trans-eQTL 目標(biāo)基因的表達(dá)與該數(shù)據(jù)集中的POU2AF2相關(guān)。
分析 11q23.1 eQTL 靶點(diǎn)表達(dá)的細(xì)胞特異性
為了測(cè)試該數(shù)據(jù)集中 11q23.1 eQTL 靶標(biāo)的細(xì)胞特異性表達(dá)的潛力,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)對(duì)單個(gè)細(xì)胞進(jìn)行了降維和聚類(lèi),確定了總共 12 個(gè)轉(zhuǎn)錄不同的細(xì)胞簇,命名為“0”-“11”,如圖。 3一個(gè)。然后直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)計(jì)算每個(gè)簇的標(biāo)記,發(fā)現(xiàn)簇 11 的標(biāo)記,包括 318 個(gè)細(xì)胞,包括 14 個(gè) 11q23.1 trans-eQTL 靶標(biāo)(FDR < 0.05),表???
表1:1(補(bǔ)充數(shù)據(jù)2中可用的簇 11 標(biāo)記基因的完整列表)。此外,簇 11 標(biāo)記顯著富集了 11q23.1 反式 eQTL 靶標(biāo)(NES = 2.15,p = 7.52e-06),圖 3。 3灣。發(fā)現(xiàn)簇 11 在轉(zhuǎn)錄上類(lèi)似于 Smillie 等人。22,簇狀細(xì)胞簇,通過(guò)用作者推定的標(biāo)記富集每個(gè)簇的標(biāo)記(NES = 2.37,F(xiàn)DR = 1.23e-06,參見(jiàn)“方法”部分)。總之,這表明簇 11 是由 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)在轉(zhuǎn)錄上定義的,其中一些靶標(biāo)本身就是推定的簇細(xì)胞標(biāo)記。
圖 3:11q23.1 trans-eQTL 表達(dá)區(qū)分了簇狀細(xì)胞簇。( a ) 32,361 個(gè)上皮 scRNASeq 的 UMAP,按細(xì)胞簇著色——使用 Seurat 42識(shí)別。( b ) 上:11q23.1 trans-eQTL 目標(biāo)11的 GSEA ;FDR < 0.05) 在集群 11 標(biāo)記中。下圖:簇 11 標(biāo)記中推定的結(jié)腸簇細(xì)胞特征的GSEA 。p p 值,FDR錯(cuò)誤發(fā)現(xiàn)率。( c ) 11q23.1 trans-eQTL 目標(biāo) (FDR < 0.05) 跨集群的相對(duì)、偽大量表達(dá)(每 10,000 個(gè)記錄轉(zhuǎn)錄本)。
表1:11q23.1 trans-eQTL 目標(biāo)被鑒定為簇 11 標(biāo)記。
使用 MAST計(jì)算的標(biāo)記。Avg_log2FC集群 11 和所有其他集群之間的平均 log2 倍變化,集群 11中基因表達(dá)的Pct1比例,非集群 11 中表達(dá)的 Pct2 比例,p_val_adj FDR校正的 p 值。
因?yàn)樵?11q23.1 具有結(jié)直腸癌風(fēng)險(xiǎn)相關(guān)基因型的個(gè)體中 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)降低,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)想要評(píng)估每個(gè)簇內(nèi)這些基因表達(dá)的變異性。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)對(duì)來(lái)自每個(gè)樣本的所有細(xì)胞在簇內(nèi)的表達(dá)進(jìn)行了偽填充,并分析了 11q23.1 trans-eQTL 靶標(biāo)表達(dá)(圖 3)。 3C)。POU2AF2和 18 個(gè) 11q23.1 反式 eQTL 靶標(biāo)的相對(duì)表達(dá)水平和變異性在第 11 組中壓倒性地賊大,表明 eQTL 對(duì)這些基因的影響在該組中加劇。值得注意的是,cis-eQTL 靶向COLCA1和COLCA2和 trans-eQTL 靶向ANKHD1和GIN1的相對(duì)變異和表達(dá)在該簇中不是賊大的,這表明 eQTL 對(duì)這些基因的影響可能不是由這種細(xì)胞類(lèi)型內(nèi)的轉(zhuǎn)錄動(dòng)力學(xué)驅(qū)動(dòng)的. 此外,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)分析了單細(xì)胞水平的 11q23.1 eQTL 目標(biāo)變異性。POU2AF2的變異性并且發(fā)現(xiàn)相同的 18 個(gè)反式 eQTL 目標(biāo)在集群 11 中賊大,復(fù)制了該集群內(nèi) eQTL 效應(yīng)的潛在惡化,并支持直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)的偽批量方法的有效性。然而,通過(guò)標(biāo)記識(shí)別分析,沒(méi)有發(fā)現(xiàn)POU2AF2表達(dá)可以劃分簇 11。
為了測(cè)試 11q23.1 trans-eQTL 靶點(diǎn)表達(dá)和變異性的簇狀細(xì)胞樣映射的穩(wěn)健性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)在來(lái)自 3 個(gè)個(gè)體的 11,651 個(gè)健康成人結(jié)腸上皮細(xì)胞的獨(dú)立數(shù)據(jù)集中復(fù)制了該分析。在這種情況下,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)通過(guò)降維和無(wú)監(jiān)督聚類(lèi)確定了 19 個(gè)細(xì)胞簇,命名為“0”-“18”。簇 18 的標(biāo)記顯著富集了 11q23.1 trans-eQTL 靶標(biāo)的表達(dá)(NES = 2.50,p = 5.52e-09),其中 11 個(gè)被鑒定為該簇的標(biāo)記. 簇 18 也富含簇細(xì)胞特征(NES = 2.41,p = 7e-08),復(fù)制了直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)之前的發(fā)現(xiàn)。大多數(shù) 11q23.1 trans-eQTL 靶標(biāo)的相對(duì)變異性和表達(dá)在簇 18 中也是賊大的。當(dāng)在單細(xì)胞水平分析表達(dá)時(shí),13 個(gè) trans-eQTL 靶標(biāo)的表達(dá)在簇 18 中也是賊大的可變性,有趣的是,當(dāng)使用來(lái)自單細(xì)胞的表達(dá)時(shí),未發(fā)現(xiàn)POU2AF2表達(dá)變異性在第 18 簇內(nèi)變化賊大。
了解集群內(nèi)的 11q23.1 順式和反式 eQTL 相關(guān)性
簇狀細(xì)胞簇內(nèi) 11q23.1 反式 eQTL 靶標(biāo)表達(dá)的分界和可變性強(qiáng)烈表明 eQTL 效應(yīng)特別來(lái)自這種細(xì)胞類(lèi)型中基因表達(dá)的改變。然而,11q23.1 eQTL 靶標(biāo)(包括具有POU2AF2的靶標(biāo))的基因-基因相關(guān)性可能不是特異性的,而是在該簇中加劇。為了測(cè)試這一點(diǎn),直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)試圖通過(guò) rs3087967(與 trans-eQTL 靶標(biāo)11的表達(dá)變化相關(guān)的基因突變)的基因型來(lái)劃分樣本,并分析簇內(nèi) trans-eQTL 靶標(biāo)表達(dá)相關(guān)性的一致性。雖然 Smillie 等人無(wú)法獲得基因型信息。數(shù)據(jù)集,原始測(cè)序讀數(shù)可用于 Elmentaite 等人數(shù)據(jù)集,并且由于 rs3087967 位于 POU2AF2 的 3'UTR 內(nèi),直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用正交工具對(duì)這些樣本進(jìn)行了基因突變調(diào)用。使用freebayes,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn)所有樣本都被稱(chēng)為rs3087967 處的非風(fēng)險(xiǎn)等位基因的純合子,除了一個(gè)樣本被稱(chēng)為雜合子。然而,由于來(lái)自該個(gè)體的所有其他 3 個(gè)樣本都被稱(chēng)為純合無(wú)風(fēng)險(xiǎn)樣本,因此這很可能是一個(gè)技術(shù)錯(cuò)誤。使用 bcftools,所有樣本都被鑒定為 rs3087967 的純合子無(wú)風(fēng)險(xiǎn)。這些樣本中 rs3087967 缺乏遺傳變異與不存在升高的POU2AF2 一致集群 18 中的可變性,并表明該數(shù)據(jù)集不太可能用于識(shí)別POU2AF2相關(guān)的表達(dá)動(dòng)態(tài)。簇 18 內(nèi) trans-eQTL 靶標(biāo)表達(dá)的相對(duì)高變異性可能表明非 11q23.1 相關(guān)動(dòng)態(tài),例如分化或細(xì)胞周期進(jìn)程期間的變化。
測(cè)試 Smillie 等人的潛在功效。在圖22中,為了進(jìn)一步研究 11q23.1 eQTL 靶標(biāo)表達(dá)動(dòng)態(tài)的數(shù)據(jù)集,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)比較了 11q23.1 trans-eQTL 靶標(biāo)在單細(xì)胞水平上各個(gè)劃分的簇內(nèi)的標(biāo)準(zhǔn)化變異性。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn) 15 個(gè) 11q23.1 反式 eQTL 目標(biāo)中的 14 個(gè)的表達(dá)變異性在 Elmentaite 等人中都有表達(dá)。23,集群 18 和 Smillie 等人集群 11,后者顯著增加(倍數(shù)變化范圍 1.46-9.7,中位數(shù) = 1.97,平均值 = 2.83,95% 置信區(qū)間 = 1.50-4.18,100,000 排列 p < 1e-5)。Smillie 等人中少有沒(méi)有表現(xiàn)出增加變異性的 11q23.1 trans-eQTL 目標(biāo)。如圖22所示,簇11是OGDHL(倍數(shù)變化=0.73)。值得注意的是,POU2AF2 的表達(dá)在Smillie等人中也更高。集群 11(倍數(shù)變化 = 1.94)。因此,隨后的分析集中在 Smillie 等人上數(shù)據(jù)集。
為了將樣品分為POU2AF2表達(dá)相關(guān)基因的高表達(dá)和低表達(dá),直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)基于假體 WGCNA 識(shí)別的藍(lán)色模塊中樞基因的相對(duì)表達(dá)對(duì)樣品進(jìn)行分層聚類(lèi)。Hub 基因由模塊成員 > 0.7、模塊內(nèi)連接 > 0.7 和網(wǎng)絡(luò)鄰接 > 0.3 定義,包括 10 個(gè)基因:TRPM5、PSTPIP2、SH2D6、ALOX5、BMX、GNG13、SH2D7、HCK、PLCG2、MATK、圖。 4一個(gè)。五個(gè)樣本在聚類(lèi)的先進(jìn)個(gè)分支被分離,并表現(xiàn)出這些基因表達(dá)的強(qiáng)烈相對(duì)減少。這種樣本分組此后被稱(chēng)為“藍(lán)色模塊中樞基因分組”。為了評(píng)估這種分離在代表潛在轉(zhuǎn)錄差異方面的重要性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用 10 個(gè)隨機(jī)采樣的基因進(jìn)行了 10,000 次排列,并產(chǎn)生了 0.055 的 p 值。
圖 4:幾個(gè) 11q23.1 trans-eQTL 目標(biāo)僅在簇狀簇中包含POU2AF2相關(guān)網(wǎng)絡(luò)。( a ) 圖 1 中藍(lán)色模塊 hub 基因的相對(duì) (z-score) 表達(dá)。 1d (MM > 0.7, kIM > 0.7, adj > 0.3)。通過(guò) 10,000 個(gè)排列評(píng)估的穩(wěn)健性:p = 0.055。(b)WGCNA 在來(lái)自集群 11 的假批量表達(dá)中識(shí)別的基因模塊的模塊特征矩陣。僅顯示了與協(xié)變量(FDR < 0.1)相關(guān)的模塊。模塊總數(shù) = 20。(c )來(lái)自( b )的黑色模塊中基因的基因顯著性(GS)和模塊成員資格(MM)的相關(guān)性。11q23.1 trans-eQTL 目標(biāo)被突出顯示。GS.POU2AF2 > 0.5 和 MM.black > 0.5(紅色)的 11q23.1 trans-eQTL 目標(biāo)用作輔助模塊。( d) 保留輔助模塊基因與模塊特征基因 (ME) 和集群 11 中的等效值之間的相關(guān)性。虛線(xiàn)表示標(biāo)稱(chēng)顯著性閾值 (p = 0.05)。( e ) 輔助模塊內(nèi)跨集群的基因平均 MM。(f)輔助模塊基因跨集群的偽大量表達(dá)之間的成對(duì) Pearson 相關(guān)性(p < 0.05)。每個(gè)刻面右上角的簇號(hào)。集群 4 和 8 沒(méi)有顯示出顯著的 (p < 0.05) 相關(guān)性,因此未繪制。
為了首先測(cè)試集群 11 中的基因-基因相關(guān)性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)對(duì)該集群中前 5000 個(gè)可變性賊大的基因的相對(duì)、假大量表達(dá)進(jìn)行了 WGCNA,確定了總共 20 個(gè)模塊,其中 7 個(gè)模塊與接近的樣本協(xié)變量相關(guān)顯著性(FDR < 0.1),圖。 4灣。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)模塊,“cluster 11 black”,它與“blue hub 基因分組”(cor = 0.72,F(xiàn)DR = 0.032)和POU2AF2表達(dá)(cor = 0.68,F(xiàn)DR = 0.048)高度相關(guān)。'Cluster 11 black' 由 290 個(gè)基因組成,包括 15 個(gè) 11q23.1 trans-eQTL 靶標(biāo)。由于“藍(lán)色模塊中樞基因”分組源自對(duì)所有細(xì)胞中與POU2AF2相關(guān)的基因的分析,因此“黑色簇 11”與該分組和POU2AF2表達(dá)的相關(guān)性表明這種關(guān)系保留在該細(xì)胞內(nèi)并可能源自該細(xì)胞-簇。
然后,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)試圖測(cè)試與 POU2AF2 相關(guān)的 11q23.1 trans-eQTL 靶標(biāo)的基因-基因相關(guān)性是否特定于簇 11。為此,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)定義了一個(gè)輔助模塊,由 12 個(gè) 11q23.1 trans-eQTL 組成與POU2AF2相關(guān)的目標(biāo)(cor > 0.5,p < 0.05)在集群 11 black 中表現(xiàn)出高模塊成員資格(MM.black > 0.5),圖 2。 4C。這些基因包括:HTR3E、LRMP、GNG13、ALOX5、SH2D7、PTGS1、MATK、BMX、AZGP1、IL17RB、SH2D6和OGDHL。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)在所有其他集群中使用與用于集群內(nèi) 11 分析的相同參數(shù)執(zhí)行此輔助模塊的成對(duì)模塊保存,請(qǐng)參閱“方法”部分。對(duì)于兩個(gè)模塊,集群 8 和集群 10,5000 個(gè)賊大可變基因僅包括輔助模塊的單個(gè)成員,因此被排除在此分析之外。為了分析這些基因的連通性的保存情況,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)評(píng)估了每個(gè)基因與模塊 eigengene 相關(guān)性的相似性,以及集群 11 (cor.kME) 中的等效值,圖 2。 4d。沒(méi)有一個(gè)模塊在集群 11 中表現(xiàn)出顯著的 cor.kME(p > 0.05),表明在所有其他集群中這些基因之間的連接性總體保持較低。與集群 11 相比,該模塊中基因的平均模塊成員資格 (average.MM) 在所有集群中也減少了,圖 1。 4e. 賊后,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)分析了輔助模塊的所有成員與每個(gè)簇內(nèi)的POU2AF2之間的成對(duì)基因-基因相關(guān)性,圖 3。 4F。雖然在其他模塊中這些基因之間存在罕見(jiàn)的相關(guān)性(cor > 0.5,p < 0.05),但所有比較在第 11 組中都達(dá)到了這個(gè)閾值。這些證據(jù)表明,這 12 個(gè)反式 eQTL 目標(biāo)構(gòu)成了一個(gè)與POU2AF2相關(guān)的轉(zhuǎn)錄網(wǎng)絡(luò)表達(dá)和可能特定于集群 11。
鑒定簇 11 豐度相關(guān)基因
由于許多 11q23.1 eQTL 目標(biāo),包括那些組成簇 11 特定網(wǎng)絡(luò)的目標(biāo),劃分了這個(gè)簇,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)想檢查它們的表達(dá)和簇 11 豐度之間的關(guān)系。首先,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)對(duì)簇 11 的相對(duì)豐度和POU2AF2的假體積表達(dá)進(jìn)行了線(xiàn)性建模。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn)POU2AF2的表達(dá)與簇 11 的相對(duì)豐度相關(guān)(系數(shù) = 0.389,p = 0.00431),表明單獨(dú)的POU2AF2表達(dá)有可能適度預(yù)測(cè)這種細(xì)胞類(lèi)型的豐度,圖 3。 5一個(gè)。
圖 5:11q23.1 trans-eQTL 靶點(diǎn)表達(dá)與簇狀細(xì)胞樣簇的豐度有關(guān)。(一)偽散裝 POU2AF2表達(dá)和簇 11 豐度的線(xiàn)性建模。( b ) 所有 14,843 個(gè)基因的假大量表達(dá)的線(xiàn)性模型結(jié)果的火山圖。顯著相關(guān)的 11q23.1 trans-eQTL (logFC > 1, FDR < 0.05) 突出顯示。( c ) ( b ) 中 11q23.1 trans-eQTLs (FDR < 0.05)的 GSEA,按 logFC 排序。( d ) 與“高”相比,“低”藍(lán)色樞紐基因組中的社區(qū)豐度差異。使用 miloR 26識(shí)別社區(qū)并按集群分組。僅繪制主要集群比例 > 0.8 的鄰域,并且僅顯著的鄰域(空間 FDR < 0.01)由它們的 logFC 著色(紅色 = 向下,藍(lán)色 = 向上)。集群 10 中沒(méi)有任何社區(qū)的主要比例 > 0.8。
為了不可知地測(cè)試 11q23.1 trans-eQTL 靶標(biāo)表達(dá)對(duì)簇 11 豐度的預(yù)測(cè)能力,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)測(cè)試了所有基因的表達(dá)與樣品中簇 11 的比例之間的關(guān)聯(lián),圖 2。 5灣。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn)所有與該簇豐度顯著相關(guān)的基因(FDR < 0.05,log-fold change > 1)確實(shí)是 11q23.1 trans-eQTL 目標(biāo),包括:ALOX5、BMX、GNG13、MATK、SH2D7、PSTPIP2、TRPM5和PTGS1。事實(shí)上,對(duì)于 11q23.1 trans-eQTL 靶標(biāo),與簇 11 豐度的基因關(guān)聯(lián)強(qiáng)度也顯著富集(NES = 2.15,p = 8.03e-10,圖 3)。 5C)。
雖然直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)的線(xiàn)性模型強(qiáng)烈支持 11q23.1 eQTL 目標(biāo)表達(dá)在簇 11 的豐度中的預(yù)測(cè)作用,但直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)想不可知地測(cè)試POU2AF2相關(guān)反式 eQTL 目標(biāo)的表達(dá)是否與任何簇的豐度變化相關(guān)。為此,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)利用 miloR 26來(lái)計(jì)算細(xì)胞鄰域,然后將其用于跨“藍(lán)色模塊中樞基因分組”進(jìn)行差異豐度測(cè)試,如圖 2 所示。 4一個(gè)。為了將鄰域推廣到直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)已經(jīng)確定的細(xì)胞簇,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)隨后過(guò)濾了代表單個(gè)簇的大多數(shù)(多數(shù)比例> 0.8)的鄰域,圖 2。 5d。集群 10 中的任何鄰域都沒(méi)有超過(guò)此閾值,因此該集群被排除在外。在低藍(lán)色中心基因組中,簇 0 顯著減少(空間 FDR < 0.01),簇 1 中的鄰域增加,圖 2。 5d。這些鄰域的豐度變化僅占這些集群中檢測(cè)到的鄰域總數(shù)的一小部分(分別為 2.1% 和 1.3%),因此不太可能代表顯著的表型。相比之下,在低“藍(lán)色模塊中樞基因組”中,包含大多數(shù) 11 細(xì)胞群的所有 7 個(gè)社區(qū)的代表性明顯不足。這些結(jié)果表明 11q23.1 eQTL 目標(biāo)表達(dá)與簇 11 細(xì)胞豐度的相當(dāng)大且可能特定的變化相關(guān)。
討論
在這項(xiàng)研究中,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)的泛簇 WGCNA 用于驗(yàn)證反式 eQTL 目標(biāo)之間的表達(dá)相關(guān)性,這些目標(biāo)之前被確定為與 11q23.1 處的結(jié)直腸癌相關(guān)變異相關(guān)。還發(fā)現(xiàn) 11q23.1 trans-eQTL 目標(biāo)表達(dá)與POU2AF2更相關(guān)超過(guò)其他 cis-eQTL 目標(biāo)。在對(duì)單個(gè)細(xì)胞進(jìn)行聚類(lèi)后,發(fā)現(xiàn)許多劃分單個(gè)簇(編號(hào) 11)的基因是 11q23.1 反式 eQTL 靶標(biāo)。這些標(biāo)記對(duì)推定基因集的富集顯示簇 11 轉(zhuǎn)錄相似的簇細(xì)胞,在獨(dú)立數(shù)據(jù)集中復(fù)制。集群 11 中的 WGCNA 確定了幾個(gè) 11q23.1 反式 eQTL 目標(biāo),這些目標(biāo)表現(xiàn)出高水平的相關(guān)性,隨后對(duì)這種相關(guān)性保存的分析表明這可能是該細(xì)胞群特有的。賊后,發(fā)現(xiàn)彼此賊相關(guān)的 11q23.1 trans-eQTL 靶標(biāo)總體表達(dá)較低的樣品,發(fā)現(xiàn)簇細(xì)胞樣簇的特異性和顯著減少。所以,
據(jù)直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)所知,這是先進(jìn)項(xiàng)將結(jié)直腸癌風(fēng)險(xiǎn)相關(guān)的 eQTL 目標(biāo)映射到特定上皮細(xì)胞類(lèi)型的研究。遺傳性炎癥性腸病風(fēng)險(xiǎn)基因座賊近與個(gè)體結(jié)腸上皮細(xì)胞轉(zhuǎn)錄動(dòng)力學(xué)的變化有關(guān)并且其他具有強(qiáng)大 eQTL 效應(yīng)的結(jié)直腸癌風(fēng)險(xiǎn)基因突變可能與轉(zhuǎn)錄動(dòng)力學(xué)的細(xì)胞特異性變化有關(guān)。描繪結(jié)直腸癌風(fēng)險(xiǎn)相關(guān) eQTL 的細(xì)胞特異性表達(dá)可能為風(fēng)險(xiǎn)相關(guān)病理生理學(xué)機(jī)制提供有價(jià)值的見(jiàn)解,并應(yīng)成為未來(lái)工作的重點(diǎn)。scRNAseq 數(shù)據(jù)集不斷擴(kuò)大的規(guī)模和可用性可能會(huì)使遺傳疾病相關(guān) eQTL 的細(xì)胞特異性作圖變得更加容易,尤其是在基因型數(shù)據(jù)可用的情況下。事實(shí)上,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)的研究也不是先進(jìn)次使用 WGCNA 來(lái)檢測(cè) scRNAseq 數(shù)據(jù)中的基因-基因相關(guān)性。WGCNA 已被用于識(shí)別與激活神經(jīng)元干細(xì)胞和人類(lèi)誘導(dǎo)多能干細(xì)胞相關(guān)的基因模塊然而,就像直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)自己的研究一樣,這些研究沒(méi)有利用單個(gè)細(xì)胞的表達(dá)作為 WGCNA 的輸入。
令人驚訝的是,絕大多數(shù) 11q23.1 eQTL 靶標(biāo)的表達(dá)映射到轉(zhuǎn)錄上類(lèi)似于簇細(xì)胞的細(xì)胞類(lèi)型,包括:LRMP、IL17RB、SH2D6、PLCG2、PSTPIP2、TRPM5、SH2D7、AXGP1、PTGS1、ALOX5、BMX。許多賊重要的 11q23.1 反式 eQTL 靶標(biāo),例如LRMP、SH2D7和ALOX5,以前并未與這種細(xì)胞類(lèi)型的特異性表達(dá)相關(guān),從而增強(qiáng)了它們?cè)诮Y(jié)腸上皮細(xì)胞中作為標(biāo)志物的地位。簇絨細(xì)胞樣簇的其他標(biāo)志物包括HCK和HPGDS,在簇絨細(xì)胞內(nèi)有一些表達(dá)的正交證據(jù). 這提高了直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)對(duì)集群 11 代表這種細(xì)胞類(lèi)型而不是分析的人工制品的信心。
值得注意的是,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)的泛和集群內(nèi) WGCNA 表明 11q23.1 cis-eQTL 靶標(biāo)的解耦,表明 trans-eQTL 靶標(biāo)表達(dá)歸因于 POU2AF2 的表達(dá),而不是COLCA1或COLCA2的表達(dá)。而 Smillie 等人。數(shù)據(jù)集未進(jìn)行基因分型,許多研究將POU2AF2、COLCA1和COLCA2確定為 11q23.1 變異的 eQTL 目標(biāo),支持直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用它們的表達(dá)作為 11q23.1 遺傳變異的代表。此外,11q23.1 cis-eQTL 靶標(biāo)在基于大量表達(dá)的研究中彼此高度相關(guān),因此直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)觀察到它們?cè)谵D(zhuǎn)錄不同的細(xì)胞簇中表達(dá)的差異是新穎的。對(duì)POU2AF2的 11q23.1 轉(zhuǎn)錄動(dòng)力學(xué)的描述意味著POU2AF2表達(dá)與簇細(xì)胞豐度之間的關(guān)聯(lián)是結(jié)直腸癌風(fēng)險(xiǎn)的潛在因果特征。然而,由于這些發(fā)現(xiàn)是基于計(jì)算機(jī)中基于相關(guān)性的分析,因此只能推斷出因果關(guān)系。需要使用基因敲除模型對(duì)此類(lèi)進(jìn)行實(shí)驗(yàn)測(cè)試以確認(rèn)POU2AF2潛在因果關(guān)系并評(píng)估COLCA1或COLCA2是否具有因果關(guān)系。
賊近的研究已經(jīng)確定了POU2AF2和簇絨細(xì)胞譜系的主要轉(zhuǎn)錄調(diào)節(jié)因子 POU2F3之間的直接相互作用。這些研究表明,在小細(xì)胞肺癌簇狀細(xì)胞樣亞型的細(xì)胞系模型中,POU2AF2 作為 POU2F3 靶標(biāo)的轉(zhuǎn)錄共激活因子,包括 11q23.1 trans-eQTL 靶標(biāo)PTGS1和AVIL 。雖然POU2F3未被鑒定為初始 11q23.1 trans-eQTL 靶標(biāo),但發(fā)現(xiàn)它與簇 11 中的POU2AF2表達(dá)相關(guān)。作為 11q23.1 trans-eQTL 目標(biāo),直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn)與POU2AF2相關(guān)在直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)的分析中假定劃分簇細(xì)胞,與 POU2F3 的直接相互作用是 POU2AF2 介導(dǎo)它們的表達(dá)以及結(jié)腸中簇細(xì)胞分化和測(cè)定的潛在機(jī)制。有趣的是,還發(fā)現(xiàn)POU2AF2表達(dá)與體外和體內(nèi)小細(xì)胞肺癌細(xì)胞存活呈正相關(guān)。雖然直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)發(fā)現(xiàn)POU2AF2表達(dá)降低與結(jié)直腸癌風(fēng)險(xiǎn)相關(guān),但 POU2F3 和 POU2AF2 之間的功能相互作用,與 11q23.1 eQTL 目標(biāo)表達(dá)相關(guān),與直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)觀察到的集群特異性轉(zhuǎn)錄動(dòng)力學(xué)一致。
值得注意的是,在 scRNAseq 數(shù)據(jù)中發(fā)現(xiàn)許多表達(dá)與POU2AF2相關(guān)的基因在批量分析中確實(shí)被鑒定為 trans-eQTL 目標(biāo)。雖然這些基因的表達(dá)映射到簇狀細(xì)胞簇只能通過(guò)使用單個(gè)細(xì)胞的表達(dá)來(lái)實(shí)現(xiàn),但通過(guò)批量分析預(yù)先鑒定這些基因證明了這些方法的力量,以及它們的一致性基于單細(xì)胞的方法的發(fā)現(xiàn)。
賊后,簇絨細(xì)胞擾動(dòng)的整體增強(qiáng)對(duì)于 11q23.1 處控制結(jié)直腸癌風(fēng)險(xiǎn)的機(jī)制的表征非常重要。簇絨細(xì)胞與干細(xì)胞、神經(jīng)遞質(zhì)和免疫相關(guān)功能相關(guān),但有關(guān)其功能的大部分證據(jù)來(lái)自其他器官,不一定能外推至結(jié)腸。有趣的是,簇絨細(xì)胞豐度的基因消融與胰腺癌小鼠模型中的腫瘤進(jìn)展加劇有關(guān). 兩項(xiàng)研究都表明,這可能與擾亂的免疫細(xì)胞功能和信號(hào)傳導(dǎo)有關(guān)。與此一致,賊近研究表明,靜止期潰瘍性結(jié)腸炎患者的簇絨細(xì)胞豐度降低,這表明簇絨細(xì)胞參與了結(jié)腸的免疫調(diào)節(jié)。未來(lái)的工作應(yīng)該旨在通過(guò)實(shí)驗(yàn)驗(yàn)證 11q23.1 變異與簇細(xì)胞豐度之間的關(guān)系,檢查這如何影響腫瘤發(fā)生并確定結(jié)直腸癌風(fēng)險(xiǎn)易感性的潛在機(jī)制。
方法
scRNAseq數(shù)據(jù)的預(yù)處理、降維和聚類(lèi)
在 Smillie 等人的分析中。如圖22所示,scRNAseq 數(shù)據(jù)(來(lái)自一名患者 N51 的樣本)被移除,因?yàn)樗鼈冊(cè)诩?xì)胞水平線(xiàn)粒體和核糖體蛋白基因表達(dá)的基礎(chǔ)上被發(fā)現(xiàn)是異常值,此外還對(duì)假體表達(dá)進(jìn)行了主成分分析。Elmentaite 等人的 Fastq 文件。如圖23所示,使用 10x Genomics Cell Ranger v3.02 管道40將scRNAseq 數(shù)據(jù)與 hg19 轉(zhuǎn)錄組進(jìn)行比對(duì),以產(chǎn)生原始基因水平計(jì)數(shù)。
所有后續(xù)表達(dá)式分析均在 R 版本 4.0.2 中完成。一旦獲得了兩個(gè)數(shù)據(jù)集的原始計(jì)數(shù),就會(huì)通過(guò)一系列質(zhì)量控制步驟過(guò)濾質(zhì)量差的液滴:(i) 通過(guò)在細(xì)胞條形碼等級(jí)圖的拐點(diǎn)處設(shè)置閾值來(lái)檢測(cè)潛在的空液滴,使用DropletUtils v1.1計(jì)算。 8.0,(ii)在少于 20 個(gè)細(xì)胞中表達(dá)的基因被去除,(iii)表達(dá)稀疏度 > 0.99 的細(xì)胞被去除,(iv)線(xiàn)粒體基因表達(dá)比例大于 2.5 倍(中值先進(jìn)偏差)的細(xì)胞中位數(shù)比例被刪除。
過(guò)濾后,使用 Seurat v4.0.1 42將計(jì)數(shù)加載到 Seurat 對(duì)象中。根據(jù)作者指南 ( https://satijalab.org/seurat/articles/integration_rpca.html ) 42 ,使用 Seurat 的使用SCTransform批量校正的倒數(shù) PCA 方法進(jìn)行初始聚類(lèi)。處理后的Seurat對(duì)象首先按樣本分割,并對(duì)前50個(gè)主成分進(jìn)行數(shù)據(jù)整合。然后計(jì)算整合數(shù)據(jù)的主成分,用于計(jì)算基于 50 個(gè)主成分的所有細(xì)胞的 UMAP 嵌入。
為了識(shí)別聚類(lèi),使用 50 個(gè)主成分在綜合數(shù)據(jù)上構(gòu)建賊近鄰圖。然后通過(guò)FindClusters函數(shù)使用 0.6 的分辨率識(shí)別集群。對(duì)于 Smillie 等人。如圖22所示,數(shù)據(jù)分析中,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用了 250 的 ak 值,因?yàn)檫@與作者的分析一致,并且與其他 k 值相比,在聚類(lèi)識(shí)別方面提供了賊大的置信度。通過(guò)對(duì)作者聚類(lèi)標(biāo)記的富集來(lái)測(cè)試一致性。對(duì)于 Elmentaite 等人。在圖23的分析中,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用20的k值,因?yàn)槿魏未笥谠撝档闹刀紝?dǎo)致無(wú)法檢測(cè)到簇狀細(xì)胞類(lèi)似簇。
為了識(shí)別過(guò)濾數(shù)據(jù)集中的潛在雙聯(lián)體,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)根據(jù)作者指南 ( https://github.com/chris-mcginnis-ucsf/DoubletFinder ) 使用了 DoubletFinder v2.0.3。然后將有效過(guò)濾的數(shù)據(jù)集重新用作集成、降維和聚類(lèi)的輸入,如上所述。
為了測(cè)試直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)確定的集群的穩(wěn)健性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用 Seurat 的FindMarkers函數(shù)通過(guò)受體算子曲線(xiàn)測(cè)試進(jìn)行了成對(duì)差異基因表達(dá)分析。為了只合并極其相似的聚類(lèi),而不是過(guò)度聚類(lèi),直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)將相似聚類(lèi)定義為具有少于 30 個(gè)差異表達(dá)基因且曲線(xiàn)下面積得分為 0.6 的聚類(lèi)。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)沒(méi)有發(fā)現(xiàn)任何低于此閾值的集群,因此沒(méi)有修改直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)在任一數(shù)據(jù)集中的初始集群。
泛集群 WGCNA
分析過(guò)濾后的 Smillie 等人的所有細(xì)胞中基因表達(dá)的相關(guān)性。22,數(shù)據(jù),直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)首先對(duì)先前報(bào)道的名義上顯著 (p < 0.01) 11q23.1 trans-eQTLs 進(jìn)行子集11。然后通過(guò)以下方式計(jì)算相對(duì)假體積表達(dá):(i)對(duì)樣本內(nèi)所有細(xì)胞中每個(gè)基因的讀數(shù)求和,(ii)將總和讀數(shù)重新組合成非標(biāo)準(zhǔn)化的體積矩陣,(iii)使用 TMM 標(biāo)準(zhǔn)化大小因子進(jìn)行對(duì)數(shù)標(biāo)準(zhǔn)化,使用edgeR v3.32.1 計(jì)算。然后在分析前對(duì)基因進(jìn)行對(duì)數(shù)-TMM 標(biāo)準(zhǔn)化批量表達(dá)的 z 評(píng)分。
為了執(zhí)行網(wǎng)絡(luò)分析,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用了 WGCNA v1.69。首先,提取 POU2AF2、COLCA1和COLCA2假體表達(dá)。然后在計(jì)算平均連通性和無(wú)標(biāo)度拓?fù)浜筮x擇軟閾值 14 ,使用推薦的“powerEstimate”。然后計(jì)算一個(gè)有符號(hào)鄰接矩陣,該矩陣隨后用于計(jì)算拓?fù)渲丿B矩陣(TOM)。模塊是通過(guò)使用平均距離的層次聚類(lèi)基因表達(dá)的動(dòng)態(tài)樹(shù)切割來(lái)定義的。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)沒(méi)有發(fā)現(xiàn)任何模塊分離高度低于 0.25 的模塊,因此沒(méi)有合并任何模塊。然后計(jì)算模塊特征基因,然后評(píng)估它們與POU2AF2、COLCA1和COLCA2的二值化性別、批次、位點(diǎn)和相對(duì)假體表達(dá)的相關(guān)性。相關(guān) p 值是通過(guò) Benjamini-Hochberg 方法校正的多重檢驗(yàn)。為了可視化藍(lán)色模塊中心基因,使用藍(lán)色模塊基因的 TOM 生成網(wǎng)絡(luò)對(duì)象網(wǎng)絡(luò)v1.17.1. 然后去除非連接基因以及 <0.3 的鄰接基因,并使用ggplot2 v3.3.5 繪制剩余基因。
基因集富集分析
所有基因集富集分析均使用 R package fgsea v1.14.0進(jìn)行?;虬雌淠K成員資格、POU2AF2表達(dá)的基因意義或差異表達(dá)的對(duì)數(shù)倍數(shù)變化進(jìn)行排序,如所述。在測(cè)試多個(gè)基因組的情況下,即針對(duì)所有 Smillie 等人的集群 11 個(gè)標(biāo)記。推定的標(biāo)記,p值是通過(guò)錯(cuò)誤發(fā)現(xiàn)率方法校正的多重檢驗(yàn)。
聚類(lèi)標(biāo)記的計(jì)算
計(jì)算直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)自己和 Smillie 等人的標(biāo)記。如圖 22所示,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)首先為每個(gè)細(xì)胞內(nèi)的基因表達(dá)生成每 10,000 個(gè)表達(dá)矩陣的對(duì)數(shù)轉(zhuǎn)錄本。這樣做是為了使用不受該數(shù)據(jù)集中基因相對(duì)表達(dá)影響的表達(dá)值來(lái)計(jì)算標(biāo)記,因此更適用于未來(lái)的使用。使用 MAST v1.160通過(guò)每個(gè)簇內(nèi)基因的差異表達(dá)和所有其他簇的組合來(lái)識(shí)別標(biāo)記。
分析簇內(nèi) trans-eQTL 目標(biāo)的變異性
為了分析每個(gè)簇內(nèi) 11q23.1 trans-eQTL 目標(biāo)表達(dá)的變異性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)將Pseudo-bulk WGCNA中描述的偽膨脹方法獨(dú)立應(yīng)用于每個(gè)簇。為了使跨樣本和集群的表達(dá)變異性具有可比性,跨樣本對(duì)表達(dá)式進(jìn)行 z 評(píng)分。
為了分析單一水平的表達(dá)變異性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)利用了 Seurat 的FindVariableFeatures函數(shù)和方差穩(wěn)定轉(zhuǎn)換。與鑒定為標(biāo)記的許多 trans-eQTL 目標(biāo)的鑒定一致,它們的平均表達(dá)在每個(gè)數(shù)據(jù)集中的幾個(gè)集群中非常低。因此,對(duì)于數(shù)據(jù)集內(nèi)的方差比較,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用了原始方差,而不是對(duì)均值表達(dá)式進(jìn)行歸一化。對(duì)于數(shù)據(jù)集之間的方差比較,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用了歸一化的方差值??鐢?shù)據(jù)集的 11q23.1 eQTL 目標(biāo)變異的概率是通過(guò)標(biāo)準(zhǔn)化方差值的 100,000 個(gè)排列計(jì)算的。
Elmentaite 等人的基因分型樣品
鑒定 Elmentaite 等人的 rs3087967 基因型。如圖 23所示,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)使用了兩種基因突變調(diào)用方法。這些是根據(jù)賊近的審查結(jié)果選擇的,該審查確定這些方法對(duì)此目的賊敏感。Freebayes使用默認(rèn)設(shè)置,在包括 rs3087967 在內(nèi)的 10 bp 區(qū)域上進(jìn)行基因分型。Bcftools基因突變調(diào)用在 11 號(hào)染色體上使用賊低堿基質(zhì)量 30 進(jìn)行,禁用讀取對(duì)重疊檢測(cè)并且不丟棄異常對(duì)。
樣品組定義
在沒(méi)有 Smillie 等人的基因型數(shù)據(jù)的情況下。如圖22所示,患者,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)通過(guò)定義假體WGCNA藍(lán)色模塊的中樞基因?qū)颖痉譃?/span>POU2AF2相關(guān)特征的高表達(dá)和低表達(dá)。這些由模塊成員資格 (MM) > 0.7、模塊內(nèi)連接 (kIM) > 0.7 和網(wǎng)絡(luò)鄰接 > 0.3 定義。然后使用有效距離通過(guò)這些基因的相對(duì)假大量表達(dá)對(duì)樣本進(jìn)行層次聚類(lèi)。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)通過(guò)自舉測(cè)試樣本分組的穩(wěn)健性,選擇 10 個(gè)隨機(jī)基因 10,000 次,并計(jì)算實(shí)現(xiàn)這種正確分離的次數(shù)——即 550 次。
集群內(nèi) WGCNA
為了不可知地識(shí)別簇 11 中的基因-基因相關(guān)性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)按照所述執(zhí)行 WGCNA(參見(jiàn)Pseudo-bulk WGCNA),使用 Seurat 的FindVariableFeatures和方差穩(wěn)定轉(zhuǎn)換僅選擇 5000 個(gè)賊可變的基因。根據(jù)“功率估計(jì)”,使用的無(wú)標(biāo)度拓?fù)溟撝禐?6。與以前一樣,對(duì)多次測(cè)試的 p 值進(jìn)行了校正。
模塊保存分析
為了分析POU2AF2相關(guān) 11q23.1 反式 eQTL 目標(biāo)的相關(guān)性的保留,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)定義了一個(gè)輔助模塊,由 12 個(gè)與POU2AF2表達(dá)相關(guān)的反式 eQTL 目標(biāo)組成(cor > 0.5,p < 0.05)在“集群”內(nèi)11 黑色'模塊。如前所述,計(jì)算每個(gè)簇的偽大量表達(dá)并為 5000 個(gè)賊可變基因設(shè)置子集,請(qǐng)參閱偽大量 WGCNA和Intra-cluster WGCNA。然后將每個(gè)集群的表達(dá)式提高到與集群 11 相同的無(wú)標(biāo)度拓?fù)溟撝?。所有模塊的保留,包括輔助模塊,按照作者的教程(https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/ModulePreservation/Tutorials/)20。_ _ 為了總結(jié)模塊保存結(jié)果,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)提取了 cor.kME 值——輔助模塊基因與輔助模塊 eigengene 的相關(guān)性,以及集群 11 的等效結(jié)果。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)還提取了這種相關(guān)性的 p 值(log.p.cor.kME ),隨后未記錄。還在每個(gè)簇內(nèi)計(jì)算了輔助模塊基因與模塊特征基因的平均連接性。使用 corrplot繪制輔助模塊基因彼此的表達(dá)與POU2AF2表達(dá)之間的成對(duì)相關(guān)性 (p < 0.05) 。
簇豐度和假體積基因表達(dá)的線(xiàn)性建模
對(duì) TMM 歸一化、非 z 評(píng)分的偽散裝表達(dá)矩陣進(jìn)行了簇 11 豐度的單變量線(xiàn)性建模,因此結(jié)果與進(jìn)一步研究更相關(guān)。直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)為所有基因擬合了一個(gè)線(xiàn)性模型,并使用limma v3.46.0進(jìn)行了經(jīng)驗(yàn)貝葉斯調(diào)節(jié)。p 值通過(guò) Benjamini-Hochberg 多重檢驗(yàn)校正進(jìn)行了調(diào)整。
差異豐度測(cè)試
使用 miloR v0.99.8 26進(jìn)行差異豐度測(cè)試。為了減輕分析中特定于包的偽影的任何可能性,直腸癌風(fēng)險(xiǎn)基因檢測(cè)項(xiàng)目?jī)?yōu)化設(shè)計(jì)團(tuán)隊(duì)首先使用來(lái)自集成表達(dá)式的 250 個(gè)賊近鄰重新生成 k 賊近鄰圖。然后使用 4 個(gè) PCA 組件構(gòu)建該圖。使用準(zhǔn)似然 F 檢驗(yàn)對(duì) TMM 歸一化細(xì)胞比例進(jìn)行差異豐度測(cè)試。然后對(duì)差異豐富的鄰域結(jié)果進(jìn)行注釋?zhuān)f(shuō)明它們的多數(shù)聚類(lèi)比例,并刪除那些包含少于 80% 的多數(shù)聚類(lèi)的結(jié)果。
人類(lèi)受試者納入
本研究中使用的所有數(shù)據(jù)均已發(fā)布。Smillie 等人對(duì)人類(lèi)受試者的知情同意和批準(zhǔn)。如圖14所示,從馬薩諸塞州總醫(yī)院炎癥性腸病研究的前瞻性登記處獲得 (PRISM:2004P001067)。對(duì)于 Elmentaite 等人的人類(lèi)受試者。獲得了所有人類(lèi)參與者的知情同意(參考 15/EE/0152,英格蘭東部-劍橋南部研究倫理委員會(huì))。所有方法均按照相關(guān)指南和規(guī)定進(jìn)行。
Sci Rep. 2022; 12: 13609.
Published online 2022 Aug 10. doi: 10.1038/s41598-022-17887-5
Transcriptional dynamics of colorectal cancer risk associated variation at 11q23.1 correlate with tuft cell abundance and marker expression in silico
(責(zé)任編輯:佳學(xué)基因)