KARR-seq 揭示细胞高阶 RNA 结构和 RNA-RNA 相互作用

细胞培养

维持A549(美国典型培养物保藏中心(ATCC),CCL-185),HEp-2(ATCC,CCL-23),Vero CCL81(ATCC,CRLCCL81),HEK293T(ATCC,CRL11268)和HepG2(ATCC,HB8065)细胞在含有 10% (v/v) FBS (Gibco) 和青霉素-链霉素的 DMEM (Gibco, 11995) 中。 F123 mESC(Bing Ren 实验室,加州大学圣地亚哥分校)在含有 10% (v/v) FBS、1 mM L-谷氨酰胺 (Gibco)、0.1 mM β-巯基乙醇 (Gibco) 的 DMEM (Gibco, 11995) 中培养, 1% (v/v) 非必需氨基酸储备液 (100×, Gibco), 1,000 U ml−1 LIF(密理博)和青霉素-链霉素。 K562 细胞 (ATCC, CCL243) 在含有 10% (v/v) FBS 和青霉素-链霉素的 RPMI 1640 (Gibco 11875) 中培养。 果蝇 S2 细胞(Thermo Fisher Scientific,R69007)保存在 Schneider’s 中 果蝇 培养基补充有 10% (v/v) FBS、0.1% Pluronic F-68 (Gibco) 和青霉素-链霉素。 果蝇 S2 细胞在 28°C 下生长。 其他细胞在 37°C、5% CO 条件下生长2

为了抑制翻译,用 2 µg ml−1 三尖杉酯碱(Abcam,ab141941)或 100 µg ml−1 收获前用放线菌酮 (Abcam, ab120093) 处理 30 分钟。 为了诱导 SG,K562 细胞在收获前用 200 µM 亚砷酸钠(Sigma-Aldrich,S7400)处理 1 小时。 使用Lipofectamine RNAiMAX (Invitrogen, 13778150)转染siRNA。 转染后,细胞培养2-3天,然后收获。

病毒接种

表达 GFP (rgRSV) 的重组人 RSV A2 菌株在 HEp-2 细胞中生长并测定滴度。 表达 GFP (rVSV-GFP) 的 VSV Indiana 菌株在 Vero CCL81 细胞中生长并测定滴度。 T25烧瓶中汇合的A549细胞用rgRSV或rVSV-GFP以0.1的感染复数(MOI)感染。 吸附1小时后,除去接种物,加入含有2%FBS的新鲜DMEM。 感染的细胞在37°C下接种。 rVSV-GFP感染的细胞在感染后24小时固定,rgRSV感染的细胞在感染后48小时固定用于KARR-seq。

蛋白质印迹

对蛋白质样品进行 SDS-PAGE 并转移至硝酸纤维素膜 (Bio-Rad)。 然后将膜用含 0.1% Tween 20 (PBST) 的 5% 牛奶的 PBS 封闭,并与一抗(含 ​​5% 牛奶的 PBST)在 4 °C 下孵育过夜。 用PBST洗涤膜5次,然后与二抗在室温下孵育1小时。 然后将膜洗涤五次,然后应用增强化学发光 (ECL) 并显影。 抗体信息如下:兔抗SRSF1(Bmethyl Laboratories, A302-052A, 1:1,000); 兔抗组蛋白 H3(Cell Signaling Technology, 9717, 1:1,000); 兔抗 β-微管蛋白(Cell Signaling Technology, 2146, 1:1,000); 兔抗 U1-70K(Abcam,ab83306,1:1,000); 兔抗 YBX3(GeneTex,GTX130052,1:1,000); 小鼠抗 GAPDH(Proteintech,HRP-60004,1:20,000); 和 HRP 连接的抗兔 IgG(Cell Signaling Technology, 7074, 1:2,500)。

斑点印迹

将纯化的 RNA (1 µl) 加载到 Amersham Hybond-N+ 膜(GE Healthcare,RPN119B)上。 将膜风干并使用 UV Stratalinker 2400 在 150 mJ cm 下交联两次2。 然后将膜在含 5% 不含脂肪酸的 BSA 的 PBST 中封闭过夜。 然后将膜洗涤并在链霉亲和素-HRP(Thermo Fisher Scientific,S-911)中的PBST中孵育,并补充有3%不含脂肪酸的BSA。 在应用 ECL 并显影之前,将膜清洗五次。

合成 DBCO 和生物素修饰的树枝状聚合物

PAMAM 树枝状聚合物 G1(1.53 µmol;Sigma-Aldrich,412384)、DBCO-NHS(3.06 µmol;Sigma-Aldrich,761524)、生物素-NHS(1.53 µmol;Sigma-Aldrich,203112)和三乙胺(5 µl;Sigma-Aldrich) ,471283)添加到2毫升甲醇中。 将反应混合物在室温下搅拌过夜,然后添加 100 µl 乙酸酐(Sigma-Aldrich,320102)和 100 µl 三乙胺。 将反应混合物在室温下再搅拌24小时。 使用配备 Omega Membrane 1K 的 Microsep Advance 离心装置(Pall Corporation,MCP001C41)纯化并浓缩树枝状聚合物溶液。 按照类似的程序合成DBCO修饰和生物素修饰的G3、G5和G7,其中G3添加4当量DBCO,G5添加16当量DBCO,G7添加64当量DBCO。

通过测量 DBCO 部分在 295 nm 处的特征 UV 吸光度来进行修饰树枝状聚合物的表征和定量。 制备一系列已知浓度的 DBCO-NHS 溶液作为外标,以生成校准曲线。

卡尔序列

详细的 KARR-seq 协议作为补充协议包含在内。 简而言之,细胞在 1% 甲醛中交联 10 分钟。 对于每个 KARR-seq 样品,将 2-5 百万个细胞重悬于 500 µl 透化缓冲液(10 mM Tris-HCl,pH 8.0,10 mM NaCl,0.2% IGEPAL CA-630,5 mM EDTA)中,并补充有 2 mM N3-酮醛、蛋白酶抑制剂和核糖核酸酶抑制剂。 将混合物在室温下旋转 30 分钟。 将细胞用透化缓冲液洗涤一次,然后重悬于 500 µl 补充有 12.5 µM 树枝状聚合物的透化缓冲液中。 点击反应在37°C下振荡1小时。 要分离 RNA,请在 410 µl 25 mM K 中洗涤并重悬细胞沉淀33、50 µl 10% SDS、30 µl 蛋白酶 K(Thermo Fisher Scientific,25530049)和 10 µl SUPERNase 抑制剂(Thermo Fisher Scientific,AM2696)。 将混合物在 55°C 下振荡 2 小时,然后进行苯酚-氯仿萃取和乙醇沉淀。

将沉淀的 RNA 溶解在 105 µl 25 mM K 中33、12 µl 10× DNase I 缓冲液(Thermo Fisher Scientific,AM8170G)、2 µl DNase I(Thermo Fisher Scientific,18047019)和 1 µl SUPERNase 抑制剂。 将混合物在 37°C 下轻轻摇动 30 分钟。 然后,加入 130 µl 2× 蛋白酶 K 缓冲液(100 mM Tris-HCl,pH 7.5,200 mM NaCl,2 mM EDTA,1% SDS)和 10 µl 蛋白酶 K。 将混合物在 55°C 下再摇动 30 分钟,然后进行苯酚-氯仿萃取和乙醇沉淀。 将沉淀的 RNA 溶解在 63 µl 25 mM K 的混合物中33 和 7 µl RNA 片段化缓冲液(Thermo Fisher Scientific,AM8740)。 将混合物在 70°C 下加热 15 分钟,然后猝灭反应。

对于每个样品,在室温下用 100 µl 1× 结合/洗涤缓冲液(5 mM Tris-HCl,pH 7.4,0.5 mM EDTA,1 M NaCl, 0.05% 吐温 20) 含 1 µg µl−1 BSA(新英格兰生物实验室 (NEB),B9000S)和 1 µg µl−1 鲑鱼精子 DNA (Thermo Fisher Scientific, 15632011) 30 分钟。 将珠子洗涤并重悬于 80 µl 2× 结合/洗涤缓冲液(10 mM Tris-HCl,pH 7.4,1 mM EDTA,2 M NaCl,0.1% Tween 20)中,并在室温下与片段化 RNA 一起孵育 20 分钟随着旋转。 用 100 µl 1× 结合/洗涤缓冲液洗涤珠子两次,并用 100 µl 1× PNK 缓冲液(从 10× 稀释;NEB,M0201L)洗涤一次。

将珠子重悬于 41 µl 25 mM K 中33。 添加 5 µl 10× T4 PNK 缓冲液、3 µl T4 PNK (NEB, M0201L) 和 1 µl SUPERNase 抑制剂。 在 37°C 下摇动珠子 30 分钟。 然后,添加 1 µl 10× T4 PNK 缓冲液、3 µl T4 PNK 和 6 µl 10 mM ATP。 在 37°C 下再摇动管 30 分钟。 然后用 1× 结合/洗涤缓冲液洗涤珠子两次,并用 1× 连接缓冲液(从 10× 稀释;NEB,M0437M)洗涤一次。 将珠子重悬于 673 µl 25 mM K 中33,添加 100 µl 10× T4 RNA 连接酶缓冲液、2 µl 10 mM ATP、200 µl 50% PEG 8000、20 µl T4 RNA 连接酶 I (NEB, M0437M) 和 5 µl SUPERNase 抑制剂。 将反应混合物在 16°C 下摇动过夜。

连接后,用 1× 结合/洗涤缓冲液洗涤珠子 3 次。 通过在 50 µl 水中于 95 °C 加热珠子 10 分钟来洗脱 RNA。 使用 RNA Clean & Concentrator Kit (Zymo Research, R1014) 纯化 RNA。 然后,使用 SMARTer Stranded Total RNA-Seq Kit v2–Pico Input Mammalian (Takara, 634413) 将 10 ng RNA 用于文库构建。 文库在 Illumina NovaSeq 平台上进行测序,PE150 模式,每个样本约 1 亿个读数。

细胞核分离

收集一千万个K562细胞并用1ml含有1mM EDTA的冰冷PBS洗涤一次。 然后,将 200 μl 冰冷的裂解缓冲液(10 mM Tris-HCl,pH 7.5,0.1% NP40,150 mM NaCl)添加到洗涤的细胞沉淀中,然后在冰上孵育 5 分钟。 接下来,将 500 μl 冷冻蔗糖垫(裂解缓冲液中的 24% 蔗糖)轻轻添加到裂解物下方。 将管在 4 °C、15,000 下离心G 10 min,弃去上清液。 然后,将 200 μl 含有 1 mM EDTA 的冰冷 PBS 轻轻添加到细胞核沉淀中,不要移动沉淀,然后吸出。 每个 KARR-seq 实验使用约 500 万个细胞核。 如上所述使核交联。

KARR-seq数据处理

SeqPrep 首先用于将重叠的读段对合并为单端读段。 未能合并的读取被排除在分析之外。 使用 STAR 删除 PCR 重复项,将生成的 FASTQ 文件映射到基因组和转录组(mm10、hg19 或 dm3)52。 STAR 用于恢复空位和嵌合读取 (–runModealignReads –outFilterMultimapNmax 100 –outSAMattributes all –alignIntronMin 1 –scoreGapNoncan -4 –scoreGapATAC -4 –chimSegmentMin 15 –chimJunctionOverhangMin 15 –limitOutSJcollapsed 10000000 –限制 IO 缓冲区大小 1500000000)。 间隙读取被定义为在 CIGAR 字符串中包含至少一个 N 条目的读取。 对于使用参考基因​​组进行的比对,执行额外的过滤步骤以去除与已知剪接点重叠的间隙读数。 缺口读数与嵌合读数相结合 _Chimeric.out.sam 输出文件以形成最终的嵌合读取集。 处理后的结果以pairix 格式存储和索引,以实现高效的基于范围的查询。 上述相同的处理步骤适用于 RIC-seq 数据。 对于 PARIS 数据,执行 readCollapse.pl 以折叠具有唯一分子标识符 (UMI) 条形码的读数。 KARR-seq数据处理统计数据包含在补充表中 1

为了识别条件之间的差异嵌合组,我们使用了 DESeq2(参考文献 2)。 53)并应用中值归一化和 Wald 检验。 如果调整后,差异嵌合组被报告为显着 < 0.05。

与物理距离图的比较

我们使用18S物理距离图来校准和推断物理距离接近度。 我们通过使用冷冻电镜结构计算每个 5-nt 窗口质心位置之间的欧几里得距离(L2 归一化),以 5-核苷酸 (nt) 分辨率的粒度计算 18S 的物理距离20。 为了将 KARR-seq、PARIS 和 RIC-seq 推断的物理距离分布制成表格,我们根据 18S 嵌合读段任一臂的中点从 5-nt 成对物理距离表中查找物理距离值。 应用高斯核来估计物理距离分布的核密度。

对于 28S、U3 和 TERC ,使用 ROC-AUC 曲线评估每个转录物的物理距离图和接触图之间的一致性,并使用伽玛分布对物理距离图进行二值化。 伽马分布参数化为 α = 6 和 β = µ/α,其中平均物理距离 µ = 20 Å。

嵌合读段聚类以及环和条的识别

为了识别环和条纹,我们对嵌合读段进行了聚类,并以无人监督的方式对它们进行了分类。 我们首先使用自定义重叠相似度函数计算成对距离:

$${rm{最小值}},{rm{}},{rm{重叠}}({{rm{左}}}_{1},{{rm{左}} }_{2}){rm{和}},{rm{重叠}}({{rm{右}}}_{1},{{rm{右}}}_{2} )$$

然后,我们根据相似性矩阵构建了一个图表,并使用基于 Clauset-Newman-Moore 模块化的方法检测嵌合读段簇来定义 RNA-RNA 相互作用。 对于每次相互作用,必须至少存在三个嵌合读段以支持聚类。 交互的代表性位置(左、右)被定义为交互锚点。 使用所有左臂起始位置的中值定义左锚,使用所有右臂结束位置的中值定义右锚。

嵌合基团聚集为稳定结构(环)和动态结构(条纹)。 循环被定义为与具有固定位置或位置变化有限的两个相互作用片段的相互作用。 条纹被定义为一端与固定位置的相互作用,另一端与可变相互作用位置的相互作用。 为了表征循环和条纹,我们计算了每个锚点的变异系数 (CV)。 两个锚点上 CV < 1.0 的嵌合组定义为环。 仅在右侧或左侧锚定上 CV < 1.0 的嵌合组分别定义为右侧或左侧条纹。

RNAcofold 二级结构预测

RNAcofold(ViennaRNA 版本 2.4.3)用于进行二级结构预测并计算其在相互作用锚点处的相关 MFE 值。 为了与在所有交互锚点处计算的 MFE 进行比较,使用 BEDtools(版本 2.26.0)生成背景集,以打乱锚点位置,同时保持转录本上存在的锚点的相同跨度分布和比例(bedtools shuffle -chrom)。

计算折叠指数

折叠距离定义为嵌合读数的左臂(起始位置)与嵌合读数的右臂(起始位置)之间的基因组距离。 为了量化 RNA 压缩水平并考虑不同长度、丰度和实验条件的转录本之间的差异,我们设计了折叠指数,即跨度距离的有界变换。 我们对 0 到 1 之间的跨度距离进行评分,其中 0 表示刚性,1 表示通过折叠而紧凑的趋势。

$${rm{折叠}},{rm{索引}}=1.0-{{rm{e}}}^{-{rm{alpha }}{rmit{s}} }$$

在哪里 s 是跨度距离,并且 (alpha =frac{1}{200})

这是一条单调增加的曲线,在收敛到 1 之前,它作为跨度距离的函数线性增加。它有效地降低了过长的转录组跨度。 α 参数化为 1/200,表示折叠指数 = 0.5 时的 150-nt 距离。 该度量可以应用于某个转录本、转录本或转录组范围内的给定区域。

核糖体分析数据处理

使用 Cutadapt (cutadapt –q 30 –a AGATCGGAAGAGCACACGTCT –u 3 –最小长度 10) 对核糖体分析序列进行预处理。 5’端的前三个碱基被剪掉。 然后使用 BWA 和默认参数对序列进行比对。 基因组覆盖率文件是使用 BEDtools (bedtools Genomecov –bga) 创建的,并转换为 UCSC bigWig 格式。 使用 CTK 无模型方法识别核糖体停滞位点54 (perl tag2peak.pl -big -ss -v -valley-seeking -valley-深度 0.9)。

三级结构建模

我们对三级结构进行了建模,并根据 FJC 模型计算了预期距离。

$$f(x)=4uppi {x}^{2}{left(frac{1}{2uppi {sigma }^{2}}right)}^{3/2}{ rm {e}}^{-left(frac{{x}^{2}}{2{sigma }^{2}}right)}$$

$${sigma}^{2}=frac{N{l}^{2}}{3}$$

在哪里 X 是两点之间的端到端距离。

两点之间的平均端到端距离 (E2E):

$${rm {E2E}}=sqrt{N}l$$

在哪里 是两点之间的单体/核苷酸的数量,并且 (l) 是RNA核苷酸的固定长度。

我们将二级结构和 MFE 纳入我们的三级结构建模中。 使用二级结构点括号表示法,我们首先应用 forgi 的 BulgeGraph (ViennaRNA) 类来构造图。 然后我们构建了二维 (2D) 树图 G最大时间,通过使用 Kruskal 算法找到最小生成树。

接下来,我们通过结合端到端平均物理距离函数构建了树图的预期物理距离图。 使用物理距离图来约束使用IMP框架构建的聚合物模型55。 最终的聚合物链输出为(X,y,z )坐标,并使用欧几里得距离导出模拟的物理距离图。

RBP eCLIP 分析

处理后的 eCLIP BAM 文件是从 ENCODE 中检索的。 为了确定交联诱导的终止位点 (CITS),我们对给定基因座 X 上游和下游 7 个核苷酸侧翼的堆积计数求和。 对于每个变换值 T,我们估计C 作为局部泊松参数并使用 C 的方法进行推断i−100 至 C我+100 然后计算每个位点 i 的值,并将其拟合到 beta 均匀混合模型以校正多重测试。 对于每个基因座 i,计算后验概率以确定是否 值更有可能遵循 beta(显着)分布或均匀(随机)分布。 我们使用大于 90% 的后验概率作为调用显着位点的阈值。 长度大于 15 的连续基因座被连接。

我们在相应的 eCLIP 控制样本上调用 CITS 以消除伪影。 我们通过仅采用 CITS 调用的共同相交区域来合并 CITS 调用,以产生严格的 eCLIP 调用集。

snoRNA-rRNA 相互作用的鉴定

我们使用 BWA-mem (bwa mem -M) 来绘制所有嵌合片段以识别分子间相互作用。 嵌合读段与规范转录组进行比对,选择最长的剪接亚型来代表相应的基因条目。 对于每个 C/D 盒 snoRNA,我们使用 BEDtools (bedtools Genomecov -bg) 计算了 18S 或 28S 转录本长度上嵌合片段的堆积覆盖率。 所有 snoRNA-rRNA 对中具有系统高覆盖度且不与已知 2′-OMe 位点重叠的区域被视为背景。 SciPy 的 find_peak 函数用于去除背景并使用以下参数识别 snoRNA–rRNA 峰:宽度 = 50,距离 = 50,高度 = 1 × 10−4

差异基因表达和基因集富集分析

对于 RSV 感染和 VSV 感染的样本,使用 KARR-seq 的非嵌合读数将模拟样本和感染样本的基因计数制成表格。 使用 DESeq2 在模拟样本和病毒感染样本之间进行差异基因表达分析(参考文献 1)。 53)。 使用 GSEApy 进行基因集富集分析 (GSEA)56 使用具有(1)宿主-病毒相互作用(至少有100个宿主-病毒嵌合读段)和(2)差异表达转录本(调整后的转录本)的转录本 < 0.01 和对数2 倍数变化 (FC) > 1.5 和对数2FC < -1.5)。

FISH 探针的制备

FISH 探针使用 Stellaris Probe Designer(版本 4.2)设计,并从 Integrated DNA Technologies 购买并进行了 5′ 胺修饰。 对于每个转录本,我们设计了 20 个探针来靶向每个末端。 根据先前发布的实验方案,针对 5′ 末端和 3′ 末端的混合探针用 Alexa Fluor 647 (AF647) NHS Ester(Thermo Fisher Scientific,A20006)和 Cy3B NHS 酯(Cytiva,PA63101)进行标记57。 通过乙醇沉淀纯化标记的探针,然后通过 P6 Micro Bio-Spin 柱(Bio-Rad,7326228)。 使用BioSpectrometer (Eppendorf)测定探针浓度和标记效率。

RNA荧光原位杂交

RNA FISH 是按照已发布的方案进行的58。 首先固定并透化 HepG2 细胞。 然后,将 100 µl 在杂交缓冲液(含 10% 硫酸葡聚糖和 10% 甲酰胺的 2× SSC)中稀释的 1 nM FISH 探针应用于细胞,并将细胞在 37 °C 下孵育 16 小时。 然后用 FISH 洗涤缓冲液(10% 甲酰胺溶于 2× SSC)洗涤细胞两次,每次 30 分钟,然后成像。

样品在含有 50 mM Tris-HCl (pH 8.0)、10% 葡萄糖、2× SSC、0.5 mg ml 的成像缓冲液中成像−1 葡萄糖氧化酶 (Sigma-Aldrich) 和 67 µg ml−1 过氧化氢酶(Sigma-Aldrich)。 使用配备 CFI HP TIRF 物镜(×100,NA = 1.49,Nikon)和 EMCCD(Andor,iXon Ultra 888)的 Nikon TiE 显微镜进行成像。 使用 647 nm 激光器 (Cobolt MLD) 和 561 nm 激光器 (Coherent Obis) 采集信号。

RNA FISH数据分析

使用 ImageJ (1.53n) 插件 ThunderSTORM(版本 1.3)在 AF647 和 Cy3B 通道中分别进行点检测59 在二维中。 ThunderSTORM 配置了以下参数。 图像滤波:具有三阶B样条函数、缩放因子为2的小波滤波器; 分子的近似定位:具有8邻域连通性的局部最大值方法,峰值强度阈值设置为第一小波级别标准差的三倍; 分子的亚像素定位:PSF(Integrated Gaussian)方法,采用最大似然拟合方法,拟合半径为5像素(像素大小=130 nm),初始sigma为1.6像素; XY 不确定度阈值:40 nm。

随后使用自定义 MATLAB (R2021b) 代码计算 RNA 间距离。 使用 TetraSpeck 微球 (Thermo Fisher Scientific) 校正色差。 中心距小于 300 nm 的 AF647 和 Cy3B 斑点对被认为是来自同一 mRNA 分子的信号。

ASO 阻断后前 rRNA 水平分析

ASO 和 qPCR 引物的序列包含在补充表中 2。 使用 SF Cell Line 4D-Nucleofector X 试剂盒(Lonza,V4XC-2024)通过电穿孔将 ASO 递送至 K562 细胞中。 48小时后,收集细胞以使用TRIzol试剂(Thermo Fisher Scientific,15596026)纯化RNA。 然后将纯化的 RNA 用于逆转录,然后进行 qPCR。

snoRNA-18S 相互作用的验证

生物素化 ASO 和 qPCR 引物的序列包含在补充表中 2。 K562 细胞按照 KARR-seq 程序中所示进行处理。 然后从细胞中分离总RNA,如上所述进行片段化和纯化。 百分之五的片段化 RNA 被保存为输入。 其余部分被分成几部分,并与杂交缓冲液中针对不同 rRNA 区域的生物素化 ASO 混合(75 mM HEPES,pH 7.0,150 mM KCl,25 mM K33)。 将混合物变性,然后逐渐将温度降至 25 °C 以进行重新杂交。 然后使用 30 µl Dynabeads Myone Streptavidin C1 (Thermo Fisher Scintific, 65001) 对混合物进行富集。 富集的 RNA 和相应的输入样品进行 RT-qPCR。

ASO 阻断后 RSV 和 VSV 复制分析

ASO(补充表 2) 使用 Lipofectamine RNAiMAX 进行转染。 简而言之,将 24 孔板中的 A549 细胞用 80 nM ASO 转染 24 小时,然后用 rgRSV 或 rVSV-GFP 以 0.1 的 MOI 进行病毒感染。 37℃孵育1小时后,除去病毒接种物,加入含有2%FBS的新鲜DMEM。 受感染的细胞在37°C下孵育。 使用 Attune NxT 流式细胞仪 (Thermo Fisher Scientific) 通过荧光显微镜和流式细胞术监测 GFP 表达。 使用FlowJo (10.0.7)软件分析流式细胞术数据。

报告摘要

有关研究设计的更多信息,请参阅 自然投资组合报告摘要 链接到这篇文章。

2024-01-18 00:00:00
1705731519

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​