启动子与转录因子互作研究思路设计——借力表观组学与基础分子生物学实验
众所周知,转录因子结合在基因启动子区域调控基因的表达,是基因表达量改变最重要的调控方式。那转录因子与靶基因之间的对应关系便成为研究的重点。本期文章我们将为大家带来如何研究转录因子与靶基因之间对应关系的方法,一起来看看吧。
一、启动子与转录因子简介
启动子是RNA聚合酶识别、结合和开始转录的一段DNA 序列,一般我们研究时默认选择研究转录起始位点上游2000bp作为启动子区域,因为基因的上游区域通常包含了基因的调控元件,而这些元件的作用范围一般在2000bp以内。
在转录过程中,由DNA产生具有特定编码信息的RNA转录物。为确保基因在不同细胞和组织中表达的特异性,一组特定的蛋白质通过选择基因来调控转录,最终这些基因将被转录成RNA转录本,这组蛋白质统称为转录因子。转录因子具有DNA结合结构域,可与基因启动子或增强子的特定DNA序列结合,并在激活剂、共因子和RNA聚合酶等的配合下启动基因转录。目前发现,约1600个具有DNA结合结构域的蛋白质是转录因子。
在转录因子和结合的靶基因关系研究中,要么已知转录因子;要么已知靶基因;要么已有报道两者都知道,想在自己的研究场景中进行验证两者的关系。下面我们就分门别类就这几种情况下的研究方法和思路来做介绍。
图1转录过程
二、寻找已知转录因子结合的靶基因
如果我们明确知道转录因子,想找其靶基因是谁,也就是寻找已知转录因子结合的靶基因。首先,在开始正式实验以前,如果我们可以先进行转录因子结合靶基因的预测,那将会大大增加我们内心的安全感和对结果的保证。预测转录因子结合的靶基因的数据库有很多,比如JASPAR数据库, 通过软件预测在基因的启动子序列上是否有对应的motif, 从而识别转录因子的靶基因。
又如TRRUST(https://www.grnpedia.org/trrust/Network_search_form.php),我们输入转录因子的名称后就可以得到其靶基因的信息,如我们在TRRUST数据库中寻找转录因子TEAD1的靶基因,我们把TEAD1输入到search框中检索,最终得到如下结果,我们可以看到该转录因子的靶基因目前有5个,分别是ATP6V0A2、MSLN、NAIP、PAX3和SRF。在网页中点击靶基因的名称还可以看到该基因的具体信息。
图2 TRRUST数据库转录因子预测靶基因结果展示
然后,查阅文献看是否有报道该转录因子结合的靶基因。如果有文献报道,我们想看在我们的研究背景下这种结合是否存在,那可以通过ChIP-qPCR、双荧光素酶实验或者酵母单杂交技术来验证两者的结合情况。如果没有文献报道过该转录因子的靶基因信息,那我们可以通过表观组学手段ChIP-seq或者CUT&Tag技术来分析。这两种方法的原理一样,均是使用所研究的转录因子的抗体将转录因子及与之结合的基因组DNA复合物捕获下来,后对捕获得到的DNA片段进行测序,最终分析出转录因子结合的靶基因。如果有些转录因子没有合适的抗体,那可以使用加标签的办法,把转录因子标记后通过标签抗体进行后续研究。不过研究到此并没有结束,杂志投稿时还需要后续的验证数据,一般还需要通过ChIP-qPCR、双荧光素酶实验或者酵母单杂交技术等方法来验证测序结果。
三、寻找调控某个已知基因的转录因子
这种情况与上面描述的情况正好相反,我们知道某一个基因,想筛选调控该基因的转录因子,那可以通过以下方法来开展。首先,通过网站预测靶基因的转录因子。因为转录因子结合在基因的启动子区域,所以要预测该基因的转录因子,我们需要先找到该基因的启动子区域(这个方法在我们以前的一篇公众号文章“ChIP-qPCR引物设计方法介绍”中有过介绍,这里就不再赘述,可点击文末的文章链接查看~),得到该启动子序列后我们借助UCSC联合JASPAR数据库或PROMO数据库进行转录因子的预测(具体方法大家可以自己搜索一下,或者私信小编具体沟通,这里也不再赘述)。如下图我们以人的TP53基因启动子序列为例做的转录因子预测结果,转录因子个数可通过设置JASPAR数据库参数来调整。
这些预测只能给我们提供一些参考,如果通过这一步我们能得到明确的转录因子,那就可以通过ChIP-seq、CUT&Tag、ChIP-qPCR或者双荧光素酶实验等方法进行实验层面的验证。如果通过预测我们没有得到想要的结果,或者我们想通过实验来筛选,这时我们可以进行DNA pull-down实验或者酵母单杂交筛库来实现。该实验是体外研究DNA-蛋白质相互作用的有力工具。大致原理是对感兴趣的DNA序列设计生物素标记的特异性DNA探针,并和与磁珠偶联的链霉亲和素结合。将该结合物与细胞核提取物一起孵育后纯化与目标DNA片段结合的蛋白质,将该蛋白洗脱后进行后续的WB或者质谱鉴定,从而得到与靶基因结合的转录因子。

图3 靶基因启动子序列预测转录因子
四、转录因子和靶基因均未知
在转录因子和靶基因均未知的情况下,我们是否可以研究两者时间的对应关系呢?看到这个问题肯定有些人比较好奇,我们就是研究它们之间的关系,现在两个都不知道,如何开展研究呢?下面我们说一个研究思路就可以解决这个问题。
我们知道ATAC-seq的测序数据可以分析motif,这时再联合转录组测序数据,通过ATAC-seq的motif分析寻找对应转录本相关基因的上游转录因子,从而可以挖掘靶基因与对应的转录因子,然后可以进一步通过ChIP-seq来验证前面两种技术得到的转录因子和靶基因的调控关系。
如果在这个过程中我们得到了一个从没被报道过是转录因子的蛋白,那我们需要进行验证,证明其是转录因子。这时可以考虑进行亚细胞定位(转录因子发挥作用时位于细胞核中)或者基于酵母双杂交的转录激活验证。
最后,我们把研究启动子与转录因子结合的实验设计中常用的几种方法汇总如下:
方法 |
目的 |
双荧光素实验 |
验证启动子与转录因子结合 |
酵母单杂交实验 |
验证启动子与转录因子结合 |
酵母单杂交筛库 |
筛选已知启动子结合的转录因子 |
ChIP-qPCR |
验证启动子与转录因子结合 |
ChIP-seq/CUT&Tag |
筛选已知转录因子结合的靶基因 |
DNA pull-down+质谱(蛋白鉴定) |
筛选已知启动子结合的转录因子 |
亚细胞定位 |
验证蛋白是否是转录因子 |
酵母双杂交的转录激活实验 |
验证蛋白是否是转录因子 |
关于APExBIO
APExBIO是一家集研发、销售和技术服务为一体的高新技术企业,总部位于美国休斯顿。APExBIO的产品涵盖肿瘤、免疫、神经等热门生物医药领域研究所需的小分子抑制剂/激动剂,高通量化合物库,细胞分子检测试剂等;作为国内领先的mRNA体外转录合成平台供应商,我们提供各种体外合成mRNA所需的修饰核苷酸、转录酶等原料,并可提供mRNA定制服务及LNP包被服务;此外,APExBIO技术服务部致力于提供组学检测与质控、生信分析及结果解读等一站式科研外包服务,包括单细胞、转录、微生物、蛋白、代谢以及表观等多组学实验和药物开发服务,广泛应用于药物研发、个性化医疗、健康管理等领域,为全球科研人员提供突破性的研究工具。
迄今为止,APExBIO已服务全球2000+用户,5000+重要科研项目,助力Immunity、Nature等300+ CNS国际顶尖学术期刊文章的发表。我们以专业的团队和卓越的技术,不断提升服务质量和客户满意度,为全球科研事业的发展贡献力量。