网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

如何利用bedtools预测chip_seq数据的靶基因

本篇内容介绍了“如何利用bedtools预测chip_seq数据的靶基因”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

成都创新互联公司坚持“要么做到,要么别承诺”的工作理念,服务领域包括:成都网站设计、成都网站建设、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的宁津网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!

通常在分析peak区域对应的靶基因时,会选取转录起始位点TSS上下游一定长度的区域作为候选的靶基因范围,本文介绍下如何利用bedtools来对peak与TSS区域的overlap情况进行分析,从而得到靶基因,可以分为以下几步

1. 得到物种对应的TSS位点信息

hg38为例,通过UCSC的FTP服务可以得到物种对应的refFlat文件,链接如下

http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/

如何利用bedtools预测chip_seq数据的靶基因

refFLatrefGene这两个文件记录的信息相同,refFlat文件列数更少,这里我们选择下载refFlat.txt.gz, 该文件的内容如下所示

如何利用bedtools预测chip_seq数据的靶基因

在原始文件中是没有第一行的标题的,我手动添加的标题是为了方便描述每列的含义,从该文件中可以得到TSS位点信息。

2. 整理TSS位点信息

bedtools要求输入的文件格式为bed, gff, vcf等,这里我们需要把上述下载的原始文件转换为bed格式,用法如下

awk '{print $3"\t"$5"\t"$5"\t"$2"\t"$1"\t"$4}' > hg38.tss.bed

内容如下所示

如何利用bedtools预测chip_seq数据的靶基因

3. 运行bedtools window

bedtools windows和intersect的功能类似,都是用于求两个区间A和B的交集,只不过window会在A区间的上下游加上一个可以自定义的长度之后,再与B区间求交集,原理示意如下

如何利用bedtools预测chip_seq数据的靶基因

以TSS上下游5kb为例,用法如下

bedtools window -a hg39.tss.bed -b peak.bed -w 5000 -sm > overlap.txt

通过window这个命令,可以灵活的定义TSS上下游的区间,快速得到peak对应的靶基因。

“如何利用bedtools预测chip_seq数据的靶基因”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站,小编将为大家输出更多高质量的实用文章!


分享名称:如何利用bedtools预测chip_seq数据的靶基因
本文地址:http://bjjierui.cn/article/pjioei.html

其他资讯