基因组学、生物信息学及高性能计算.ppt

上传人:bowdiet140 文档编号:384956 上传时间:2018-10-10 格式:PPT 页数:35 大小:6.34MB
下载 相关 举报
基因组学、生物信息学及高性能计算.ppt_第1页
第1页 / 共35页
基因组学、生物信息学及高性能计算.ppt_第2页
第2页 / 共35页
基因组学、生物信息学及高性能计算.ppt_第3页
第3页 / 共35页
基因组学、生物信息学及高性能计算.ppt_第4页
第4页 / 共35页
基因组学、生物信息学及高性能计算.ppt_第5页
第5页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基因组学、生物信息学 及高性能计算,胡松年 中国科学院北京基因组研究所,内容,1. 研究所整体介绍,2.基因组及生物信息基础科研环境,3. 生物信息研究工作,4. 致谢,West 5 Institutes,Shanghai 8 Institutes,Beijing 7 Institutes,Bio-related Institute of CAS,Mid-South 5 Institutes,25 Institutes 19 National Key Labs 15 Botanic Gardens 18 Museums 9 Specimen Depository 13 Observation

2、Stations,3 Mb,30 Mb,400 Mb,3000 Mb,One can certainly do something useful for China,PLoS Biology 2005,Rice Gene Maps,Start from 1999,2007年10月22日,经过2个月的装修和筹备工作,中国科学院北京基因组研究所临时所址落成。,北京基因组所的中心任务,以大规模测序解决重要生物学问题(测序是手段,不是目的)将发现应用到经济和社会发展中 水稻基因组项目 人类转录组研究 肿瘤基因组研究 细菌及微生物研究,内容,1. 研究所整体介绍,2.基因组及生物信息基础科研环境,3.

3、生物信息研究,4. 致谢,基因组学,生物信息学,高性能计算,测序能力,数据产量:1TB/月 (不包括图像文件),454,Solexa GAII,“钓鱼”和“捞鱼”,前基因组时代的“钓鱼”和后基因组时代的“捞鱼”,CPU: 960(core),Aggregation Capabilities:10.2TFLOPS,运算速度快 节点多 单节点内存大(至少24GB/Core) 节点内部网络通路无特殊要求应用(NGS数据分析) 全基因组序列比对分析(BWA,SOAP,Bioscope,Bfast,) 转录组序列比对分析 ,通用高性能集群计算环境,专用计算环境,大内存服务器 128GB/256GB/51

4、2GB/1TB用途 大基因组拼接 转录组拼接 基于大数据量的功能分析 ,存储资源环境,分级存储 普通存储 + 高性能存储 高性能存储 + 磁带库存储 普通存储 + 高性能存储 + 磁带库存储 基因组所状况 普通存储:700TB(参与小数据计算) 高性能存储:200TB(参与大数据计算) 磁带存储:若干(备份数据),内容,1. 研究所整体介绍,2.基因组及生物信息基础科研环境,3. 生物信息研究工作,4. 致谢,生物信息研究工作,(1) Resequencing,Whole genome sequencing Exon capture sequecing,(2) Assembly,Sequenc

5、ing Reads Long reads:454、3730 Short reads:Solexa、Solid Hybrid Reads:Long + Short reads Assembly pipeline Reads filtering (QV, adaptor, redundant reads) Reads correction Contig assembly Scaffolding Fix gap,(3) Transcriptome,Basic Analysis Reads filtering Map to genome Map to junction Annotation DEGse

6、q GO KEGG,Advanced Analysis De novo assembly SNP allele Alternative Splicing Isoform expression Anti-sence RNA ,http:/,(4) microRNA,(5) Methylation,Solexa sequencing Busilfite method Single-end Pair-end Mapping strategy Methylation site Statistical analysis Distribution GC or non-GC,(6) Database and software,Bioinformatics database design and develop Webservice development Software development Lab Information Management System (LIMS) design and develop,http:/,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 教学课件 > 大学教育

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1