生物统计学和生物信息学共享资源设施(BB SRF)
使命宣言
生物统计和生物信息学共享资源设施(BCBR SRF)的使命是为马基癌症中心(MCC)从事基础、临床前和临床研究的基础和临床研究人员提供专业知识和各种服务。
生物统计和生物信息学共享资源设施(BB SRF)是一个由癌症中心管理的共享资源,在为马基癌症中心(MCC)进行的整个癌症研究领域提供科学和统计输入方面发挥着关键的协作作用。BB SRF的任务是通过与MCC成员的协作互动,应用统计原理来加强科学研究的执行。为此,我们的主要目标是提供一个全面、集中和可访问的生物统计和生物信息学支持基础设施,以支持癌症研究的所有阶段,包括研究开发、实施和研究后分析。
服务
生物统计学组件(副导演:Brent Shelton博士)
- 临床前研究、转化研究、临床试验和基于人群的干预研究拨款申请的研究设计、功率和样本量计算。
- 临床试验的开发和实施。
- 统计分析,包括中期和最终分析。
- 数据质量控制的统计规划。
- MCC教学/指导/一般统计咨询。
生物信息学组件(副主任:王驰博士)
- 下一代测序数据处理与分析。
- 代谢组学数据处理与分析。
- 微阵列数据处理与分析。
- 基因组数据挖掘。
- 组学整合。
- 授权写作、培训和咨询。
优先的服务
- 第一级:与MCC成员合作,在BB SRF资助下进行与癌症相关的同行评审研究。
- 第2级:MCC研究人员准备与癌症相关的、同行评审的拨款申请,建议BB SRF资助。
- 第三级:MCC试点/可行性项目。
- 第4级:MCC调查人员与BB SRF统计学家共同撰写的数据分析、稿件准备。
- 第5级:MCC研究人员开发非同行评审研究(如获得行业支持的印度理工学院),并请求BB SRF资助。
- 6级:没有资金支持的癌症研究项目,需要有限的统计输入。
请求BB SRF服务
BB SRF使用iLab解决方案来管理服务请求和项目跟踪。要开始使用BB SRF服务,请单击下面的链接,它将带您进入一个登陆页面,其中有更详细的说明,包括一次性帐户设置。一旦您的帐户建立,iLab将使您能够提交BB SRF服务请求,提供所需的批准,并监视您的项目进度。
返回调查人员可以在这里登录iLab.
生物信息学节
生物统计和生物信息学共享资源设施(BB SRF)的生物信息学部门旨在建立和维护健壮的和最先进的分析管道,用于分析、解释和可视化由马基癌症中心(MCC)癌症研究实验产生的大规模基因组、表观基因组、转录组和代谢组数据。虽然这些管道可以用于一般用途的生物信息学应用,但它们是专门为揭示癌症基因组的突变和复杂行为而定制的。我们与MCC研究人员密切合作,并为他们提供定制的生物信息学解决方案。我们目前的服务主要集中在以下几个方面。新服务将根据需求增加。
- 下一代测序数据分析。生物信息科开发了综合管道来处理和分析来自以下方面的数据:
- 全基因组或全外显子组测序。
- RNA-seq。
- ChIP-seq。
- 亚硫酸氢全基因组测序。
- 代谢组学数据分析。生物信息学科为代谢组学数据集的原始和中间数据分析提供信息学支持,特别是稳定的同位素解析代谢组学数据集。这些分析的结果可以提供给本节提供的其他生物统计分析。可以在有限的基础上提供定制下游代谢建模和相对通量分析。
- 微阵列数据分析。生物信息科为微阵列数据处理和分析开发了管道,包括数据规范化、质量评估、差异表达识别和可视化以及通路/功能分析。
- 多组学数据集的综合分析。生物信息学部门为分析多个基因组数据之间的相互作用或相关性提供生物信息学支持。一些例子包括dna -甲基化数据和RNA-seq数据的综合分析,以观察全局基因表达的调节,使用DNA-seq和RNA-seq数据检测异常转录本,RNA-seq和现有微阵列数据之间的相关性分析。本节还提供了使用CategoryCompare对软多组学集成的支持,它提供了跨组学数据集注释级别的集成。详情请与我们联系。
- 基因组数据挖掘。本节使用基因组数据存储库,如GEO、Oncomine和TCGA,将感兴趣的特定基因的基因组数据与临床结果关联起来。
- 其他大规模基因组数据分析。该部分为其他基因组实验平台(如NanoString nCounter系统)提供生物信息学支持。
- 写拨款支持。该部分将帮助研究人员进行基因组研究设计,样本量/功率计算,数据分析计划,并编写生物信息学部分。
- 培训和咨询。在生物医学研究人员、生物信息学家和计算生物学家之间建立融洽的关系和对话是很重要的。生物信息科与调查人员合作建立新的数据分析管道。该科人员主持有关生物信息学研究设计、工具、资源和数据库的培训/咨询/课程/讲座。新服务一旦可用,就会发布广告。
存储和计算资源
BB SRF配备了最先进的计算资源,以支持所有级别的研究,特别是临床和生物信息学研究。BB SRF和其他MCC设施的计算资源由MCC癌症研究信息共享资源设施(CRI SRF)集中协调。CRI SRF还牵头协调来自该大学计算科学中心(CCS,见下文)的资源,以支持大数据计划。BB SRF利用MCC资源和肯塔基大学校园资源,确保计算和分析活动的优化和安全beplay全站官网登录入口基础设施。
CCS提供了一个戴尔HPC集群(超级计算机),额定超过140万亿次浮点运算,包括通用cpu、高度并行的gpu、大型内存节点、高速Infiniband网络和高性能文件系统。
人员
- 生物资讯科副主任王琦博士(chi.wang@uky.edu)
- 刘金泽教授(liuj@netlab.uky.edu)
- 博士。猎人莫斯利教师(hunter.moseley@uky.edu)
数据管理部分
联系
- 海蒂韦斯(heidi.weiss@uky.edu)
目标:数据管理科(DMS)的任务是确保为研究项目提供充分和标准化的数据管理支持,特别是那些来自马基癌症中心(MCC)的四个研究项目。
总结服务:
DMS在研究的所有阶段提供服务,包括规划执行和分析。
- 规划:服务包括协助eCRF/问卷开发,确保所有数据之间的充分联系,为中期分析和安全停止创建自动警报,并与MCC的癌症研究信息共享资源设施(CRI SRF)进行交互,以提供信息技术支持。
- 执行:数据将按照预先确定的时间表定期导出,数据验证脚本将在数据上运行,并发送查询以进行澄清。将创建注册和质量报告。
- 分析:在数据收集结束时,将执行最后的数据验证。
统计和生物信息学工具和软件
专门的软件工具在内部开发
- R包(CRM)提供了设计和实施基于可能性的持续再评估方法(CRM)剂量寻找试验所需的设置和计算,包括二元或顺序毒性。此外,这个包可以在各种标准下执行模拟以评估设计性能。这里更详细地描述了文档文件和函数.
- Stacey Slone和Emily Dressler博士开发了用于中期分析的电子邮件通知和与OnCore系统集成的安全触发器,以协助MCC实施研究者发起的临床试验。请发邮件给史黛丝了解更多信息stacey.slone@uky.edu.
- 刘金泽博士为生物信息学应用开发了多种功能,包括比对软件:MapSplice、MapPER和差异转录组分析软件:FDM。如需更多信息,请发邮件给刘博士jinze.liu@uky.edu.
- bacr是Wang Chi博士开发的R包,用于实现贝叶斯混杂调整(BAC)方法,以估计队列研究中治疗对结果的平均因果效应。
- NanoStringDiff是王驰博士开发的R/Bioconductor包,用于基于NanoString nCounter系统生成的基因表达数据进行差异表达分析。此外,还有一个用户友好的web应用程序NanoStringDiffWeb可以在这里.
- “paf”R包:使用Chen、Lin和Zeng (Biometrika 97,713 - 726,2010)提出的方法,从Cox模型中计算一组协变量的未调整/调整归因分数函数。
- “KENDL”R包:使用Yang等人提出的方法(Sat. Med 36(18), 2935-2946, 2017)计算暴露分布的核平滑非参数估计量。
商用软件免费工具
我们的教职员工拥有丰富的经验和专业知识,可以使用许多统计软件包来帮助开展研究,计算样本容量,并为所有四个研究项目的MCC调查人员进行数据分析。我们很高兴与研究人员在一个可能需要专门软件的项目上合作。我们的统计包经验包括(但不限于):
- 通用:SAS, SUDAAN, SPSS, MINITAB, StatXact, LogXact, STATA
- 设计和样本量:nQuery Advisor 7,0, NCSS和PASS 2011, EAST, EAST SURV, EAST Adapt
- 适应性设计:ExpDesign Studio, ADDPLAN
- 共享软件:R,空间分析SaTScan, WinBugs, MD Anderson生物统计软件
- 生物信息学:FastQC, SAMtools, Picard, Cutadapt, trimmomatic, BBDuk, MapSplice2, STAR, BWA, bowti1, bowti2, TopHat, HTSeq, RSEM, DESeq2, edgeR, DSS, GSEA, GOseq, IPA, David, GATK, MuTect1, MuTect2, VarScan2, GISTIC2, MutSigCV, Oncotator, SnpEFF, ANNOVAR, Bismark, methylKit, MACS2, HOMER, QIIME2,母亲。
- 生物信息学数据库:Oncomine,基因表达综合,序列读取档案,基因组数据共享,cbiopportal, COSMIC, dbSNP和1000基因组。
MCC自定义数据库应用
的癌症研究信息共享资源设施,与BB SRF人员合作,与MCC调查人员密切合作,开发特定项目所需的数据库应用程序。
确认
研究人员必须在使用通过MCC BB SRF接收的生物统计学、生物信息学或信息的任何出版物中确认马基癌症中心生物统计学和生物信息学共享资源设施(BB SRF)。为方便起见,欢迎使用以下声明:
该研究得到了肯塔基大学马基癌症中心(P30CA177558)生物统计学和生物信息学共享资源设施的支持。beplay全站官网登录入口
如需更多信息,请联系markey.biostat@uky.edu.
教职员工
教师
海蒂·l·韦斯博士
教授
生物统计和生物信息学共享资源设施主任
Markey癌症中心
生物统计学,癌症生物统计学部
玫瑰街800号
罗奇建筑CC448
(859) 323 - 0577
heidi.weiss@uky.edu
研究兴趣
早期临床试验的贝叶斯设计和中期监测
化学预防和免疫治疗临床试验设计
研究设计和样本量规划为体外,体内小鼠癌症模型和翻译研究
Brent J. Shelton博士
首席教授
生物统计学副主任
Markey癌症中心
生物统计学,癌症生物统计学部
Harrodsburg路2365号
套件A230
(859) 219 - 0773 (x301)
bshelton@kcp.uky.edu
研究兴趣
数据缺失与选择偏差
分类数据分析
Group-randomized研究
筛查早期发现和癌症预防
气王博士
副教授
生物信息学副主任
Markey癌症中心
生物统计学,癌症生物统计学部
玫瑰街800号
罗奇建筑CC433
(859) 323 - 2045
chi.wang@uky.edu
研究兴趣
生物信息学
下一代测序数据分析
微阵列数据分析
贝叶斯模型选择
因果推论
李Chen博士
副教授
Markey癌症中心
生物统计学,癌症生物统计学部
玫瑰街800号
罗奇建筑CC425
(859) 323 - 2005
lichenuky@uky.edu
研究兴趣-详情请浏览李陈的网站
半参数和非参数方法
生存分析
纵向分析
统计遗传学
黄斌,博士,MS
副教授
Markey癌症中心
生物统计学,癌症生物统计学部
Harrodsburg路2365号
套件A230
(859) 219 - 0773 (x280)
bhuang@kcr.uky.edu
研究兴趣
基于人群的继发性癌症数据分析
缺失的数据分析
地理空间数据分析
比较的有效性分析
金泽国际刘博士
副教授
计算机科学系
工程学院
235 Hardymon建筑
beplay苹果下载网址列克星敦肯塔基州40506 - 0046
jinze.liu@uky.edu
研究兴趣
下一代测序数据的生物信息学方法
RNA-seq数据比对和差异转录组分析的计算方法
猎人莫斯利博士
副教授
Markey癌症中心
本·f·罗奇大厦CC436室
beplay苹果下载网址列克星敦肯塔基州40536
hunter.moseley@uky.edu
研究兴趣
开发分析的计算方法
解释生物和生物物理数据,利用公共科学数据库的相关信息,并整合跨组学级数据集的全系统分析
金鹏刘、女士
助理教授
Markey癌症中心
生物统计学,癌症生物统计学部
玫瑰街800号
罗奇建筑CC441
(859) 323 - 0557
jinpeng.liu@uky.edu
工作人员
关丽珍Chen认为
统计学家
Markey癌症中心
哈罗兹堡路2365号A230室
quan.chen@uky.edu
王妃Jayswal,女士
统计学家助理
Markey癌症中心
生物统计学,癌症生物统计学部
玫瑰街800号
罗奇建筑CC422
(859) 218 - 6177
rani.jayswal@uky.edu
Daheng他博士
生物信息学分析
Markey癌症中心
玫瑰街800号
daheng.he@uky.edu
安德鲁•希勒女士
情景应用程序程序员我
Markey癌症中心
玫瑰街800号
罗奇建筑CC440
(859) 323 - 1723
andrew.shearer@uky.edu
托德•韦斯MSPH
统计的程序员
Markey癌症中心
生物统计学,癌症生物统计学部
Harrodsburg路2365号
套件A230
(859) 219 - 0773
lweiss@kcr.uky.edu
劳伦·乔鲁姆女士
统计学家助理
Markey癌症中心
生物统计学,癌症生物统计学部
玫瑰街800号
laurenshelton@uky.edu