预测模型的开发和验证

来源:党委研究生工作部、控制与计算机工程学院发布时间:2018-06-08阅读次数:

讲座题目】预测模型的开发和验证

讲座时间】2018年6月11日(星期一)10:00-12:00

讲座地点】北京校部主楼E1009

主 讲 人】叶菲 副教授

主讲人简介

叶菲博士,美国范德堡大学医学中心生物统计学系生物统计学副教授,联合研究中心主任。她是两个NCI / NHGRI支持的项目的主要研究员,一个是开发乳腺癌预后预测模型,另一个是PheWAS研究。她最近获得了一项机构发展奖,关于开展一项试点研究,开发专门针对甲基化范围的关联研究的分析流水线和统计方法。叶菲博士在研究设计和临床流行病学和高维度组学研究的统计/生物信息学分析方面拥有丰富的经验。她曾担任多个审查委员会的委员(校外和校内),包括NCI特别重点小组,CTSA联盟科学评估委员会,范德堡-英格拉姆癌症中心科学评估委员会,范德堡临床和转化研究资助评估研究所,BioVU Pre审查委员会和范德堡-英格拉姆癌症中心数据和安全监测委员会。

内容简介

讲座是关于开发乳腺癌预测模型。建立预测模型,纳入临床病理、生活方式和遗传因素,包括年龄,肿瘤分级,肿瘤大小和淋巴结状态,以预测乳腺癌的生存期。然后考虑可修改的生活方式因素,包括诊断后身体质量指数,体重增加,PA和大豆食物摄入量以及ER,PR和HER2状态消费模型。开发预测模型的策略包括以下步骤:

1、根据结果变量的性质和审查类型选择合适的模型;

2、评估缺失数据的模式并执行多重归责以最大限度地利用关于某个主题的部分信息; 

3、确定模型的可允许的复杂性(即预测因子的数量);

4、降低变量中的共线性(如果检测到)以确保模型仅包括与BC结果独立相关的因素;

5、检查线性假设并允许估计非线性项和时变波动的样条回归模型中连续预测因子与BC结果之间的非线性关联;

6、检查可加性假设并纳入两个独立变量之间的预先指定的临床动机相互作用,并使用似然比检验比较有和没有相互作用项的模型;

7、检查是否有过分影响的观察;

8、检查分布假设;

9、用部分效应图和诺模图解释模型;

10、评估模型拟合。

上述模型构建过程是使用自举法进行内部验证的,通过平衡预测误差中的偏差和方差来评估和修正预测模型的潜在乐观情绪。

返回