为了响应国家教学改革号召、应对大数据时代需求,推动全国高校统计学科教学事业的发展,清华大学统计学研究中心于2019年11月30日发起并召开2019统计学教学改革研讨会。会议旨在优化统计学相关课程教学体系,并为统计学科教学工作者搭建沟通与交流的平台。来自北京大学、中国人民大学、中国科学院、中央财经大学、西南财经大学、东北师范大学、山东师范大学、北京工业大学、北京林业大学、北京师范大学、首都师范大学、上海纽约大学等全国13家高校近40名学者出席了本次研讨会。与会专家学者们充分肯定了本次研讨会召开的必要性,并积极建言,希望通过此次研讨会能切实地推动全国高校统计学的教学改革工作。
清华大学统计学研究中心讲师邓婉璐博士作为本次会议的组织者及主持人,简要介绍了此次会议举办的背景、中心的教学概况、本次会议的主要议题及预期会议目标。随后,清华大学统计学研究中心副教授、本科生统计学辅修教学工作负责人侯琳博士代表清华大学统计学研究中心致欢迎辞。美国国家医学院院士、哈佛大学生物统计系林希虹教授亦通过视频发表致辞。林教授在致辞中说,这个会议办得非常及时,随着数据科学变得越来越重要,在全世界范围内吸引了越来越多的学生,这对统计和数据科学的人才培养和教学带来非常好的机遇和不小的挑战。例如如何使现代统计方法更有效、更有影响力地解决科学问题;现代统计的核心知识技能是什么;如何改进课程体系以满足时代需求,应当添加哪些课程,例如大数据计算等;充分利用MOOC等教学资源帮助国内统计教学。最后林老师祝愿本次会议圆满成功。
随后,来自全国多所高校的12名教学骨干分别就“教学理念、教学体系探讨”和“教学方式、教学经验分享”两个主题发言,并开展深入讨论。中国人民大学吕晓玲老师首先分享了对传统统计学中核心课程《数理统计》的反思与改革探索,引发广泛共鸣和热烈讨论;北京大学的张志华老师则从宏观角度、大数据时代发展的大格局上指出统计学中引入《机器学习》相关课程的必要性。西南财经大学的周凡吟老师和李可老师从人才需求角度出发,分享了对课程体系的思考和新兴教学方式MOOC的实践经验;山东师范大学的赵强老师根据多年学科建设经验阐述了“省属院校统计学专业建设发展过程中遇到的困难与思考。” 东北师范大学的蔺杉老师基于“以学生为中心、以需求为导向”的指导思想,分享了通识课和专业课等课程建设经验及教学经验,探讨了如何在理科课程中实现立德树人的价值塑造。中国人民大学黄丹阳老师、周静老师指出传统教学应对实际数据分析的欠缺,分别依托《线性回归分析》、《统计软件应用》等课程生动展示了案例教学的成功教学经验。
中央财经大学的潘蕊老师分享了成功的翻转课堂、结合视频与讨论的新式教学法,并指出不仅要纵向培养好统计本专业学生,更要横向培养其他专业学生对统计学的兴趣,以此推动统计学科的蓬勃发展;北京工业大学的赵旭老师则以国家级精品课程和青教赛具体课件为例,分享如何抓住学生的兴趣点的经验技巧。针对统计学科的交叉功能,中科院的李欣海老师从生态学领域对统计方法的需求出发,分享其在教学当中的经验与遇到的问题,并同各位老师深入探讨;北京大学的张云俊老师则分享了其教授医学领域学生统计相关课程时,培养学生的统计学思维模式独特方法,指出应更重视思想而非技术细节。
最后,与会的专家学者针对现场提出的问题在教学理念加强应用导向、教学体系中增设机器学习课程、吸收新教学方式提高教学效果等方面达成共识,也留有部分问题有待进一步思考。有学者表示,此次会议是其开展统计教学工作多年来首次参与的统计学科内部专注教学的研讨会,具有特殊意义。与会者一致认为应该以此为契机,将之办成系列会议。会议探讨的内容切合实际,意义深远,统计学教学的改革工作任重道远,正是需要一线的教学工作者结合自身经验,不断的交流与思考,才能推送国内统计学教育稳步前进,共促我国统计学科的发展与进步。
2019年11月20日,清华大学统计学研究中心俞声副教授与哈佛大学Yichi Zhang、美国布莱根妇女医院Tianrun Cai作为共同第一作者的论文“High-throughput Phenotyping with Electronic Medical Record Data Using a Common Semi-supervised Approach (PheCAP)”于Nature Protocols平台在线发表。哈佛大学Tianxi Cai教授与布莱根妇女医院Katherine Liao博士是论文的共同通讯作者。[1]
基于电子病历的表型提取(EMR-based phenotyping)是利用电子病历促进生物医学研究的一项重要应用,可以大幅提高研究队列的建立速度、降低研究成本、扩大样本数量。目前,行业内仍然广泛使用基于ICD疾病诊断编码等的初级方法,对患者诊断判断的准确性相对较低。俞声副教授与Tianxi Cai教授自2015年起提出一系列统计方法,在尽可能控制人力成本的前提下,有效提升了表型提取的速度和准确性。
Nature Protocols期刊主要面向经过多年实践验证的、可形成标准的生物医学实验方法。本次发表的方法基于俞声、Tianxi Cai等较早提出的半监督表型提取技术[2]。目前,俞声、Tianxi Cai已开发出并发表多项无监督高通量表型提取技术[3,4]。这些技术已在美国多项精准医学研究项目中使用,未来亦有望成为基于电子病历的医学研究的标准实验方法。
参考文献
1 Zhang Y, Cai T, Yu S, et al. High-throughput phenotyping with electronic medical record data using a common semi-supervised approach (PheCAP). Nat Protoc 2019;:1–19. doi:10.1038/s41596-019-0227-6
2 Yu S, Chakrabortty A, Liao KP, et al. Surrogate-assisted feature extraction for high-throughput phenotyping. J Am Med Inform Assoc 2017;24:e143–9. doi:10.1093/jamia/ocw135
3 Yu S, Ma Y, Gronsbell J, et al. Enabling phenotypic big data with PheNorm. J Am Med Inform Assoc 2018;25:54–60. doi:10.1093/jamia/ocx111
4 Liao KP, Sun J, Cai TA, et al. High-throughput multimodal automated phenotyping (MAP) with application to PheWAS. J Am Med Inform Assoc 2019;26:1255–62. doi:10.1093/jamia/ocz066