应用数学与交叉科学研究中心生物信息学团队于2024年4月3日组会按期举行,小组全体成员和各位导师共同参加。在这次组会上,由两名研一员工和一名研三员工分别汇报自己的研究进展,然后老师与同学们对汇报内容进行学术探讨,并对存在的问题给出相应的指导和建议。
侯雅雯:本次汇报了一篇文献《LightGCL: simple yet effective graph contrastive learning for recommendation》。该篇文献,将用户-项目图经过奇异矩阵分解,然后再重新重构用户-项目图,之后将原始的用户-项目图和重构之后的用户项目图分别进行两层GCN,最后进行不同视图间的全局对比学习和统一视图间的局部对比学习。
窦博正:本次汇报的内容是博士面试模拟内容。具体包括以下几点:1.英文自我介绍部分;2.教育背景以及获得的荣誉和奖项;3.硕士期间的工作内容,包括机器学习在小数据上的应用、拓扑推断药物成瘾性学习模型和疼痛相关电压门控钠通道形成的扩展药物-靶标相互作用网络的机器学习研究;4.博士期间研究计划,汇报了博士期间拟开展的课题以及个人目标
万智康:本次汇报了一篇文献《Exploring variable-length features (motifs) for predicting binding sites through interpretable deep neural networks》。转录因子结合位点(TFBS)和RNA结合蛋白(RBP)在基因调控、转录、RNA编辑等方面发挥着关键作用。识别和定位这些潜在位点对于检测许多生物过程中的致病变异至关重要。近年来开发了一些深度学习方法来快速准确地预测结合位点,虽然现有的方法取得了良好的性能,但许多方法需要专门的特征集,而且可解释性仍然具有挑战性。为了克服这些问题,本文提出了一种可解释的深度学习技术,称为蛋白质结合变量模式预测器(PBVPP),它使用各种各样的实验数据和性能指标来预测结合位点。本文提出的方法的新颖性基于三个关键因素:(i) PBVPP及其变体能够从高通量技术获得的大规模基因组序列中提取重要特征,以预测TFBS和RBP位点的发生。(ii)提出的可解释模型揭示了如何挖掘重要特征,并提取可变长度模式以准确预测结合位点。(iii)根据TFBSshape DNA (JASPAR)数据库中已知的目标基序进行验证。该模型在TFBS、RBP的接收者工作曲线上分别比现有方法提高了5.88%、5.01%,在TFBS预测的查全率曲线上也提高了60%。
— 员工汇报照片展示 —