在这个毕业设计课程中,我们将比较 COVID-19 基因突变的基因组序列,以确定药物疗法的潜在靶区。药物发现的第一步是确定其基因组的目标子序列。我们将首先比较病毒变异的基因组,寻找相似之处。然后,我们将执行 PCA 来减少维数,并找出最常见的特征。接下来,我们将使用 Python 中的 K-means 聚类来找到最佳的组数,并追踪病毒的血统。最后,我们将预测序列之间的相似性,并以此挑选目标子序列。在整个课程中,每节课都会有一个编程任务,并配有指导视频和帮助提示。课程结束时,您将能够很好地利用基因组测序发现对抗疾病的方法。

了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
本课程是 用于科学研究的人工智能 专项课程 专项课程的一部分
在注册此课程时,您还会同时注册此专项课程。
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
在本模块中,我们将通过执行一些基本的 EDA 和比较基因组序列来开始熟悉我们的数据集。通过分析 COVID-19 病毒的突变,我们将能够确定我们的药物应该针对的基因组的一些共同特性。
涵盖的内容
4个视频1个编程作业1个讨论话题1个非评分实验室
在本模块中,我们将继续处理基因组序列数据--使用 PCA 来识别分组并找出最重要的特征。在减少数据集的维数后,我们将能够使用 K-means 形成聚类,并在二维空间中可视化不同的区域。
涵盖的内容
2个视频1篇阅读材料1个编程作业1个非评分实验室
在本模块中,我们将使用 K-means 算法对基因组序列进行聚类。我们将通过比较各种输入的剪影得分来优化聚类的数量,从而找出最大的落差。最后,我们将在最后一个模块中使用预测管道来预测比特分数和药物疗法。
涵盖的内容
2个视频1个编程作业1个讨论话题1个非评分实验室
在本模块中,我们将测试各种回归因子,看看哪种回归因子在预测每个基因组序列的位点得分方面表现最佳。然后,我们将使用所选模型找到关系最密切的基因组马属动物,并追踪出可能的子序列,以便使用对抗性药物。
涵盖的内容
2个视频1个编程作业1个非评分实验室
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师
授课教师评分
(7个评价)
提供方
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
从 数据科学 浏览更多内容

Novartis

Novartis

University of California San Diego

Novartis



