在这门全面数据质量专业的第一门课程结束时,学员将能够
1.识别设计数据和收集数据之间的本质区别,并总结全面数据质量 (TDQ) 框架的关键维度;2.2. 定义全面数据质量框架的三个测量维度,并描述收集数据和设计数据在每个维度上对数据质量的潜在威胁; 3.定义全面数据质量框架的三个表示维度,并说明收集和设计的数据在每个维度上对数据质量的潜在威胁;以及 4.描述为什么数据分析定义了全面数据质量框架的一个重要维度,并总结对设计数据和/或收集数据分析计划的整体质量的潜在威胁。 本专业课程整体上旨在深入探讨全面数据质量框架,并为学员提供更多有关数据分析前需要进行的全面数据质量详细评估的信息。我们的目标是让学员将数据质量评估作为所有项目的重要组成部分纳入他们的工作流程。我们真诚地希望向所有学习者(如数据科学家和定量分析人员)传播有关总体数据质量的知识,因为他们在数据科学流程的初始步骤(侧重于数据收集和数据质量评估)中没有接受过足够的培训。我们认为,如果收集到的数据质量不高,那么广泛的数据科学技术和统计分析程序知识对定量研究也不会有任何帮助。 本专业将重点关注使用数据进行任何类型的科学研究时必不可少的第一步:生成或收集数据、了解数据来源、评估数据质量,以及在进行任何类型的统计分析或应用数据科学技术回答研究问题之前采取步骤最大限度地提高数据质量。考虑到这一重点,数据分析方面的材料将会很少,而现有的大量 Coursera 专业课程都涵盖了这一内容。本专业的主要重点是在分析之前了解并最大限度地提高数据质量。