IBM
IBM 数据工程 专业证书

通过 Coursera Plus 获取 10,000 多门课程的 Accessibility

IBM

IBM 数据工程 专业证书

为成为数据工程师做好准备. 掌握就业所需的技能,以及必须掌握的 AI 技能,以适应紧缺职业。获得 IBM 颁发的证书。 无需任何经验。

IBM Skills Network Team
Muhammad Yahya
Abhishek Gagneja

位教师:IBM Skills Network Team

140,868 人已注册

包含在 Coursera Plus

获得职业证书,展示您的专业知识
4.7

(6,318 条评论)

初级 等级

推荐体验

灵活的计划
6 月 在 10 小时 一周
自行安排学习进度
攻读学位
获得职业证书,展示您的专业知识
4.7

(6,318 条评论)

初级 等级

推荐体验

灵活的计划
6 月 在 10 小时 一周
自行安排学习进度
攻读学位

您将学到什么

  • 掌握数据工程师在日常工作中使用的最新实用技能和知识

  • 学习创建、设计和管理关系数据库,并将数据库管理 (DBA) 概念应用于 MySQL、PostgreSQL 和 IBM Db2 等 RDBMS。

  • 使用 MongoDB、Cassandra、Cloudant、Hadoop、Apache Spark、Spark SQL、Spark ML 和 Spark Streaming 开发有关 NoSQL 和大数据的工作知识

  • 使用 Bash、Airflow 和 Kafka 实施 ETL 和数据管道;构建、填充和部署数据仓库;创建 BI 报告和交互式仪表板

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

专业认证 - 16门课程系列

数据工程概论

数据工程概论

第 1 门课程13小时

您将学到什么

  • 列出初级数据工程职位所需的基本技能。

  • 讨论数据工程生命周期的各个阶段和概念。

  • 描述关系数据库、NoSQL 数据存储和大数据引擎等数据工程技术。

  • 总结数据安全、治理和合规方面的概念。

您将获得的技能

类别:数据管道
类别:数据仓库
类别:提取、转换、加载
类别:数据安全
类别:数据架构
类别:数据治理
类别:NoSQL
类别:Apache Spark
类别:大数据
类别:SQL
类别:关系数据库
类别:数据存储
类别:Apache Hadoop
类别:数据库
类别:数据湖
类别:数据科学

您将学到什么

  • 通过学习基本语法、数据类型、表达式、变量和 String 操作,培养对 Python 编程的基础理解。

  • 使用数据结构、条件和分支、Loop、函数、异常处理、对象和类应用 Python 编程逻辑。

  • 熟练使用 Pandas 和 Numpy 等 Python 库,并使用 Jupyter Notebook 开发代码。

  • 通过使用请求处理 REST API 和使用 BeautifulSoup 执行网络刮擦,访问和提取基于网络的数据。

您将获得的技能

类别:Python 程序设计
类别:Pandas(Python 软件包)
类别:网页抓取
类别:数据结构
类别:NumPy
类别:应用编程接口 (API)
类别:数据操作
类别:JSON
类别:面向对象编程(OOP)
类别:Jupyter
类别:数据分析
类别:自动化
类别:数据处理
类别:数据导入/导出
类别:还原式 API
类别:计算机编程
类别:脚本
类别:编程原则

您将学到什么

  • 展示使用 Python 处理和操作数据的技能

  • 使用 Python 实施网络抓取并使用 API 提取数据

  • 扮演数据工程师的角色,在实际项目中提取、转换和加载数据

  • 使用 Jupyter 笔记本和集成开发环境完成项目

您将获得的技能

类别:提取、转换、加载
类别:数据操作
类别:网页抓取
类别:Python 程序设计
类别:代码审查
类别:还原式 API
类别:单元测试
类别:数据转换
类别:集成开发环境
类别:数据库
类别:应用编程接口 (API)
类别:风格指南
类别:数据处理
类别:SQL
关系数据库 (RDBMS) 简介

关系数据库 (RDBMS) 简介

第 4 门课程15小时

您将学到什么

  • 描述数据、数据库、关系数据库和云数据库。

  • 描述信息和数据模型、关系数据库和关系模型概念(包括模式和表格)。

  • 解释实体关系图,并为特定用例设计关系数据库。

  • 掌握常用数据库管理系统的工作知识,包括 MySQL、PostgreSQL 和 IBM DB2

您将获得的技能

类别:关系数据库
类别:SQL
类别:数据库设计
类别:PostgreSQL
类别:MySQL
类别:数据库架构与管理
类别:数据操作
类别:数据管理
类别:IBM DB2
类别:数据建模
类别:数据库
类别:数据完整性
类别:数据库管理系统
类别:命令行界面

您将学到什么

  • 使用 SQL 和 Python 分析数据库中的数据。

  • 创建关系数据库,并使用 DDL 命令处理多个表。

  • 使用 DML 命令构建基本至中级 SQL 查询。

  • 利用视图、事务、存储过程和连接等高级 SQL 技术,编写功能更强大的查询。

您将获得的技能

类别:SQL
类别:Pandas(Python 软件包)
类别:Jupyter
类别:数据操作
类别:数据分析
类别:关系数据库
类别:数据库
类别:Query 语言
类别:Python 程序设计
类别:事务处理
类别:存储过程

您将学到什么

  • 描述 Linux 体系结构和常见的 Linux 发行版,在 Linux 系统上更新和安装软件。

  • 在 Bash shell 中执行常见的信息、文件、内容、导航、压缩和网络命令。

  • 使用 Linux 命令、环境变量、管道和过滤器开发 shell 脚本。

  • 使用 crontab 在 Linux 中安排 cron 作业,并解释 cron 语法。

您将获得的技能

类别:Linux 命令
类别:外壳脚本
类别:Linux
类别:脚本
类别:Unix
类别:Unix 命令
类别:文件管理
类别:乌班图
类别:网络协议
类别:脚本语言
类别:操作系统
类别:Linux 服务器
类别:Bash(脚本语言)
类别:命令行界面
类别:软件安装
类别:自动化
关系数据库管理(DBA)

关系数据库管理(DBA)

第 7 门课程21小时

您将学到什么

  • 创建、查询和配置数据库,访问和构建表格等系统对象。

  • 执行基本的数据库管理,包括备份和恢复数据库以及管理用户角色和权限。

  • 监控和优化数据库性能的重要方面。

  • 排除连接、登录和配置等数据库问题,并自动执行报告、通知和警报等功能。

您将获得的技能

类别:数据库管理
类别:数据库架构与管理
类别:数据库设计
类别:数据库管理员
类别:加密
类别:灾难恢复
类别:MySQL
类别:数据库系统
类别:关系数据库
类别:IBM DB2
类别:数据存储技术
类别:用户账户
类别:PostgreSQL
类别:性能调整
类别:系统监控
类别:Operator 数据库
类别:基于角色的访问控制(RBAC)

您将学到什么

  • 描述并对比提取、转换、加载(ETL)流程和提取、加载、转换(ELT)流程。

  • 解释批处理与并发执行模式。

  • 通过 bash 和 Python 函数实现 ETL 工作流程。

  • 描述数据管道组件、流程、工具和技术。

您将获得的技能

类别:提取、转换、加载
类别:数据管道
类别:阿帕奇气流
类别:Apache Kafka
类别:外壳脚本
类别:数据整合
类别:命令行界面
类别:大数据
类别:可扩展性
类别:Data Mart
类别:数据仓库
类别:数据转换
类别:数据处理
类别:性能调整
类别:网页抓取
类别:Unix Shell
类别:数据迁移
数据仓库基础知识

数据仓库基础知识

第 9 门课程15小时

您将学到什么

  • 在短短 6 周内掌握可直接就业的数据仓库技能,并获得实践经验和 IBM 证书的支持。

  • 设计和填充数据仓库,使用 CUBE、ROLLUP 和物化视图建模和查询数据。

  • 识别流行的数据分析和商业智能工具及供应商,并使用 IBM Cognos Analytics 创建数据可视化。

  • 如何设计数据并将其 Load 到数据 Warehouse 中、编写聚合查询、创建 Materialized 查询表以及创建分析仪表板。

您将获得的技能

类别:数据仓库
类别:星形模式
类别:数据湖
类别:Data Mart
类别:雪花模式
类别:IBM DB2
类别:PostgreSQL
类别:数据库系统
类别:数据建模
类别:数据架构
类别:提取、转换、加载
类别:SQL
类别:数据清理
类别:Query 语言
类别:数据质量
类别:数据整合
类别:数据库设计
类别:数据验证

您将学到什么

  • 探索分析和商业智能(BI)工具的用途

  • 了解 IBM Cognos Analytics 和 Google Looker Studio 的功能

  • 利用 IBM Cognos Analytics 展示您分析 DB2 数据的能力

  • 使用 IBM Cognos Analytics 和 Google Looker Studio 创建和共享交互式 Dashboard

您将获得的技能

类别:IBM Cognos 分析
类别:Looker (软件)
类别:数据可视化软件
类别:仪表板
类别:交互式数据可视化
类别:商业智能软件
类别:商业智能
类别:数据展示
类别:数据可视化
类别:分析
NoSQL 数据库简介

NoSQL 数据库简介

第 11 门课程18小时

您将学到什么

  • 区分 NoSQL 存储库的四大类别。

  • 描述比较流行的大数据处理工具的特点、功能、优势、局限性和应用。

  • 使用 MongoDB 任务执行常见任务,包括创建、读取、更新和删除(CRUD)操作。

  • 在 Cassandra 中执行键空间、表和 CRUD 操作。

您将获得的技能

类别:NoSQL
类别:Apache Cassandra
类别:MongoDB
类别:数据建模
类别:可扩展性
类别:分布式计算
类别:Query 语言
类别:JSON
类别:数据库管理
类别:IBM 云
类别:数据操作
类别:数据库
类别:数据库架构与管理

您将学到什么

  • 解释大数据的影响,包括使用案例、工具和处理方法。

  • 介绍 Apache Hadoop 架构、生态系统、实践和用户相关应用,包括 Hive、HDFS、HBase、Spark 和 MapReduce。

  • 应用 Spark 编程基础,包括数据帧、数据集和 Spark SQL 的并行编程基础。

  • 使用 Spark 的 RDD 和数据集,使用 Catalyst 和 Tungsten 优化 Spark SQL,以及使用 Spark 的开发和运行环境选项。

您将获得的技能

类别:Apache Spark
类别:分布式计算
类别:大数据
类别:Apache Hadoop
类别:Apache Hive
类别:IBM 云
类别:可扩展性
类别:调试
类别:PySpark
类别:Docker (软件)
类别:Kubernetes
类别:性能调整
类别:数据处理
类别:数据转换
使用 Apache Spark 进行机器学习

使用 Apache Spark 进行机器学习

第 13 门课程15小时

您将学到什么

  • 描述 ML,解释其在数据工程中的作用,总结生成式人工智能,讨论 Spark 的用途,分析 ML 管道和模型持久性。

  • 评估 ML 模型,区分回归、分类和聚类模型,比较数据工程管道和 ML 管道。

  • 使用 Spark SQL 构建数据分析流程,并使用 SparkML 执行回归、分类和聚类。

  • 演示连接 Spark 集群、构建 ML 管道、执行特征提取和转换以及模型持久性。

您将获得的技能

类别:Apache Spark
类别:机器学习
类别:提取、转换、加载
类别:回归分析
类别:功能工程
类别:数据转换
类别:PySpark
类别:预测建模
类别:数据管道
类别:监督学习
类别:无监督学习
类别:生成式人工智能
类别:数据处理
类别:应用机器学习
类别:Apache Hadoop
数据工程顶点项目

数据工程顶点项目

第 14 门课程16小时

您将学到什么

  • 熟练掌握初级数据工程职位所需的技能。

  • 设计和实施数据工程生命周期中的各种概念和组件,如数据存储库。

  • 展示有关关系数据库、NoSQL 数据存储、大数据引擎、数据仓库和数据管道的工作知识。

  • 应用 Linux shell 脚本、SQL 和 Python 编程语言技能解决数据工程问题。

您将获得的技能

类别:SQL
类别:提取、转换、加载
类别:数据仓库
类别:大数据
类别:Apache Spark
类别:MySQL
类别:数据分析
类别:数据管道
类别:仪表板
类别:MongoDB
类别:NoSQL
类别:数据架构
类别:IBM DB2
类别:数据库
类别:关系数据库
类别:应用机器学习
类别:IBM Cognos 分析
类别:PostgreSQL
类别:Python 程序设计
类别:数据基础设施

您将学到什么

  • 在各行业的数据工程流程中利用各种 AI 生成工具和技术

  • 使用生成式 AI 工具实施数据生成、Augmentation 和匿名化等各种数据工程流程

  • 在数据仓库模式设计和基础架构设置的实践实验室和项目中练习 AI 生成技能

  • 评估实际案例研究,展示生成式 AI 在 ETL 和数据存储库中的成功应用

您将获得的技能

类别:生成式人工智能
类别:数据综合
类别:提取、转换、加载
类别:数据分析
类别:数据仓库
类别:负责任的人工智能
类别:人工智能
类别:数据基础设施
类别:数据管道
类别:数据质量
类别:数据架构
类别:Query 语言
类别:数据伦理
类别:数据挖掘
类别:数据库设计
数据工程职业指南和面试准备

数据工程职业指南和面试准备

第 16 门课程11小时

您将学到什么

  • 描述数据工程师的角色、一些职业选择以及该领域的潜在机会。

  • 解释如何为求职打下基础,包括研究招聘信息、撰写简历和制作作品集。

  • 总结求职者在典型的求职面试周期中可能遇到的情况、不同类型的面试以及如何准备面试。

  • 解释如何进行有效的面试,包括回答问题的技巧和如何进行专业的个人陈述。

您将获得的技能

类别:面试技巧
类别:专业网络
类别:数据管道
类别:LinkedIn
类别:专业发展
类别:语言交流技能
类别:沟通策略
类别:数据战略
类别:数据基础设施
类别:数据伦理
类别:技术交流

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

攻读学位

当您完成本 专业证书后,如果您被以下在线学位课程录取并注册,您的学习成绩可能会被承认为学分¹。

 
ACE 徽标

此 专业证书 具有 ACE® 推荐。它有资格在参与美国诸学院和大学时获得大学学分。注意:接受特定学分建议的决定由每个机构决定。 

位教师

IBM Skills Network Team
85 门课程1,677,309 名学生
Muhammad Yahya
IBM
5 门课程96,981 名学生
Abhishek Gagneja
IBM
6 门课程252,748 名学生

提供方

IBM

人们为什么选择 Coursera 来帮助自己实现职业发展

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题

¹ Median salary and job opening data are sourced from Lightcast™ Job Postings Report. Content Creator, Machine Learning Engineer and Salesforce Development Representative (1/1/2024 - 12/31/2024) All other job roles (12/1/2024 - 12/1/2025)