IBM
NoSQL、大数据和 Spark 基础 专项课程
IBM

NoSQL、大数据和 Spark 基础 专项课程

大数据职业生涯的跳板. 掌握 NoSQL、大数据和 Apache Spark 的基础知识,掌握机器学习和数据工程方面的实用就业技能。

IBM Skills Network Team
Muhammad Yahya
Romeo Kienzler

位教师:IBM Skills Network Team另外 6 个

13,912 人已注册

包含在 Coursera Plus

深入学习学科知识
4.4

(207 条评论)

初级 等级

推荐体验

4 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
深入学习学科知识
4.4

(207 条评论)

初级 等级

推荐体验

4 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度

您将学到什么

  • 使用 NoSQL 数据库插入、更新、删除、查询、索引、聚合和分片/分区数据。

  • 开发使用 MongoDB、Apache Cassandra 和 IBM Cloudant 的 NoSQL 实践经验。

  • 学习大数据基础知识,并获得使用 Apache Hadoop、MapReduce、Apache Spark、Spark SQL 和 Kubernetes 的实验室实践经验。

  • 使用 Apache Spark 执行提取、转换和加载(ETL)处理以及机器学习模型培训和部署。

您将获得的技能

  • 类别:PySpark
  • 类别:Databases
  • 类别:Apache Cassandra
  • 类别:Kubernetes
  • 类别:NoSQL
  • 类别:Generative AI
  • 类别:Apache Spark
  • 类别:Big Data
  • 类别:Distributed Computing
  • 类别:Apache Hive
  • 类别:Apache Hadoop
  • 类别:IBM Cloud
  • 类别:Machine Learning
  • 类别:Machine Learning Algorithms
  • 类别:Database Management
  • 类别:Supervised Learning
  • 类别:Extract, Transform, Load
  • 类别:MongoDB
  • 类别:Applied Machine Learning
  • 类别:Docker (Software)

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

精进特定领域的专业知识

  • 向大学和行业专家学习热门技能
  • 借助实践项目精通一门科目或一个工具
  • 培养对关键概念的深入理解
  • 通过 IBM 获得职业证书

专业化 - 3门课程系列

NoSQL 数据库简介

NoSQL 数据库简介

第 1 门课程18小时

您将学到什么

  • 区分 NoSQL 存储库的四大类别。

  • 描述比较流行的大数据处理工具的特点、功能、优势、局限性和应用。

  • 使用 MongoDB 任务执行常见任务,包括创建、读取、更新和删除(CRUD)操作。

  • 在 Cassandra 中执行键空间、表和 CRUD 操作。

您将获得的技能

类别:NoSQL
类别:MongoDB
类别:Apache Cassandra
类别:数据建模
类别:分布式计算
类别:Query 语言
类别:可扩展性
类别:JSON
类别:数据库管理
类别:数据操作
类别:数据库架构与管理
类别:IBM 云
类别:数据库

您将学到什么

  • 解释大数据的影响,包括使用案例、工具和处理方法。

  • 介绍 Apache Hadoop 架构、生态系统、实践和用户相关应用,包括 Hive、HDFS、HBase、Spark 和 MapReduce。

  • 应用 Spark 编程基础,包括数据帧、数据集和 Spark SQL 的并行编程基础。

  • 使用 Spark 的 RDD 和数据集,使用 Catalyst 和 Tungsten 优化 Spark SQL,以及使用 Spark 的开发和运行环境选项。

您将获得的技能

类别:Apache Spark
类别:大数据
类别:分布式计算
类别:Apache Hadoop
类别:IBM 云
类别:Apache Hive
类别:可扩展性
类别:调试
类别:数据转换
类别:PySpark
类别:数据处理
类别:性能调整
类别:Docker (软件)
类别:Kubernetes
使用 Apache Spark 进行机器学习

使用 Apache Spark 进行机器学习

第 3 门课程15小时

您将学到什么

  • 描述 ML,解释其在数据工程中的作用,总结生成式人工智能,讨论 Spark 的用途,分析 ML 管道和模型持久性。

  • 评估 ML 模型,区分回归、分类和聚类模型,比较数据工程管道和 ML 管道。

  • 使用 Spark SQL 构建数据分析流程,并使用 SparkML 执行回归、分类和聚类。

  • 演示连接 Spark 集群、构建 ML 管道、执行特征提取和转换以及模型持久性。

您将获得的技能

类别:机器学习
类别:Apache Spark
类别:提取、转换、加载
类别:回归分析
类别:数据转换
类别:监督学习
类别:无监督学习
类别:功能工程
类别:预测建模
类别:PySpark
类别:数据管道
类别:数据处理
类别:生成式人工智能
类别:应用机器学习
类别:Apache Hadoop

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

IBM Skills Network Team
IBM Skills Network Team
85 门课程1,681,603 名学生

提供方

IBM

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

常见问题