Edureka
PySpark for Data Science 专项课程
Edureka

PySpark for Data Science 专项课程

Fast-track your career in Data Science with PySpark. Unlock the potential of PySpark for data science, mastering data processing and analytics, and machine learning to drive informed decision-making.

Edureka

位教师:Edureka

包含在 Coursera Plus

深入学习学科知识
中级 等级

推荐体验

4 月 完成
在 5 小时 一周
灵活的计划
自行安排学习进度
深入学习学科知识
中级 等级

推荐体验

4 月 完成
在 5 小时 一周
灵活的计划
自行安排学习进度

您将学到什么

  • Master the fundamentals of Big Data and PySpark to process data using RDDs and DataFrames.

  • Optimize data science workflows by leveraging advanced PySpark DataFrame and SQL operations.

  • Build machine learning models with PySpark MLlib, applying regression and clustering techniques.

  • Implement data streaming with structured streaming and explore NLP for text processing in big data.

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

精进特定领域的专业知识

  • 向大学和行业专家学习热门技能
  • 借助实践项目精通一门科目或一个工具
  • 培养对关键概念的深入理解
  • 通过 Edureka 获得职业证书

专业化 - 3门课程系列

您将学到什么

  • Explore the fundamental concepts of Big Data and the components of the Hadoop ecosystem.

  • Explain the architecture and key principles of Apache Spark and its role in big data processing.

  • Utilize RDD transformations and actions to effectively process large-scale datasets with PySpark.

  • Execute advanced DataFrame operations, including data manipulation and aggregation techniques.

您将获得的技能

类别:PySpark
类别:SQL
类别:Data Processing
类别:Data Transformation
类别:Big Data
类别:Distributed Computing
类别:Apache Spark
类别:Data Manipulation
类别:Data Analysis Expressions (DAX)
类别:Data Cleansing
类别:Data Integration
类别:Apache Hadoop
类别:Data Pipelines
Machine Learning with PySpark

Machine Learning with PySpark

第 2 门课程13小时

您将学到什么

  • Implement machine learning models using PySpark MLlib.

  • Implement linear and logistic regression models for predictive analysis.

  • Apply clustering methods to group unlabeled data using algorithms like K-means.

  • Explore real-world applications of PySpark MLlib through practical examples.

您将获得的技能

类别:PySpark
类别:Machine Learning
类别:Performance Tuning
Data Streaming and NLP with PySpark

Data Streaming and NLP with PySpark

第 3 门课程17小时

您将学到什么

  • Analyze streaming data to extract insights and trends in real-time applications.

  • Analyze real-time data streams and apply Spark Streaming techniques for efficient processing.

  • Develop robust streaming applications using Spark's Structured Streaming for fault-tolerant processing.

  • Implement NLP techniques to process and analyze textual data efficiently.

您将获得的技能

类别:PySpark
类别:Real Time Data
类别:Apache Spark
类别:Natural Language Processing
类别:Data Transformation
类别:Data Processing
类别:Deep Learning
类别:Distributed Computing
类别:Performance Tuning
类别:Data Pipelines
类别:Text Mining
类别:Data Visualization

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

Edureka
Edureka
98 门课程102,390 名学生

提供方

Edureka

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题