• 为个人
  • 为商务
  • 为大学
  • 为政府
登录
免费加入
  • 浏览
  • Pyspark

PySpark 课程

PySpark 课程可以帮助您学习数据操作、分布式计算和数据分析技术。您可以掌握处理大型数据集、执行 Transformer 和执行 Machine Learning 算法的技能。许多课程都会介绍 Apache Spark 及其库等工具,这些工具支持高效处理 Big Data 并与 AI 应用程序集成。


热门 PySpark 课程和认证


  • 状态:免费试用
    免费试用
    I

    IBM

    使用 Spark 和 Hadoop 的大数据简介

    您将获得的技能: Apache Hadoop, 可扩展性, Docker (软件), 调试, 数据处理, Kubernetes, 数据转换, PySpark, Apache Spark, 分布式计算, IBM 云, 性能调整, 大数据, Apache Hive

    4.4
    评分, 4.4 星,最高 5 星
    ·
    465 条评论

    中级 · 课程 · 1-3 个月

  • 状态:免费试用
    免费试用
    I

    IBM

    用于数据科学、人工智能和开发的 Python

    您将获得的技能: Python 程序设计, 计算机编程, 数据操作, 数据处理, Pandas(Python 软件包), 网页抓取, 自动化, 数据分析, NumPy, 数据导入/导出, 编程原则, 还原式 API, JSON, 应用编程接口 (API), 数据结构, 脚本, Jupyter, 面向对象编程(OOP)

    4.6
    评分, 4.6 星,最高 5 星
    ·
    4.3万 条评论

    初级 · 课程 · 1-3 个月

  • 状态:新
    新
    状态:免费试用
    免费试用
    E

    EDUCBA

    Spark and Python for Big Data with PySpark

    您将获得的技能: PySpark, Apache Spark, MySQL, Data Pipelines, Scala Programming, Extract, Transform, Load, Customer Analysis, Apache Hadoop, Classification And Regression Tree (CART), Predictive Modeling, Applied Machine Learning, Data Processing, Advanced Analytics, Big Data, Apache Maven, Statistical Machine Learning, Unsupervised Learning, SQL, Apache, Python Programming

    4.7
    评分, 4.7 星,最高 5 星
    ·
    40 条评论

    初级 · 专项课程 · 1-3 个月

  • 状态:预览
    预览
    E

    Edureka

    Introduction to PySpark

    您将获得的技能: PySpark, Apache Spark, Data Management, Distributed Computing, Apache Hadoop, Data Processing, Data Analysis, Exploratory Data Analysis, Python Programming, Scalability

    3.7
    评分, 3.7 星,最高 5 星
    ·
    48 条评论

    初级 · 课程 · 1-4 周

  • C

    Coursera

    Data Analysis Using Pyspark

    您将获得的技能: PySpark, Matplotlib, Apache Spark, Big Data, Data Processing, Distributed Computing, Data Management, Data Visualization, Data Analysis, Data Manipulation, Data Cleansing, Query Languages, Python Programming

    4.4
    评分, 4.4 星,最高 5 星
    ·
    314 条评论

    中级 · 指导项目 · 不超过 2 小时

  • 状态:免费试用
    免费试用
    P

    Packt

    Mastering Azure Databricks for Data Engineers

    您将获得的技能: Databricks, CI/CD, Apache Spark, Microsoft Azure, Data Governance, Data Lakes, Data Architecture, Real Time Data, Data Integration, PySpark, Data Pipelines, Data Management, Automation, Data Storage, Jupyter, System Testing, File Systems, Data Quality, User Provisioning, Performance Tuning

    4.4
    评分, 4.4 星,最高 5 星
    ·
    26 条评论

    中级 · 专项课程 · 1-3 个月

是什么让您今天来到 Coursera?

  • 状态:免费试用
    免费试用
    I

    IBM

    NoSQL、大数据和 Spark 基础

    您将获得的技能: 机器学习, Apache Hadoop, Docker (软件), 生成式人工智能, 机器学习算法, 数据库, Apache Cassandra, NoSQL, MongoDB, 数据库管理, Kubernetes, PySpark, 分布式计算, 摘录, IBM 云, 大数据, Apache Hive, 应用机器学习, 监督学习, Apache Spark

    4.5
    评分, 4.5 星,最高 5 星
    ·
    811 条评论

    初级 · 专项课程 · 3-6 个月

  • 状态:新
    新
    状态:免费试用
    免费试用
    W

    Whizlabs

    Exam Prep DP-700: Microsoft Fabric Data Engineer Associate

    您将获得的技能: Azure Synapse Analytics, Performance Tuning, Microsoft Azure, System Monitoring, Data Engineering, Transact-SQL, Star Schema, Power BI, PySpark, Data Cleansing, Data Analysis Expressions (DAX), Apache Spark, Data Warehousing, Analytics, Data Modeling, Data Analysis, SQL, Azure Active Directory, Advanced Analytics, Microsoft Copilot

    中级 · 专项课程 · 1-3 个月

  • 状态:新
    新
    状态:免费试用
    免费试用
    E

    EDUCBA

    PySpark & Python: Hands-On Guide to Data Processing

    您将获得的技能: PySpark, MySQL, Data Pipelines, Apache Spark, Data Processing, SQL, Data Transformation, Data Manipulation, Distributed Computing, Programming Principles, Python Programming, Debugging

    4.6
    评分, 4.6 星,最高 5 星
    ·
    35 条评论

    混合 · 课程 · 1-4 周

  • 状态:免费试用
    免费试用
    E

    Edureka

    PySpark for Data Science

    您将获得的技能: PySpark, Data Pipelines, Data Processing, Data Visualization, Natural Language Processing, Data Analysis Expressions (DAX), Data Integration, Data Transformation, Machine Learning, Scalability, Data Cleansing, Text Mining, Deep Learning

    2.7
    评分, 2.7 星,最高 5 星
    ·
    11 条评论

    中级 · 专项课程 · 3-6 个月

  • 状态:新
    新
    状态:免费试用
    免费试用
    E

    EDUCBA

    PySpark: Apply & Analyze Advanced Data Processing

    您将获得的技能: PySpark, Apache Spark, Customer Analysis, Big Data, Data Processing, Advanced Analytics, Statistical Modeling, Text Mining, Customer Insights, Data Mining, Data Transformation, Unstructured Data, Predictive Modeling, Simulation and Simulation Software, Data Manipulation, Marketing Analytics, Image Analysis, Risk Analysis

    混合 · 课程 · 1-4 周

  • 状态:免费试用
    免费试用
    G

    Google

    Get Started with Python

    您将获得的技能: Object Oriented Programming (OOP), Data Structures, Python Programming, NumPy, Pandas (Python Package), Data Analysis, Scripting, Data Manipulation, Data Visualization, Algorithms, Debugging

    4.8
    评分, 4.8 星,最高 5 星
    ·
    1750 条评论

    高级设置 · 课程 · 1-3 个月

与 pyspark 相关的搜索

pyspark for data science
pyspark in action: hands-on data processing
pyspark & python: hands-on guide to data processing
pyspark foundations: process, analyze, and summarize data
pyspark: apply & evaluate predictive ml models
pyspark: apply & analyze advanced data processing
spark and python for big data with pyspark
introduction to pyspark
1234…10

总之,以下是 10 最受欢迎的 pyspark 课程

  • 使用 Spark 和 Hadoop 的大数据简介: IBM
  • 用于数据科学、人工智能和开发的 Python: IBM
  • Spark and Python for Big Data with PySpark: EDUCBA
  • Introduction to PySpark: Edureka
  • Data Analysis Using Pyspark: Coursera
  • Mastering Azure Databricks for Data Engineers: Packt
  • NoSQL、大数据和 Spark 基础: IBM
  • Exam Prep DP-700: Microsoft Fabric Data Engineer Associate: Whizlabs
  • PySpark & Python: Hands-On Guide to Data Processing: EDUCBA
  • PySpark for Data Science: Edureka

关于 Pyspark 的常见问题

PySpark 是 Apache Spark 的 Python API,Spark 是一种快速、通用的分布式计算系统。 它允许用户使用 Python 编写 Spark 应用程序,并利用 Spark 的强大功能和可扩展性进行大数据处理和分析。 PySpark 可与其他 Python 库轻松集成,并允许用户跨机器集群并行处理数据。 它广泛应用于数据科学、机器学习和大数据分析等行业。 ‎

要学习 Pyspark,您需要重点掌握以下技能:

  1. Python 编程:Pyspark 是一个 Python 库,因此熟练掌握 Python 编程语言至关重要。 熟悉 Python 语法、数据类型、控制结构和面向对象编程 (OOP) 概念。

  2. Apache Spark:Pyspark 是 Apache Spark 的 Python API,因此了解 Spark 的基础知识至关重要。 了解 Spark 生态系统、分布式计算、集群计算以及 Spark 的核心概念,如 RDD(弹性分布式数据集)和转换/操作。

  3. 数据处理:Pyspark 广泛用于大数据处理和分析,因此掌握数据处理技术至关重要。 了解如何使用 Pyspark 的 DataFrame API 进行数据清理、转换、操作和聚合。

  4. SQLPyspark 提供类似 SQL 的功能,用于查询和分析数据。 熟悉 SQL 概念,如使用 Pyspark 的 SQL 函数查询数据库、连接表格、过滤数据和汇总数据。

  5. 机器学习和数据分析:Pyspark 拥有广泛的机器学习库和工具。 使用 Pyspark 的 MLlib 库学习机器学习算法、特征选择、模型训练、评估和部署。 此外,了解数据可视化、探索性数据分析和统计分析等数据分析技术也是有益的。

  6. 分布式计算:由于 Pyspark 利用分布式计算,了解数据分区、并行处理和容错等概念将有助于您优化和扩展 Spark 应用程序。

虽然这些是学习 Pyspark 所需的核心技能,但不断探索和了解 Pyspark 生态系统的最新发展以提高您对这项技术的熟练程度也是必不可少的。 ‎

掌握了 Pyspark 技能,您就可以在数据分析、大数据处理和机器学习领域从事各种工作。 您可以考虑的职称包括

  1. 数据分析师:利用 Pyspark 分析和解释大型数据集,提出见解并支持数据驱动决策。

  2. 数据工程师:使用 Pyspark 构建数据管道和 ETL 流程,以便高效地转换、清理和处理大数据。

  3. 大数据开发人员:使用 Pyspark 开发和维护可扩展的应用程序和数据平台,以处理海量数据。

  4. 机器学习工程师:应用 Pyspark 实现机器学习算法、创建预测模型并进行大规模部署。

  5. 数据科学家:利用 Pyspark 执行高级分析、开发统计模型并从数据中提取有意义的模式。

  6. 数据顾问:就如何利用 Pyspark 进行数据处理和分析以优化业务运营和战略提供专家指导。

  7. 商业智能分析师:使用 Pyspark 开发交互式仪表盘和报告,使利益相关者能够理解复杂数据并将其可视化。

  8. 云数据工程师:使用 Pyspark 在云基础设施上利用 Apache Spark 等平台构建基于云的数据处理系统。

以上只是几个例子,对 Pyspark 技能的需求还延伸到金融、医疗保健、电子商务和技术等各个行业。 Pyspark 的多功能性使其成为寻求数据驱动型职业的个人的宝贵技能组合。 ‎

对数据分析和数据处理感兴趣的人最适合学习 PySpark。 PySpark 是一个功能强大的开源框架,允许用户使用 Python 编程语言进行大数据处理和分析。 它通常用于金融、医疗保健、零售和技术等需要高效处理大量数据的行业。 因此,对数据科学、数据工程或相关领域有背景或兴趣的人将是学习 PySpark 的理想人选。 此外,扎实的 Python 编程基础有助于理解 Python 语言的语法,并在 PySpark 中充分发挥其功能。 ‎

以下是一些与 PySpark 相关的学习主题:

  1. Apache Spark:首先学习 Apache Spark 的基础知识,这是一个强大的开源大数据处理框架,PySpark 就是在此基础上构建的。 了解其架构、RDD(弹性分布式数据集)和转换。

  2. Python 编程:由于 PySpark 使用 Python 编程语言,因此必须对 Python 基础知识有深入的了解。 学习数据类型、控制流、函数和模块等主题。

  3. 数据处理和分析:使用 PySpark 深入学习数据处理和分析。 学习如何使用 PySpark 的 DataFrame API 加载、转换、过滤、聚合和可视化数据。

  4. Spark SQL:探索 Spark SQL,它是 Apache Spark 中的一个模块,可使用类似 SQL 的查询来处理结构化和半结构化数据。 学习 SQL 操作、数据集连接以及窗口函数和用户自定义函数 (UDF) 等高级功能。

  5. 使用 PySpark 进行机器学习:了解如何使用 PySpark 的 MLlib 库实现机器学习算法。 重点主题包括使用 PySpark 进行分类、回归、聚类、推荐系统和自然语言处理 (NLP)。

  6. 使用 PySpark 进行数据流处理:了解如何使用 PySpark Streaming 进行实时数据处理。 学习 DStreams(离散流)、窗口化操作以及与 Apache Kafka 等其他流媒体系统集成等概念。

  7. 性能优化:学习优化 PySpark 作业性能的技术。 这包括了解 Spark 配置、对数据进行分区和缓存,以及使用适当的转换和操作来尽量减少数据洗牌。

  8. 分布式计算:PySpark 在分布式计算环境中运行,因此掌握数据定位、集群管理、容错和可扩展性等概念至关重要。 学习分布式计算的基本原理及其如何应用于 PySpark。

  9. Spark 数据源:探索 PySpark 可以连接的不同数据源,如 CSV、JSON、Parquet、JDBC 和 Hive。 学习如何读写各种文件格式和数据库中的数据。

  10. 高级 PySpark 概念:深入研究高级 PySpark 主题,如 Spark Streaming、GraphX(图形处理库)、SparkR(Spark 的 R 编程接口)以及在集群上部署 PySpark 应用程序。

请记住,通过参与项目和使用真实数据集进行实验来实践编码,从而巩固您对 PySpark 的理解。 ‎

在线 Pyspark 课程提供了一种方便灵活的方式来提高您的知识或学习新的 PySpark 是 Apache Spark 的 Python API,Spark 是一种快速、通用的分布式计算系统。 它允许用户使用 Python 编写 Spark 应用程序,并利用 Spark 的强大功能和可扩展性进行大数据处理和分析。 PySpark 可与其他 Python 库轻松集成,并允许用户跨机器集群并行处理数据。 它广泛应用于数据科学、机器学习和大数据分析等行业。 技能Pyspark 课程由顶尖大学和行业领导者提供,适合不同技能水平的学员选择。 ‎

选择最佳的 Pyspark 课程取决于员工的需求和技能水平。 利用我们的 "技能仪表板 "了解技能差距,并确定最适合的课程,以便有效地提高员工的技能。 了解关于 Coursera for Business 的更多信息 ‎

此常见问题解答内容仅供参考。建议学生多做研究,确保所追求的课程和其他证书符合他们的个人、专业和财务目标。

其他可浏览的主题

艺术与人文
338 课程
商务
1095 课程
计算机科学
668 课程
数据科学
425 课程
信息技术
145 课程
健康
471 课程
数学与逻辑
70 课程
个人发展
137 课程
物理科学与工程
413 课程
社会科学
401 课程
语言学习
150 课程

Coursera 页脚

技能

  • 人工智能(AI)
  • 网络安全
  • 数据分析
  • 数字化营销
  • 讲英语
  • 生成式人工智能(GenAI)
  • 微软Excel
  • Microsoft Power BI
  • 项目管理
  • Python

证书与课程

  • 谷歌网络安全证书
  • 谷歌数据分析证书
  • 谷歌 IT 支持证书
  • 谷歌项目管理证书
  • 谷歌用户体验设计证书
  • IBM 数据分析师证书
  • IBM Data Science 证书
  • Machine Learning 证书
  • Microsoft Power BI 数据分析师证书
  • UI / UX 设计证书

行业与职业

  • 商务
  • 计算机科学
  • 数据科学
  • 教育与教学
  • 工程学
  • 金融
  • 医疗保健
  • 人力资源(HR)
  • 信息技术 (IT)
  • 营销

职业资源

  • 职业能力倾向测验
  • 工作面试优势和劣势的示例
  • 学习高收入技能
  • 加密货币如何运作?
  • 如何在 Google 表格中突出显示重复项
  • 如何学习人工智能
  • 热门网络安全证书
  • 准备 PMP 认证
  • 面试后您将获得工作的迹象
  • 什么是人工智能?

Coursera

  • 关于
  • 我们提供的内容
  • 管理团队
  • 工作机会
  • 目录
  • Coursera Plus
  • 专业证书
  • MasterTrack® 证书
  • 学位
  • 企业版
  • 政府版
  • 面向校园
  • 成为合作伙伴
  • 社会影响
  • 免费课程
  • 分享您的 Coursera 学习故事

社区

  • 学生
  • 合作伙伴
  • Beta 测试人员
  • 博客
  • Coursera 播客
  • 技术博客

更多

  • 媒体
  • 投资者
  • 条款
  • 隐私
  • 帮助
  • 内容访问
  • 联系我们
  • 文章
  • 目录
  • 附属公司
  • 现代奴隶制声明
  • 请勿出售/共享
随时随地学习
通过 App Store 下载
通过 Google Play 获取
B 型企业认证标志
© 2025 Coursera Inc.保留所有权利。
  • Coursera Facebook
  • Coursera Linkedin
  • Coursera Twitter
  • Coursera YouTube
  • Coursera Instagram
  • Coursera TikTok