le cours "Apprentissage statistique pour la science des données" est un cours avancé conçu pour doter les professionnels des connaissances et des compétences nécessaires pour exceller dans le domaine de la science des données. Grâce à un enseignement complet sur des sujets clés tels que les méthodes de réduction, l'analyse de régression paramétrique, les modèles linéaires généralisés et les modèles additifs généraux, les étudiants apprendront comment appliquer les méthodes de rééchantillonnage pour obtenir des informations supplémentaires sur les modèles ajustés, optimiser les procédures d'ajustement pour améliorer la précision et l'interprétabilité des prédictions, et identifier les avantages et l'approche des modèles non linéaires. Ce cours est le choix parfait pour toute personne cherchant à se perfectionner ou à faire la transition vers une carrière en science des données. Ce cours peut être suivi pour des crédits académiques dans le cadre du Master of Science in Data Science (MS-DS) de CU Boulder offert sur la plate-forme Coursera. Le MS-DS est un diplôme interdisciplinaire qui réunit des professeurs des départements de mathématiques appliquées, d'informatique, de sciences de l'information et d'autres départements du CU Boulder. Avec des admissions basées sur la performance et aucun processus de candidature, le MS-DS est idéal pour les personnes ayant un large éventail d'études de premier cycle et / ou d'expérience professionnelle en informatique, en sciences de l'information, en mathématiques et en statistiques. Pour en savoir plus sur le programme MS-DS, consultez le site https://hua.dididi.sbs/degrees/master-of-science-data-science-boulder.


Rééchantillonnage, sélection et splines
Ce cours fait partie de Spécialisation Apprentissage statistique pour la science des données

Instructeur : Osita Onyejekwe
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Appliquer des méthodes de rééchantillonnage afin d'obtenir des informations supplémentaires sur les modèles ajustés.
Optimiser les procédures d'ajustement afin d'améliorer la précision des prévisions et l'interprétabilité.
Identifier les avantages et l'approche des modèles non linéaires.
Compétences que vous acquerrez
- Catégorie : Mathématiques appliquées
- Catégorie : Analyse statistique
- Catégorie : Méthodes statistiques
- Catégorie : Évaluation de modèles
- Catégorie : Modélisation statistique
- Catégorie : Statistiques
- Catégorie : Régression logistique
- Catégorie : Analyse de régression
- Catégorie : Apprentissage statistique des machines
- Catégorie : Science des données
- Catégorie : Réduction de dimensionnalité
- Catégorie : La programmation en R
Détails à connaître

Ajouter à votre profil LinkedIn
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 5 modules dans ce cours
Bienvenue dans notre cours sur le rééchantillonnage, la sélection et les splines ! Dans ce cours, nous allons plonger profondément dans ces sujets clés de l'apprentissage statistique et explorer comment ils peuvent être appliqués à la science des données. Le module fournit une vue d'ensemble du cours et présente l'instructeur du cours.
Inclus
6 vidéos2 lectures1 sujet de discussion
Dans ce module, nous nous intéresserons aux moindres carrés généralisés (MCO). Les MCO sont une méthode statistique qui étend la méthode des moindres carrés ordinaires (MCO) pour tenir compte de l'hétéroscédasticité et de la corrélation sérielle dans les termes d'erreur. L'hétéroscédasticité est la condition dans laquelle la variance des erreurs n'est pas constante pour tous les niveaux des variables prédictives, tandis que la corrélation sérielle est la condition dans laquelle les erreurs sont corrélées dans le temps ou l'espace. Les GLS ont de nombreuses applications pratiques, notamment en finance pour la modélisation des rendements des actifs, en économétrie pour la modélisation des données de séries chronologiques, et en analyse spatiale pour la modélisation des données corrélées dans l'espace. A la fin de ce module, vous aurez une bonne compréhension du fonctionnement des GLS et des cas où il est approprié de les utiliser. Vous serez également en mesure d'implémenter les GLS dans R à l'aide de la fonction gls() du package nlme.
Inclus
1 vidéo1 lecture1 devoir de programmation1 laboratoire non noté
Dans ce module, nous allons explorer la régression ridge, LASSO, et l'analyse composantes principales (ACP). Ces techniques sont largement utilisées pour les tâches de régression et de réduction de dimensionnalité dans l'apprentissage automatique et les statistiques.
Inclus
7 vidéos3 lectures3 devoirs de programmation
Cette semaine, nous allons explorer le concept de validation croisée, une technique cruciale utilisée pour évaluer et comparer les performances de différents modèles d'apprentissage statistique. Nous explorerons différents types de techniques de validation croisée, notamment la validation croisée k-fold, la validation croisée leave-one-out et la validation croisée stratifiée. Nous discuterons de leurs forces, de leurs faiblesses et des meilleures pratiques à mettre en œuvre. En outre, nous examinerons comment la validation croisée peut être utilisée pour la sélection de modèles et le réglage des hyperparamètres.
Inclus
1 vidéo1 lecture1 devoir de programmation
Pour notre dernier module, nous allons explorer le bootstrap. Le bootstrap est une technique de rééchantillonnage qui nous permet de mieux comprendre la variabilité des estimateurs statistiques et de quantifier l'incertitude dans nos modèles. En créant plusieurs ensembles de données simulées par rééchantillonnage, nous pouvons explorer la distribution des statistiques de l'échantillon, construire des intervalles de confiance et effectuer des tests d'hypothèse. Le Bootstrap est particulièrement utile lorsque les hypothèses paramétriques sont difficiles à respecter ou lorsque nous disposons de données limitées. À la fin de cette semaine, vous aurez compris ce qu'est le bootstrap et ses applications pratiques dans le domaine de l'apprentissage statistique.
Inclus
1 vidéo1 lecture1 devoir de programmation
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par University of Colorado Boulder. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
Instructeur

Offert par
En savoir plus sur Probabilités et Statistiques
Statut : Essai gratuitUniversity of Colorado Boulder
Statut : PrévisualisationMicrosoft
Statut : Essai gratuitUniversity of Colorado Boulder
Statut : Essai gratuitUniversity of Colorado Boulder
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,

