La meilleure façon d’apprendre le Machine Learning en Python est de concevoir et de réaliser de petits projets.
Python peut être intimidant lors du démarrage :
Python est un langage interprété populaire et puissant. Contrairement à R, Python est un langage et une plateforme complets que vous pouvez utiliser à la fois pour la recherche et le développement et le développement de systèmes de production.
Il existe également de nombreux modules et bibliothèques parmi lesquels vous pouvez choisir, offrant plusieurs façons d’effectuer chaque tâche, cela peut sembler écrasant.
La meilleure façon de commencer à utiliser Python pour l’apprentissage automatique est de terminer un projet.
Cela vous obligera à installer et à démarrer l’interpréteur Python (au moins).
Il vous donnera une vue plongeante sur la façon de parcourir un petit projet.
Cela vous donnera confiance, peut-être pour poursuivre vos propres petits projets.
Les débutants ont besoin d’un petit projet de bout en bout :
Les livres et les cours sont frustrants. Ils vous donnent beaucoup de recettes et d’extraits, mais vous ne voyez jamais comment ils s’imbriquent tous ensemble.
Lorsque vous appliquez l’apprentissage automatique à vos propres ensembles de données, vous travaillez sur un projet.
Un projet d’apprentissage automatique n’est peut-être pas linéaire, mais il comporte un certain nombre d’étapes bien connues :
- Définissez le problème.
- Préparez les données.
- Évaluer les algorithmes.
- Améliorez les résultats.
- Résultats actuels.
La meilleure façon de vraiment accepter une nouvelle plate-forme ou un nouvel outil est de parcourir un projet d’apprentissage automatique de bout en bout et de couvrir les étapes clés. À savoir, de charger des données, de résumer des données, d’évaluer des algorithmes et de faire des prédictions.
Si vous pouvez le faire, vous disposez d’un modèle que vous pouvez utiliser sur l’ensemble de données après l’ensemble de données. Vous pouvez combler les lacunes telles que la préparation des données et l’amélioration des tâches de résultat plus tard, une fois que vous aurez plus confiance.
« Hello World » du Machine Learning en Python :
Le meilleur petit projet pour commencer avec un nouvel outil est la classification des fleurs d’iris (par exemple l’ensemble de données iris).
C’est un bon projet car il est si bien compris.
Les attributs sont numériques, vous devez donc comprendre comment charger et gérer les données.
C’est un problème de classification, vous permettant de pratiquer avec peut-être un type d’algorithme d’apprentissage supervisé plus facile.
Il s’agit d’un problème de classification multi-classes (multi-nominal) qui peut nécessiter une gestion spécialisée.
Il n’a que 4 attributs et 150 lignes, ce qui signifie qu’il est petit et tient facilement en mémoire (et en un écran ou une page A4).
Tous les attributs numériques sont dans les mêmes unités et la même échelle, ne nécessitant aucune mise à l’échelle ou transformation spéciale pour commencer.
Prenez votre temps. Suivez chaque étape. Essayez de taper les commandes vous-même ou de copier-coller les commandes pour accélérer les choses.