Synthèse - Module 1

Fondamentaux du Deep Learning

🏗️ Utilisation de réseaux de neurones multicouches
Modèles composés de plusieurs couches de neurones artificiels permettant de traiter des données complexes
🤖 Apprentissage automatique des caractéristiques
Contrairement au ML classique, le DL identifie lui-même les caractéristiques importantes
📊 Idéal pour le traitement d'images, de texte et de son
Excelle dans les domaines où les données ont une structure interne riche (spatiale, temporelle)
⚡ Plus puissant que le Machine Learning classique
Capable de résoudre des problèmes plus complexes et de capturer des motifs subtils

🔌 Neurones artificiels interconnectés
Unités de calcul qui reçoivent des entrées, les transforment et produisent des sorties
📥 Couche d'entrée (input)
Reçoit les données brutes (ex: pixels d'une image, valeurs numériques)
🧩 Couches cachées (hidden)
Extraient progressivement des caractéristiques de plus en plus abstraites et complexes
📤 Couche de sortie (output)
Produit la prédiction finale (classe, valeur, probabilités)

👁️ CNN pour le traitement d'images
Réseaux convolutifs exploitant la structure spatiale des images
📝 RNN/LSTM pour le traitement de texte
Réseaux récurrents capables de traiter des séquences et de mémoriser le contexte
🔊 Transformers pour le langage naturel
Architecture basée sur l'attention, très performante pour comprendre le langage
🎨 GAN pour la génération de contenu
Réseaux adversaires génératifs créant de nouvelles données réalistes

➡️ Forward propagation
Transmission des données à travers le réseau, de l'entrée vers la sortie
⚖️ Calcul de l'erreur (loss)
Mesure de l'écart entre la prédiction et la valeur attendue
⬅️ Backpropagation
Propagation de l'erreur en arrière pour ajuster les poids du réseau
🔄 Itérations d'entraînement (époques)
Passages répétés sur l'ensemble des données pour affiner le modèle

Machine Learning classique	Deep Learning
🔧 Extraction manuelle des caractéristiques	🔍 Extraction automatique des caractéristiques
📉 Plus simple à interpréter	📈 Plus performant sur des données complexes
🚀 Plus rapide à entraîner	🧠 Capture mieux les relations non-linéaires
📊 Efficace avec peu de données	📚 Nécessite généralement plus de données
💻 Moins exigeant en ressources	🖥️ Requiert souvent des GPU/TPU

📊 Nécessité de grandes quantités de données
La performance dépend souvent de vastes ensembles d'entraînement
⚡ Consommation énergétique élevée
L'entraînement de grands modèles demande beaucoup de ressources
❓ Manque d'explicabilité (boîte noire)
Difficulté à interpréter le processus de décision interne
⚖️ Risques de biais dans les modèles
Reproduction et amplification des biais présents dans les données
💰 Coûts élevés d'entraînement
Ressources computationnelles et humaines importantes

🔄 Commencer par des modèles simples et itérer
Éviter de complexifier inutilement avant d'avoir un modèle de base fonctionnel
🧹 Préparer minutieusement les données
La qualité des données est souvent plus déterminante que l'architecture
📈 Surveiller les performances avec des métriques appropriées
Choisir des indicateurs pertinents par rapport au problème traité
🧪 Tester les modèles sur des jeux de données variés
Évaluer la robustesse et la capacité de généralisation