Jeu de validation
Portion des données que le modèle ne voit jamais pendant l’entraînement. Sert à estimer la perplexité (ou tout autre score) sur des données qu’il n’a pas pu mémoriser.
Un split typique : 80 % entraînement / 10 % validation / 10 % test. La validation guide les décisions pendant le développement (quels hyperparamètres ? quand arrêter ?) ; le test n’est touché qu’une fois à la fin pour reporter un chiffre final.
Continuer