Skip to content

Chapitres Lexique À proposLangue

Quantification

Stocker les poids en entiers basse précision (INT8, INT4) plutôt qu’en floats. Réduit taille et coût d’inférence.

Continuer

← Tous les termes Voir les chapitres

Pendant constructif de Step by Token.

v0.1 · stage 6