Skip to content
The loss curve

Sous-mot

Un token plus court qu’un mot mais plus long qu’un caractère. C’est la granularité vers laquelle BPE converge.