← LexiqueGELUApproximation lisse de ReLU utilisée dans les transformers. En gros x·Φ(x), où Φ est la CDF gaussienne.Continuer← Tous les termesVoir les chapitres