Hugging Face Modelle beschleunigen
ONNX Runtime kann das Training und die Inferenz gängiger Hugging Face NLP-Modelle beschleunigen.
Hugging Face Modelle Inferenz beschleunigen
- Allgemeiner Export und Inferenz: Hugging Face Transformers
- GPT2 Modell auf CPU beschleunigen
- BERT Modell auf CPU beschleunigen
- BERT Modell auf GPU beschleunigen