Beschleunigen Sie die Inferenz von TensorFlow-Modellen
ONNX Runtime kann die Inferenzzeiten für TensorFlow-, TFLite- und Keras-Modelle beschleunigen.
Erste Schritte
Modell nach ONNX exportieren
TensorFlow/Keras
Diese Beispiele verwenden den TensorFlow-ONNX-Konverter, der die Modellformate TensorFlow 1, 2, Keras und TFLite unterstützt.
- TensorFlow: Objekterkennung (efficentdet)
- TensorFlow: Objekterkennung (SSD Mobilenet)
- TensorFlow: Bildklassifizierung (efficientnet-edge)
- TensorFlow: Bildklassifizierung (efficientnet-lite)
- TensorFlow: Natural Language Processing (BERT)
- TensorFlow: Beschleunigen Sie das BERT-Modell
- Keras: Bildklassifizierung (Resnet 50)