Geringere Latenz, höherer Durchsatz
Bessere Leistung kann dazu beitragen, die Benutzererfahrung zu verbessern und Ihre Betriebskosten zu senken. Eine breite Palette von Modellen, von Computer Vision (ResNet, MobileNet, Inception, YOLO, Super Resolution usw.) bis hin zu Speech und NLP (BERT, RoBERTa, GPT-2, T5 usw.), kann von der optimierten Leistung von ONNX Runtime profitieren. Das ONNX Runtime-Team benchmarkt und optimiert regelmäßig Top-Modelle auf Leistung. ONNX Runtime integriert sich auch in führende Hardware-Beschleuniger-Bibliotheken wie TensorRT und OpenVINO, sodass Sie die beste Leistung auf der verfügbaren Hardware erzielen können, während Sie dieselben gemeinsamen APIs auf allen Ihren Zielplattformen verwenden.