ONNX Runtime Release Roadmap
ONNX Runtime wird vierteljährlich veröffentlicht. Patch-Releases werden bei Bedarf zwischen den Hauptversionen veröffentlicht.
Ankündigungen
- onnxruntime-gpu v1.10.0 wird von PyPI entfernt. Wir haben unser PyPI-Projektgrößenlimit für onnxruntime-gpu erreicht, daher werden wir unsere älteste Paketversion entfernen, um den benötigten Speicherplatz freizugeben.
- ONNX Runtime v1.20.0 ist jetzt offiziell veröffentlicht. Versionshinweise, Assets und mehr finden Sie auf unserer GitHub Releases-Seite.
Versionsaktualisierungen
Wir planen, die ONNX Runtime-Unterstützung für Folgendes zu aktualisieren (wobei der erste Wert die höchste zuvor unterstützte Version und der zweite Wert die in ORT 1.20.1 hinzugefügte Unterstützung ist)
- QNN SDK 2.27 --> 2.28
- DirectML 1.15.2 --> 1.16
- Die Unterstützung von ONNX 1.17 wird in einer zukünftigen Version enthalten sein.
Wichtige Aktualisierungen
Zusätzlich zu verschiedenen Fehlerbehebungen und Leistungsverbesserungen wird ORT 1.20.1 die folgenden Updates enthalten:
- CPU FP16-Implementierungsfixes für die folgenden Kernel: LayerNormalization, SimplifiedLayerNormalization, SkipLayerNormalization, SkipSimplifiedLayerNormalization.
- Aktualisierungen des Python-Quantifizierungstools.
- Unterstützung für neue QNN SDK-Version.
Funktionsanfragen
Um neue ONNX Runtime-Funktionen für zukünftige Versionen anzufordern, reichen Sie bitte eine Funktionsanfrage über GitHub Issues oder über GitHub Discussions ein.
Um sicherzustellen, dass Ihre Anfrage so schnell wie möglich bearbeitet wird, bitte:
- Fügen Sie einen detaillierten Titel hinzu.
- Geben Sie so viele Details wie möglich im Textkörper Ihrer Anfrage an (z. B. Anwendungsfall für die Funktion, die Plattform(en) oder EP(s), für die diese Funktion benötigt wird usw.).
- Wenden Sie ein Label an, das dem entsprechenden ONNX Runtime-Bereich entspricht (z. B. "platform:mobile", "platform:web", "ep:CUDA" usw.), wenn Sie es kennen.
Hinweis: Alle auf dieser Seite aufgeführten Zeitpläne und Funktionen können sich ändern.
ONNX Runtime 1.20.1
Vorläufiges Veröffentlichungsdatum 11/20/2024
- onnxruntime-gpu v1.10.0 wird von PyPI entfernt. Wir haben unser PyPI-Projektgrößenlimit für onnxruntime-gpu erreicht, daher werden wir unsere älteste Paketversion entfernen, um den benötigten Speicherplatz freizugeben.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.
- Einführung der Hilfsfunktion get_int_qdq_config() zum Abrufen von QDQ-Konfigurationen (#22677).
- Update QDQ Pad, Slice, Softmax (#22676).
- Behandlung von Eingangsmodellen mit vorquantisierten Gewichten (#22633).
- Verhindert Clipping von int32 quantisierten Bias durch Anpassung der Skala des Gewichts (#22020).
CPU
- Behebt CPU FP16-Implementierungen für die folgenden Kernel: LayerNormalization, SimplifiedLayerNormalization, SkipLayerNormalization, SkipSimplifiedLayerNormalization.
QNN
- Unterstützung für QNN SDK 2.28.x.
DirectML
- DirectML 1.16-Unterstützung.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.
Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.