ONNX Runtime Release Roadmap

ONNX Runtime wird vierteljährlich veröffentlicht. Patch-Releases werden bei Bedarf zwischen den Hauptversionen veröffentlicht.

Vorherige Veröffentlichung
1.20.0
Datum der Veröffentlichung: 11/1/2024
In Bearbeitung befindliche Veröffentlichung
1.20.1
Datum der Veröffentlichung: 11/20/2024
Nächste Veröffentlichung
1.21
Datum der Veröffentlichung: Feb. 2025

Ankündigungen

  • onnxruntime-gpu v1.10.0 wird von PyPI entfernt. Wir haben unser PyPI-Projektgrößenlimit für onnxruntime-gpu erreicht, daher werden wir unsere älteste Paketversion entfernen, um den benötigten Speicherplatz freizugeben.
  • ONNX Runtime v1.20.0 ist jetzt offiziell veröffentlicht. Versionshinweise, Assets und mehr finden Sie auf unserer GitHub Releases-Seite.

Versionsaktualisierungen

Wir planen, die ONNX Runtime-Unterstützung für Folgendes zu aktualisieren (wobei der erste Wert die höchste zuvor unterstützte Version und der zweite Wert die in ORT 1.20.1 hinzugefügte Unterstützung ist)

  • QNN SDK 2.27 --> 2.28
  • DirectML 1.15.2 --> 1.16
  • Die Unterstützung von ONNX 1.17 wird in einer zukünftigen Version enthalten sein.

Wichtige Aktualisierungen

Zusätzlich zu verschiedenen Fehlerbehebungen und Leistungsverbesserungen wird ORT 1.20.1 die folgenden Updates enthalten:

  • CPU FP16-Implementierungsfixes für die folgenden Kernel: LayerNormalization, SimplifiedLayerNormalization, SkipLayerNormalization, SkipSimplifiedLayerNormalization.
  • Aktualisierungen des Python-Quantifizierungstools.
  • Unterstützung für neue QNN SDK-Version.

Funktionsanfragen

Um neue ONNX Runtime-Funktionen für zukünftige Versionen anzufordern, reichen Sie bitte eine Funktionsanfrage über GitHub Issues oder über GitHub Discussions ein.

Um sicherzustellen, dass Ihre Anfrage so schnell wie möglich bearbeitet wird, bitte:

  • Fügen Sie einen detaillierten Titel hinzu.
  • Geben Sie so viele Details wie möglich im Textkörper Ihrer Anfrage an (z. B. Anwendungsfall für die Funktion, die Plattform(en) oder EP(s), für die diese Funktion benötigt wird usw.).
  • Wenden Sie ein Label an, das dem entsprechenden ONNX Runtime-Bereich entspricht (z. B. "platform:mobile", "platform:web", "ep:CUDA" usw.), wenn Sie es kennen.

Hinweis: Alle auf dieser Seite aufgeführten Zeitpläne und Funktionen können sich ändern.

ONNX Runtime 1.20.1

Vorläufiges Veröffentlichungsdatum 11/20/2024

Ankündigungen
  • onnxruntime-gpu v1.10.0 wird von PyPI entfernt. Wir haben unser PyPI-Projektgrößenlimit für onnxruntime-gpu erreicht, daher werden wir unsere älteste Paketversion entfernen, um den benötigten Speicherplatz freizugeben.
Build-System & Pakete

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Kern

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Leistung

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Quantisierung
  • Einführung der Hilfsfunktion get_int_qdq_config() zum Abrufen von QDQ-Konfigurationen (#22677).
  • Update QDQ Pad, Slice, Softmax (#22676).
  • Behandlung von Eingangsmodellen mit vorquantisierten Gewichten (#22633).
  • Verhindert Clipping von int32 quantisierten Bias durch Anpassung der Skala des Gewichts (#22020).
EPs

CPU

  • Behebt CPU FP16-Implementierungen für die folgenden Kernel: LayerNormalization, SimplifiedLayerNormalization, SkipLayerNormalization, SkipSimplifiedLayerNormalization.

QNN

  • Unterstützung für QNN SDK 2.28.x.

DirectML

  • DirectML 1.16-Unterstützung.
Mobile

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Web

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

generate()-API

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Erweiterungen

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Olive

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.