ONNX Runtime | Roadmap

ONNX Runtime wird vierteljährlich veröffentlicht. Patch-Releases werden bei Bedarf zwischen den Hauptversionen veröffentlicht.

Vorherige Veröffentlichung

1.20.0

Datum der Veröffentlichung: 11/1/2024

In Bearbeitung befindliche Veröffentlichung

1.20.1

Datum der Veröffentlichung: 11/20/2024

Nächste Veröffentlichung

1.21

Datum der Veröffentlichung: Feb. 2025

Ankündigungen

Versionsaktualisierungen

Wir planen, die ONNX Runtime-Unterstützung für Folgendes zu aktualisieren (wobei der erste Wert die höchste zuvor unterstützte Version und der zweite Wert die in ORT 1.20.1 hinzugefügte Unterstützung ist)

Wichtige Aktualisierungen

Zusätzlich zu verschiedenen Fehlerbehebungen und Leistungsverbesserungen wird ORT 1.20.1 die folgenden Updates enthalten:

Funktionsanfragen

Um neue ONNX Runtime-Funktionen für zukünftige Versionen anzufordern, reichen Sie bitte eine Funktionsanfrage über GitHub Issues oder über GitHub Discussions ein.

Um sicherzustellen, dass Ihre Anfrage so schnell wie möglich bearbeitet wird, bitte:

Hinweis: Alle auf dieser Seite aufgeführten Zeitpläne und Funktionen können sich ändern.

ONNX Runtime 1.20.1

Ankündigungen

onnxruntime-gpu v1.10.0 wird von PyPI entfernt. Wir haben unser PyPI-Projektgrößenlimit für onnxruntime-gpu erreicht, daher werden wir unsere älteste Paketversion entfernen, um den benötigten Speicherplatz freizugeben.

Build-System & Pakete

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Kern

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Leistung

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Quantisierung

Einführung der Hilfsfunktion get_int_qdq_config() zum Abrufen von QDQ-Konfigurationen (#22677).
Update QDQ Pad, Slice, Softmax (#22676).
Behandlung von Eingangsmodellen mit vorquantisierten Gewichten (#22633).
Verhindert Clipping von int32 quantisierten Bias durch Anpassung der Skala des Gewichts (#22020).

EPs

CPU

Behebt CPU FP16-Implementierungen für die folgenden Kernel: LayerNormalization, SimplifiedLayerNormalization, SkipLayerNormalization, SkipSimplifiedLayerNormalization.

QNN

Unterstützung für QNN SDK 2.28.x.

DirectML

DirectML 1.16-Unterstützung.

Mobile

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Web

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

generate()-API

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Erweiterungen

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

Olive

Für 1.20.1 sind keine Funktionen geplant. Bleiben Sie dran für Features für 1.21.

ONNX Runtime Release Roadmap

Ankündigungen

Versionsaktualisierungen

Wichtige Aktualisierungen

Funktionsanfragen

ONNX Runtime 1.20.1

CPU

QNN

DirectML