FP8 support on NPU #462

n1harika · 2024-10-01T05:18:53Z

Tested on PTL and LNL.
Added data types: FLOAT8E4M3FN and FLOAT8E4M3FNUZ.

preetha-intel · 2024-10-01T05:44:23Z

onnxruntime/core/providers/openvino/ov_versions/data_ops.cc

@@ -281,6 +281,10 @@ void DataOps::populate_types_supported() {
      std::make_pair(V_2020_4, ONNX_NAMESPACE::TensorProto_DataType::TensorProto_DataType_INT64));
  supported_types_npu_.insert(
      std::make_pair(V_2021_1, ONNX_NAMESPACE::TensorProto_DataType::TensorProto_DataType_FLOAT16));
+  supported_types_npu_.insert(
+      std::make_pair(V_2023_0, ONNX_NAMESPACE::TensorProto_DataType::TensorProto_DataType_FLOAT8E4M3FN));


Change the version from V_2023_0 to V_2024_3 as its enabled only in latest OV.

n1harika · 2024-10-01T05:53:09Z

I have changed the version

preetha-intel · 2024-10-01T12:54:56Z

LGTM

adding fp8 support on NPU

54be3be

preetha-intel reviewed Oct 1, 2024

View reviewed changes

changed OV Version to 2024_3

1afd8db

preetha-intel merged commit 4db9fb0 into ovep-develop-lnl-1.2 Oct 1, 2024
12 of 16 checks passed

preetha-intel deleted the niharika/fp8 branch October 1, 2024 12:55

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FP8 support on NPU #462

FP8 support on NPU #462

n1harika commented Oct 1, 2024

preetha-intel Oct 1, 2024

n1harika commented Oct 1, 2024

preetha-intel commented Oct 1, 2024

FP8 support on NPU #462

FP8 support on NPU #462

Conversation

n1harika commented Oct 1, 2024

preetha-intel Oct 1, 2024

Choose a reason for hiding this comment

n1harika commented Oct 1, 2024

preetha-intel commented Oct 1, 2024