中繼資料

除了擴充性文件中列出的核心中繼資料建議外,還有額外的實驗性中繼資料,有助於提供模型輸入和輸出的相關資訊。

此中繼資料適用於指定類別的所有輸入和輸出張量。 我們定義的第一個此類別為:影像

動機

此機制動機在於讓模型作者可以向模型消費者傳達足夠的資訊,讓他們能夠使用模型。

就影像而言,提供有效影像資料的方法有很多。 但是,使用影像的模型是使用一組特定的選項進行訓練的,這些選項必須在推論期間使用。

此提案的目標是提供足夠的中繼資料,讓模型消費者可以在執行模型之前執行自己的特徵化,並提供相容的輸入或擷取輸出並知道其格式。

影像類別定義

對於此模型中每個使用類型符號將自身宣告為 IMAGE 的張量,您應該提供中繼資料以協助模型消費者。 請注意,使用此機制提供的任何中繼資料對於所有具有隨附符號的類型都是全域的。

鍵和值不區分大小寫。

具體來說,我們在此定義以下影像中繼資料集

描述

Image.BitmapPixelFormat

字串

指定像素資料的格式。每個列舉值定義通道順序和位元深度。可能的值

  • Gray8:1 通道影像,像素資料為 8 bpp 灰階。
  • Rgb8:3 通道影像,通道順序為 RGB,像素資料為 8bpp(無 Alpha)
  • Bgr8:3 通道影像,通道順序為 BGR,像素資料為 8bpp(無 Alpha)
  • Rgba8:4 通道影像,通道順序為 RGBA,像素資料為 8bpp(直接 Alpha)
  • Bgra8:4 通道影像,通道順序為 BGRA,像素資料為 8bpp(直接 Alpha)

Image.ColorSpaceGamma

字串

指定所使用的伽瑪色彩空間。可能的值

  • 線性:線性色彩空間,伽瑪 == 1.0
  • SRGB:sRGB 色彩空間,伽瑪 == 2.2

Image.NominalPixelRange

字串

指定儲存像素值的範圍。可能的值

  • NominalRange_0_255:8bpp 樣本的 [0…255]
  • Normalized_0_1:[0…1] 像素資料以正規化方式儲存
  • Normalized_1_1:[-1…1] 像素資料以正規化方式儲存
  • NominalRange_16_235:8bpp 樣本的 [16…235]