可變形卷積¶

可變形卷積 - 22¶

此版本的運算子自版本 22 起可用。

執行可變形卷積，如 https://arxiv.org/abs/1703.06211 和 https://arxiv.org/abs/1811.11168 中所述。此運算子規格支援一般 N 維案例。請注意，最常見的使用案例是 2D 或 3D 資料。

膨脹 - INTS :

沿著核心每個空間軸的膨脹值。預設值為沿著每個軸 1。
群組 - INT (預設值為 '1')

將輸入和輸出通道 C 和 oC 分成的群組數。C 和 oC 都必須可被群組整除。預設值為 1。
kernel_shape - INTS :

卷積核心的形狀。如果不存在，則從輸入 W 的形狀推斷。
offset_group - INT (預設值為 '1')

偏移量的群組數。C 必須可被 offset_group 整除。預設值為 1。
pads - INTS :

沿著每個空間軸的開始和結尾的填補。這些值表示新增至對應軸的開始和結尾的像素數，且可採用任何非負值。格式應如下所示：[x1_begin, x2_begin, …, x1_end, x2_end, …]，其中 xi_begin 是新增至軸 i 的開始處的像素數，而 xi_end 是新增至軸 i 的結尾處的像素數。預設值為沿著每個軸 0。
strides - INTS :

沿著每個空間軸的步幅。預設值為沿著每個軸 1。

介於 3 到 5 個輸入之間。

X (異質) - T

輸入資料張量。對於 2D 影像資料，其形狀為 (N, C, H, W)，其中 N 是批次大小，C 是輸入通道數，而 H 和 W 是高度和寬度。一般而言，對於 n 維資料，其形狀為 (N, C, D1, D2, … , Dn)，其中 D1 到 Dn 是空間維度大小。最常見的使用案例為 n = 2 或 3。
W (異質) - T

將用於卷積的權重張量。其形狀為 (oC, C/群組, kH, kW)，其中 oC 是輸出通道數，而 kH 和 kW 是核心高度和寬度。對於超過 2 個維度，其形狀為 (oC, C/群組, k1, k2, … , kn)。
偏移量 (異質) - T

表示卷積核心中取樣位置偏移量的偏移量張量。對於 2D 資料，其形狀為 (N, offset_group * kH * kW * 2, oH, oW)，對於 nD 資料，其形狀為 (N, offset_group * k1 * k2 * … * kn * n, o1, o2, … , on)。針對分數偏移值使用線性內插。在填補的輸入張量之外的取樣位置提供零。
B (選用，異質) - T

要新增至卷積的長度為 oC 的選用 1D 偏差。預設值為零張量。
遮罩 (選用，異質) - T

要套用至卷積核心中每個位置的遮罩張量。對於 2D 資料，其形狀為 (N, offset_group * kH * kW, oH, oW)，對於 nD 資料，其形狀為 (N, offset_group * k1 * k2 * … * kn * n, o1, o2, … , on)。預設值為 1 張量。

Y (異質) - T

包含卷積結果的輸出資料張量。對於 2D 資料，其形狀為 (N, oC, oH, oW)，對於 nD 資料，其形狀為 (N, oC, o1, o2, …, on)

T 在 ( tensor(bfloat16), tensor(double), tensor(float), tensor(float16) )

將輸入和輸出類型限制為浮點張量。

此版本的運算子自版本 19 起可用。

膨脹 - INTS :

沿著核心每個空間軸的膨脹值。預設值為沿著每個軸 1。
群組 - INT (預設值為 '1')

將輸入和輸出通道 C 和 oC 分成的群組數。C 和 oC 都必須可被群組整除。預設值為 1。
kernel_shape - INTS :

卷積核心的形狀。如果不存在，則從輸入 W 的形狀推斷。
offset_group - INT (預設值為 '1')

偏移量的群組數。C 必須可被 offset_group 整除。預設值為 1。
pads - INTS :

沿著每個空間軸的開始和結尾的填補。這些值表示新增至對應軸的開始和結尾的像素數，且可採用任何非負值。格式應如下所示：[x1_begin, x2_begin, …, x1_end, x2_end, …]，其中 xi_begin 是新增至軸 i 的開始處的像素數，而 xi_end 是新增至軸 i 的結尾處的像素數。預設值為沿著每個軸 0。
strides - INTS :

沿著每個空間軸的步幅。預設值為沿著每個軸 1。

介於 3 到 5 個輸入之間。

X (異質) - T

輸入資料張量。對於 2D 影像資料，其形狀為 (N, C, H, W)，其中 N 是批次大小，C 是輸入通道數，而 H 和 W 是高度和寬度。一般而言，對於 n 維資料，其形狀為 (N, C, D1, D2, … , Dn)，其中 D1 到 Dn 是空間維度大小。最常見的使用案例為 n = 2 或 3。
W (異質) - T

將用於卷積的權重張量。其形狀為 (oC, C/群組, kH, kW)，其中 oC 是輸出通道數，而 kH 和 kW 是核心高度和寬度。對於超過 2 個維度，其形狀為 (oC, C/群組, k1, k2, … , kn)。
偏移量 (異質) - T

表示卷積核心中取樣位置偏移量的偏移量張量。對於 2D 資料，其形狀為 (N, offset_group * kH * kW * 2, oH, oW)，對於 nD 資料，其形狀為 (N, offset_group * k1 * k2 * … * kn * n, o1, o2, … , on)。針對分數偏移值使用線性內插。在填補的輸入張量之外的取樣位置提供零。
B (選用，異質) - T

要新增至卷積的長度為 oC 的選用 1D 偏差。預設值為零張量。
遮罩 (選用，異質) - T

要套用至卷積核心中每個位置的遮罩張量。對於 2D 資料，其形狀為 (N, offset_group * kH * kW, oH, oW)，對於 nD 資料，其形狀為 (N, offset_group * k1 * k2 * … * kn * n, o1, o2, … , on)。預設值為 1 張量。

Y (異質) - T

包含卷積結果的輸出資料張量。對於 2D 資料，其形狀為 (N, oC, oH, oW)，對於 nD 資料，其形狀為 (N, oC, o1, o2, …, on)