ai.onnx.ml - DictVectorizer¶

DictVectorizer - 1 (ai.onnx.ml)¶

版本¶

名稱: DictVectorizer (GitHub)
網域: ai.onnx.ml
since_version: 1
function: False
support_level: SupportType.COMMON
shape inference: True

此運算符版本自網域 ai.onnx.ml 的第 1 版起可用。

摘要¶

使用索引對應將字典轉換為陣列。
給定一個字典，每個鍵都會在對應鍵型別的詞彙屬性中查詢。然後，在詞彙陣列中找到鍵的索引，該索引會用於為輸出 1 維張量「Y」建立索引，並將字典「X」中的值插入其中。
輸入映射的鍵型別必須對應於已定義詞彙屬性的元素型別。因此，輸出陣列的長度會等於索引對應向量參數的長度。輸入字典中的所有鍵都必須存在於索引對應向量中。對於輸入字典中的每個項目，將其值插入輸出陣列中。輸出陣列中，任何不存在於輸入字典中的鍵，其值皆為零。
例如：如果將 string_vocabulary 參數設定為 ["a", "c", "b", "z"]，則輸入 {"a": 4, "c": 8} 將會產生 [4, 8, 0, 0] 的輸出。

屬性¶

int64_vocabulary - INTS :

整數詞彙陣列。
必須定義一個且只有一個詞彙。
string_vocabulary - STRINGS :

字串詞彙陣列。
必須定義一個且只有一個詞彙。

輸入¶

X (異質) - T1

字典。

輸出¶

Y (異質) - T2

保存來自輸入字典的值的 1 維張量。

型別約束¶

T1 in ( map(int64, double), map(int64, float), map(int64, string), map(string, double), map(string, float), map(string, int64) )

輸入必須是從字串或整數到字串或數值型別的映射。鍵和值的型別不能相同。
T2 in ( tensor(double), tensor(float), tensor(int64), tensor(string) )

輸出將會是輸入映射的值型別的張量。其形狀將為 [1,C]，其中 C 是輸入字典的長度。