ai.onnx.ml - DictVectorizer¶
DictVectorizer - 1 (ai.onnx.ml)¶
版本¶
網域:
ai.onnx.ml
since_version:
1
function:
False
support_level:
SupportType.COMMON
shape inference:
True
此運算符版本自網域 ai.onnx.ml 的第 1 版起可用。
摘要¶
使用索引對應將字典轉換為陣列。
給定一個字典,每個鍵都會在對應鍵型別的詞彙屬性中查詢。然後,在詞彙陣列中找到鍵的索引,該索引會用於為輸出 1 維張量「Y」建立索引,並將字典「X」中的值插入其中。
輸入映射的鍵型別必須對應於已定義詞彙屬性的元素型別。因此,輸出陣列的長度會等於索引對應向量參數的長度。輸入字典中的所有鍵都必須存在於索引對應向量中。對於輸入字典中的每個項目,將其值插入輸出陣列中。輸出陣列中,任何不存在於輸入字典中的鍵,其值皆為零。
例如:如果將 string_vocabulary
參數設定為 ["a", "c", "b", "z"]
,則輸入 {"a": 4, "c": 8}
將會產生 [4, 8, 0, 0]
的輸出。
屬性¶
int64_vocabulary - INTS :
整數詞彙陣列。
必須定義一個且只有一個詞彙。string_vocabulary - STRINGS :
字串詞彙陣列。
必須定義一個且只有一個詞彙。
輸入¶
X (異質) - T1
字典。
輸出¶
Y (異質) - T2
保存來自輸入字典的值的 1 維張量。
型別約束¶
T1 in (
map(int64, double)
,map(int64, float)
,map(int64, string)
,map(string, double)
,map(string, float)
,map(string, int64)
)輸入必須是從字串或整數到字串或數值型別的映射。鍵和值的型別不能相同。
T2 in (
tensor(double)
,tensor(float)
,tensor(int64)
,tensor(string)
)輸出將會是輸入映射的值型別的張量。其形狀將為 [1,C],其中 C 是輸入字典的長度。