ai.onnx.ml - DictVectorizer

DictVectorizer - 1 (ai.onnx.ml)

版本

  • 名稱: DictVectorizer (GitHub)

  • 網域: ai.onnx.ml

  • since_version: 1

  • function: False

  • support_level: SupportType.COMMON

  • shape inference: True

此運算符版本自網域 ai.onnx.ml 的第 1 版起可用。

摘要

使用索引對應將字典轉換為陣列。
給定一個字典,每個鍵都會在對應鍵型別的詞彙屬性中查詢。然後,在詞彙陣列中找到鍵的索引,該索引會用於為輸出 1 維張量「Y」建立索引,並將字典「X」中的值插入其中。
輸入映射的鍵型別必須對應於已定義詞彙屬性的元素型別。因此,輸出陣列的長度會等於索引對應向量參數的長度。輸入字典中的所有鍵都必須存在於索引對應向量中。對於輸入字典中的每個項目,將其值插入輸出陣列中。輸出陣列中,任何不存在於輸入字典中的鍵,其值皆為零。
例如:如果將 string_vocabulary 參數設定為 ["a", "c", "b", "z"],則輸入 {"a": 4, "c": 8} 將會產生 [4, 8, 0, 0] 的輸出。

屬性

  • int64_vocabulary - INTS :

    整數詞彙陣列。
    必須定義一個且只有一個詞彙。

  • string_vocabulary - STRINGS :

    字串詞彙陣列。
    必須定義一個且只有一個詞彙。

輸入

  • X (異質) - T1

    字典。

輸出

  • Y (異質) - T2

    保存來自輸入字典的值的 1 維張量。

型別約束

  • T1 in ( map(int64, double), map(int64, float), map(int64, string), map(string, double), map(string, float), map(string, int64) )

    輸入必須是從字串或整數到字串或數值型別的映射。鍵和值的型別不能相同。

  • T2 in ( tensor(double), tensor(float), tensor(int64), tensor(string) )

    輸出將會是輸入映射的值型別的張量。其形狀將為 [1,C],其中 C 是輸入字典的長度。