Fix shape inference logic for TopK operator (#2005)

hariharans29 · linkerzhang · commit e08efaa35ed5 · 2019-05-10T09:11:57.000+08:00
* Initial commit

* Formatting

* Refactor ParseRawData

* Add raw data shape inference test for upsample
diff --git a/onnx/defs/math/defs.cc b/onnx/defs/math/defs.cc
@@ -3,6 +3,7 @@
 
 #include <functional>
 #include "onnx/defs/schema.h"
+#include "onnx/defs/tensor_proto_util.h"
 
 namespace ONNX_NAMESPACE {
 
@@ -129,14 +130,13 @@ ONNX_OPERATOR_SET_SCHEMA(
             OpSchema::all_numeric_types(),
             "Constrain input and output types to high-precision numeric tensors.")
         .TypeAndShapeInferenceFunction([](InferenceContext& ctx) {
-            propagateElemTypeFromInputToOutput(ctx, 0, 0);
-            if (hasNInputShapes(ctx, 2))
-                bidirectionalBroadcastShapeInference(
-                    ctx.getInputType(0)->tensor_type().shape(),
-                    ctx.getInputType(1)->tensor_type().shape(),
-                    *ctx.getOutputType(0)->mutable_tensor_type()->mutable_shape());
-        })
-);
+          propagateElemTypeFromInputToOutput(ctx, 0, 0);
+          if (hasNInputShapes(ctx, 2))
+            bidirectionalBroadcastShapeInference(
+                ctx.getInputType(0)->tensor_type().shape(),
+                ctx.getInputType(1)->tensor_type().shape(),
+                *ctx.getOutputType(0)->mutable_tensor_type()->mutable_shape());
+        }));
 
 ONNX_OPERATOR_SET_SCHEMA(
     Mul,
@@ -944,7 +944,6 @@ ONNX_OPERATOR_SET_SCHEMA(
           // Type inference:
           propagateElemTypeFromInputToOutput(ctx, 0, 0);
           updateOutputElemType(ctx, 1, TensorProto::INT64);
-
           // Shape inference:
           if (!hasInputShape(ctx, 0))
             return;
@@ -955,29 +954,49 @@ ONNX_OPERATOR_SET_SCHEMA(
             axis += rank;
           if (axis < 0 || axis >= rank)
             fail_shape_inference("Invalid value for attribute axis");
-          // TODO: unclear what results should be if axis has less than k
-          // elements.
-          // Infer output shape if 'K' is available
+
+          const auto& axis_dim = input_shape.dim(static_cast<int>(axis));
           const auto* k = ctx.getInputData(1);
-          if (nullptr != k) {
-            if (k->dims_size() != 1 || k->int64_data_size() != 1 ||
-                k->data_type() != TensorProto::INT64)
+
+          // Infer output shape if:
+          // (1) 'K' is available
+          // (2) axis_dim has dim value
+          // Othewise cannot reliably compute output shape as axis dim value is
+          // unknown and hence cannot determine if axis dim value >= k (which
+          // should be enforced)
+          if (nullptr != k && axis_dim.has_dim_value()) {
+            int64_t k_value = 0;
+            if (k->dims_size() != 1 || k->dims(0) != 1)
+              fail_shape_inference(
+                  "K input must be a one-dimensional tensor of size 1.");
+            if (k->data_type() == TensorProto::INT64) {
+              const auto& data = ParseData<int64_t>(k);
+              k_value = data[0];
+            } else
+              fail_shape_inference("K input must be of type int64.");
+
+            if (axis_dim.dim_value() < k_value)
               fail_shape_inference(
-                  "K input must be a one-dimensional tensor of size 1 and of type int64.");
+                  "Axis has less than the requested k elements.");
+
             TensorShapeProto result_shape = input_shape;
             result_shape.mutable_dim(static_cast<int>(axis))
-                ->set_dim_value(k->int64_data(0));
+                ->set_dim_value(k_value);
+
             updateOutputShape(ctx, 0, result_shape);
             updateOutputShape(ctx, 1, result_shape);
-          } else {
-            // Infer output shapes' rank in any case
-            auto* output_shape_0 = getOutputShape(ctx, 0);
-            auto* output_shape_1 = getOutputShape(ctx, 1);
-            for (int i = 0; i < input_shape.dim_size(); ++i) {
-              output_shape_0->add_dim();
-              output_shape_1->add_dim();
-            }
+
+            return;
+          }
+
+          // Infer output shapes' rank in any case
+          auto* output_shape_0 = getOutputShape(ctx, 0);
+          auto* output_shape_1 = getOutputShape(ctx, 1);
+          for (int i = 0; i < input_shape.dim_size(); ++i) {
+            output_shape_0->add_dim();
+            output_shape_1->add_dim();
           }
+
           return;
         }));
 
diff --git a/onnx/defs/tensor/defs.cc b/onnx/defs/tensor/defs.cc
@@ -545,20 +545,11 @@ ONNX_OPERATOR_SET_SCHEMA(
           auto get_initializer_data =
               [](const TensorProto* initializer) -> std::vector<int64_t> {
             std::vector<int64_t> vec;
-            if (initializer->has_raw_data() &&
-                initializer->data_type() == TensorProto::INT64) {
-              const auto& data = ParseRawData<int64_t>(initializer);
-              vec.insert(vec.end(), data.begin(), data.end());
-            } else if (
-                initializer->has_raw_data() &&
-                initializer->data_type() == TensorProto::INT32) {
-              const auto& data = ParseRawData<int32_t>(initializer);
-              vec.insert(vec.end(), data.begin(), data.end());
-            } else if (initializer->data_type() == TensorProto::INT64) {
-              const auto& data = initializer->int64_data();
+            if (initializer->data_type() == TensorProto::INT64) {
+              const auto& data = ParseData<int64_t>(initializer);
               vec.insert(vec.end(), data.begin(), data.end());
             } else if (initializer->data_type() == TensorProto::INT32) {
-              const auto& data = initializer->int32_data();
+              const auto& data = ParseData<int32_t>(initializer);
               vec.insert(vec.end(), data.begin(), data.end());
             } else {
               // unaccepted data type
@@ -1328,38 +1319,21 @@ ONNX_OPERATOR_SET_SCHEMA(
           if (nullptr != scales) {
             // Infer output shape's dimension value if 'scales' is known.
             if (scales->data_type() == TensorProto::FLOAT) {
-              bool invalid_scale_shape = false;              
-              if (scales->has_raw_data()) {
-                const auto& data = ParseRawData<float>(scales);
-                if (static_cast<int>(data.size()) == input_shape.dim_size()) {
-                  for (int i = 0; i < input_shape.dim_size(); ++i) {
-                    float dim_value =
-                      static_cast<float>(input_shape.dim(i).dim_value());
-                    output_shape->add_dim()->set_dim_value(static_cast<int64_t>(
-                      std::floor(dim_value * data[i])));
-                  }
-                } else {
-                  invalid_scale_shape = true;
-                }
-              } else if (scales->float_data_size() == input_shape.dim_size()) {
+              const auto& data = ParseData<float>(scales);
+              if (static_cast<int>(data.size()) == input_shape.dim_size()) {
                 for (int i = 0; i < input_shape.dim_size(); ++i) {
                   float dim_value =
-                    static_cast<float>(input_shape.dim(i).dim_value());
-                  output_shape->add_dim()->set_dim_value(static_cast<int64_t>(
-                    std::floor(dim_value * scales->float_data(i))));
+                      static_cast<float>(input_shape.dim(i).dim_value());
+                  output_shape->add_dim()->set_dim_value(
+                      static_cast<int64_t>(std::floor(dim_value * data[i])));
                 }
               } else {
-                invalid_scale_shape = true;
-              }
-
-              if (invalid_scale_shape) {
                 fail_shape_inference(
-                  "Number of elements of input 'scales' must be same as rank of input 'X'."
-                );
+                    "Number of elements of input 'scales' must be same as rank of input 'X'.");
               }
             } else {
               fail_shape_inference(
-                "Input scales's element type must be float.");
+                  "Input scales's element type must be float.");
             }
           } else {
             // Infer output shape's rank in any case.
diff --git a/onnx/defs/tensor/old.cc b/onnx/defs/tensor/old.cc
@@ -437,38 +437,21 @@ ONNX_OPERATOR_SET_SCHEMA(
           if (nullptr != scales) {
             // Infer output shape's dimension value if 'scales' is known.
             if (scales->data_type() == TensorProto::FLOAT) {
-              bool invalid_scale_shape = false;
-              if (scales->has_raw_data()) {
-                const auto& data = ParseRawData<float>(scales);
-                if (static_cast<int>(data.size()) == input_shape.dim_size()) {
-                  for (int i = 0; i < input_shape.dim_size(); ++i) {
-                    float dim_value =
-                      static_cast<float>(input_shape.dim(i).dim_value());
-                    output_shape->add_dim()->set_dim_value(static_cast<int64_t>(
-                      std::floor(dim_value * data[i])));
-                  }
-                } else {
-                  invalid_scale_shape = true;
-                }
-              } else if (scales->float_data_size() == input_shape.dim_size()) {
+              const auto& data = ParseData<float>(scales);
+              if (static_cast<int>(data.size()) == input_shape.dim_size()) {
                 for (int i = 0; i < input_shape.dim_size(); ++i) {
                   float dim_value =
-                    static_cast<float>(input_shape.dim(i).dim_value());
-                  output_shape->add_dim()->set_dim_value(static_cast<int64_t>(
-                    std::floor(dim_value * scales->float_data(i))));
+                      static_cast<float>(input_shape.dim(i).dim_value());
+                  output_shape->add_dim()->set_dim_value(
+                      static_cast<int64_t>(std::floor(dim_value * data[i])));
                 }
               } else {
-                invalid_scale_shape = true; 
-              }
-              
-              if (invalid_scale_shape){
                 fail_shape_inference(
-                  "Number of elements of input 'scales' must be same as rank of input 'X'."
-                );
+                    "Number of elements of input 'scales' must be same as rank of input 'X'.");
               }
             } else {
               fail_shape_inference(
-                "Input scales's element type must be float.");
+                  "Input scales's element type must be float.");
             }
           } else {
             // Infer output shape's rank in any case.
diff --git a/onnx/defs/tensor_proto_util.cc b/onnx/defs/tensor_proto_util.cc
@@ -27,45 +27,47 @@ namespace ONNX_NAMESPACE {
     return t;                                                   \
   }
 
-  inline bool is_platform_little_endian() {
-    int num = 1;
-    if (*(char*)&num == 1)
-      return true;
-    return false;
-  }
+inline bool is_platform_little_endian() {
+  int num = 1;
+  if (*(char*)&num == 1)
+    return true;
+  return false;
+}
 
-#define DEFINE_PARSE_RAW_DATA(type)                                        \
+#define DEFINE_PARSE_DATA(type, typed_data_fetch)                          \
   template <>                                                              \
-  const std::vector<type> ParseRawData(const TensorProto* tensor_proto) {  \
+  const std::vector<type> ParseData(const TensorProto* tensor_proto) {     \
     std::vector<type> res;                                                 \
-    if (!tensor_proto->has_raw_data())                                     \
+    if (!tensor_proto->has_raw_data()) {                                   \
+      const auto& data = tensor_proto->typed_data_fetch();                 \
+      res.insert(res.end(), data.begin(), data.end());                     \
       return res;                                                          \
+    }                                                                      \
     /* make copy as we may have to reverse bytes */                        \
     std::string raw_data = tensor_proto->raw_data();                       \
     /* okay to remove const qualifier as we have already made a copy */    \
     char* bytes = const_cast<char*>(raw_data.c_str());                     \
     /*onnx is little endian serialized always-tweak byte order if needed*/ \
     if (!is_platform_little_endian()) {                                    \
-        const size_t element_size = sizeof(type);                          \
-        const size_t num_elements = raw_data.size() / element_size;        \
-          for (size_t i = 0; i < num_elements; ++i) {                      \
-          char* start_byte = bytes + i * element_size;                     \
-          char* end_byte = start_byte + element_size - 1;                  \
-            /* keep swapping */                                            \
-          for (size_t count = 0; count < element_size / 2; ++count) {      \
-            char temp = *start_byte;                                       \
-            *start_byte = *end_byte;                                       \
-            *end_byte = temp;                                              \
-            ++start_byte;                                                  \
-            --end_byte;                                                    \
-          }                                                                \
+      const size_t element_size = sizeof(type);                            \
+      const size_t num_elements = raw_data.size() / element_size;          \
+      for (size_t i = 0; i < num_elements; ++i) {                          \
+        char* start_byte = bytes + i * element_size;                       \
+        char* end_byte = start_byte + element_size - 1;                    \
+        /* keep swapping */                                                \
+        for (size_t count = 0; count < element_size / 2; ++count) {        \
+          char temp = *start_byte;                                         \
+          *start_byte = *end_byte;                                         \
+          *end_byte = temp;                                                \
+          ++start_byte;                                                    \
+          --end_byte;                                                      \
         }                                                                  \
+      }                                                                    \
     }                                                                      \
     res.insert(                                                            \
         res.end(),                                                         \
         reinterpret_cast<const type*>(bytes),                              \
-        reinterpret_cast<const type*>(bytes + raw_data.size())             \
-        );                                                                 \
+        reinterpret_cast<const type*>(bytes + raw_data.size()));           \
     return res;                                                            \
   }
 
@@ -85,8 +87,8 @@ DEFINE_TO_TENSOR_LIST(uint64_t, TensorProto_DataType_UINT64, uint64)
 DEFINE_TO_TENSOR_LIST(double, TensorProto_DataType_DOUBLE, double)
 DEFINE_TO_TENSOR_LIST(std::string, TensorProto_DataType_STRING, string)
 
-DEFINE_PARSE_RAW_DATA(int32_t)
-DEFINE_PARSE_RAW_DATA(int64_t)
-DEFINE_PARSE_RAW_DATA(float)
+DEFINE_PARSE_DATA(int32_t, int32_data)
+DEFINE_PARSE_DATA(int64_t, int64_data)
+DEFINE_PARSE_DATA(float, float_data)
 
 } // namespace ONNX_NAMESPACE
diff --git a/onnx/defs/tensor_proto_util.h b/onnx/defs/tensor_proto_util.h
@@ -14,6 +14,6 @@ template <typename T>
 TensorProto ToTensor(const std::vector<T>& values);
 
 template <typename T>
-const std::vector<T> ParseRawData(const TensorProto* tensor_proto);
+const std::vector<T> ParseData(const TensorProto* tensor_proto);
 
 } // namespace ONNX_NAMESPACE
diff --git a/onnx/test/shape_inference_test.py b/onnx/test/shape_inference_test.py
@@ -248,6 +248,19 @@ def test_upsample(self):  # type: () -> None
             [make_tensor_value_info('y', TensorProto.INT32, (2, 4, 3, 9))],
             opset_imports=[helper.make_opsetid("", 9)])
 
+    def test_upsample_raw_data(self):  # type: () -> None
+        graph = self._make_graph(
+            [('x', TensorProto.INT32, (2, 4, 3, 5)),
+             ('scales', TensorProto.FLOAT, (4,))],
+            [make_node("Upsample", ['x', 'scales'], ['y'])],
+            [],
+            initializer=[make_tensor('scales', TensorProto.FLOAT, (4,),
+                                     vals=np.array([1.0, 1.1, 1.3, 1.9], dtype='<f4').tobytes(), raw=True)])  # Feed raw bytes (force little endian ordering like onnx standard) for test purpose
+        self._assert_inferred(
+            graph,
+            [make_tensor_value_info('y', TensorProto.INT32, (2, 4, 3, 9))],
+            opset_imports=[helper.make_opsetid("", 9)])
+
     def test_resize(self):  # type: () -> None
         graph = self._make_graph(
             [('x', TensorProto.INT32, (2, 4, 3, 5)),
@@ -786,6 +799,27 @@ def test_topk(self):  # type: () -> None
                               [make_tensor_value_info('y', TensorProto.FLOAT, (3, 4, 2, 10)),
                                make_tensor_value_info('z', TensorProto.INT64, (3, 4, 2, 10))])
 
+    def test_topk_raw_data(self):  # type: () -> None
+        graph = self._make_graph(
+            [('x', TensorProto.FLOAT, (3, 4, 5, 10))],
+            [make_node('TopK', ['x', 'k'], ['y', 'z'], axis=2)],
+            [],
+            initializer=[make_tensor('k', TensorProto.INT64, (1,),
+                                      vals=np.array([3], dtype='<i8').tobytes(), raw=True)])  # Feed raw bytes (force little endian ordering like onnx standard) for test purpose
+        self._assert_inferred(graph,
+                              [make_tensor_value_info('y', TensorProto.FLOAT, (3, 4, 3, 10)),
+                               make_tensor_value_info('z', TensorProto.INT64, (3, 4, 3, 10))])
+
+    def test_topk_missing_k_value_output_rank_check(self):  # type: () -> None
+        graph = self._make_graph(
+            [('x', TensorProto.FLOAT, (3, 4, 5, 10)),
+            ('k', TensorProto.INT64, (1,))],
+            [make_node('TopK', ['x', 'k'], ['y', 'z'], axis=2)],
+            [])
+        self._assert_inferred(graph,
+                              [make_tensor_value_info('y', TensorProto.FLOAT, (None, None, None, None)),  # type: ignore
+                               make_tensor_value_info('z', TensorProto.INT64, (None, None, None, None))])  # type: ignore
+
     def test_gemm(self):  # type: () -> None
         graph = self._make_graph(
             [('x', TensorProto.FLOAT, (7, 5)),