dmlc
diff --git a/‎.gitmodules‎
Lines changed: 3 additions & 3 deletions b/‎.gitmodules‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎CMakeLists.txt‎
Lines changed: 22 additions & 6 deletions b/‎CMakeLists.txt‎
Lines changed: 22 additions & 6 deletions
diff --git a/‎CONTRIBUTORS.md‎
Lines changed: 1 addition & 0 deletions b/‎CONTRIBUTORS.md‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎Jenkinsfile‎
Lines changed: 12 additions & 10 deletions b/‎Jenkinsfile‎
Lines changed: 12 additions & 10 deletions
diff --git a/‎cmake/modules/CUDA.cmake‎
Lines changed: 9 additions & 6 deletions b/‎cmake/modules/CUDA.cmake‎
Lines changed: 9 additions & 6 deletions
diff --git a/‎conda/dgl/meta.yaml‎
Lines changed: 1 addition & 1 deletion b/‎conda/dgl/meta.yaml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎dgl_sparse/CMakeLists.txt‎
Lines changed: 18 additions & 2 deletions b/‎dgl_sparse/CMakeLists.txt‎
Lines changed: 18 additions & 2 deletions
diff --git a/‎dgl_sparse/include/sparse/matrix_ops.h‎
Lines changed: 1 addition & 2 deletions b/‎dgl_sparse/include/sparse/matrix_ops.h‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎dgl_sparse/src/macro.h‎
Lines changed: 0 additions & 65 deletions b/‎dgl_sparse/src/macro.h‎
Lines changed: 0 additions & 65 deletions
@@ -19,9 +19,9 @@
 [submodule "third_party/libxsmm"]
 	path = third_party/libxsmm
 	url = https://github.com/hfp/libxsmm.git
-[submodule "third_party/thrust"]
-	path = third_party/thrust
-	url = https://github.com/NVIDIA/thrust.git
 [submodule "third_party/pcg"]
 	path = third_party/pcg
 	url = https://github.com/imneme/pcg-cpp.git
+[submodule "third_party/cccl"]
+	path = third_party/cccl
+	url = https://github.com/NVIDIA/cccl.git
@@ -1,4 +1,4 @@
-cmake_minimum_required(VERSION 3.8)
+cmake_minimum_required(VERSION 3.18)
 ########################################
 # Borrowed and adapted from TVM project
 ########################################
@@ -75,7 +75,7 @@ dgl_feature_option(
 dgl_feature_option(
     BUILD_GRAPHBOLT
     "Build Graphbolt library"
-    "dev" "dogfood"
+    "all"
 )
 
 dgl_feature_option(
@@ -142,10 +142,10 @@ if(USE_CUDA)
   # see https://github.com/NVIDIA/thrust/issues/1401
   add_definitions(-DTHRUST_CUB_WRAPPED_NAMESPACE=dgl)
   include(cmake/modules/CUDA.cmake)
-  message(STATUS "Use external CUB/Thrust library for a consistent API and performance.")
-  cuda_include_directories(BEFORE "${CMAKE_SOURCE_DIR}/third_party/thrust")
-  cuda_include_directories(BEFORE "${CMAKE_SOURCE_DIR}/third_party/thrust/dependencies/cub")
-  cuda_include_directories(BEFORE "${CMAKE_SOURCE_DIR}/third_party/thrust/dependencies/libcudacxx/include")
+  message(STATUS "Use external CCCL library for a consistent API and performance.")
+  cuda_include_directories(BEFORE "${CMAKE_SOURCE_DIR}/third_party/cccl/thrust")
+  cuda_include_directories(BEFORE "${CMAKE_SOURCE_DIR}/third_party/cccl/cub")
+  cuda_include_directories(BEFORE "${CMAKE_SOURCE_DIR}/third_party/cccl/libcudacxx/include")
 endif(USE_CUDA)
 
 # initial variables
@@ -527,18 +527,27 @@ endif(BUILD_SPARSE)
 
 if(BUILD_GRAPHBOLT)
   message(STATUS "Configuring graphbolt library")
+  string(REPLACE ";" "\\;" CUDA_ARCHITECTURES_ESCAPED "${CUDA_ARCHITECTURES}")
   file(TO_NATIVE_PATH ${CMAKE_CURRENT_BINARY_DIR} BINDIR)
   file(TO_NATIVE_PATH ${CMAKE_COMMAND} CMAKE_CMD)
+  if(USE_CUDA)
+    get_target_property(GPU_CACHE_INCLUDE_DIRS gpu_cache INCLUDE_DIRECTORIES)
+  endif(USE_CUDA)
+  string(REPLACE ";" "\\;" GPU_CACHE_INCLUDE_DIRS_ESCAPED "${GPU_CACHE_INCLUDE_DIRS}")
   if(MSVC)
     file(TO_NATIVE_PATH ${CMAKE_CURRENT_SOURCE_DIR}/graphbolt/build.bat BUILD_SCRIPT)
     add_custom_target(
       graphbolt
       ALL
       ${CMAKE_COMMAND} -E env
       CMAKE_COMMAND=${CMAKE_CMD}
+      CUDA_TOOLKIT_ROOT_DIR=${CUDA_TOOLKIT_ROOT_DIR}
+      USE_CUDA=${USE_CUDA}
       BINDIR=${BINDIR}
+      GPU_CACHE_INCLUDE_DIRS="${GPU_CACHE_INCLUDE_DIRS_ESCAPED}"
       CFLAGS=${CMAKE_C_FLAGS}
       CXXFLAGS=${CMAKE_CXX_FLAGS}
+      CUDAARCHS="${CUDA_ARCHITECTURES_ESCAPED}"
       LDFLAGS=${CMAKE_SHARED_LINKER_FLAGS}
       cmd /e:on /c ${BUILD_SCRIPT} ${TORCH_PYTHON_INTERPS}
       DEPENDS ${BUILD_SCRIPT}
@@ -550,12 +559,19 @@ if(BUILD_GRAPHBOLT)
       ALL
       ${CMAKE_COMMAND} -E env
       CMAKE_COMMAND=${CMAKE_CMD}
+      CUDA_TOOLKIT_ROOT_DIR=${CUDA_TOOLKIT_ROOT_DIR}
+      USE_CUDA=${USE_CUDA}
       BINDIR=${CMAKE_CURRENT_BINARY_DIR}
+      GPU_CACHE_INCLUDE_DIRS="${GPU_CACHE_INCLUDE_DIRS_ESCAPED}"
       CFLAGS=${CMAKE_C_FLAGS}
       CXXFLAGS=${CMAKE_CXX_FLAGS}
+      CUDAARCHS="${CUDA_ARCHITECTURES_ESCAPED}"
       LDFLAGS=${CMAKE_SHARED_LINKER_FLAGS}
       bash ${BUILD_SCRIPT} ${TORCH_PYTHON_INTERPS}
       DEPENDS ${BUILD_SCRIPT}
       WORKING_DIRECTORY ${CMAKE_SOURCE_DIR}/graphbolt)
   endif(MSVC)
+  if(USE_CUDA)
+    add_dependencies(graphbolt gpu_cache)
+  endif(USE_CUDA)
 endif(BUILD_GRAPHBOLT)
@@ -36,6 +36,7 @@ Contributors
 * [Michal Szarmach](https://github.com/mszarma) from Intel
 * [Izabela Mazur](https://github.com/IzabelaMazur) from Intel
 * [Sanchit Misra](https://github.com/sanchit-misra) from Intel
+* [Andrzej Kotlowski](https://github.com/anko-intel) from Intel
 * [Sheng Zha](https://github.com/szha) from AWS
 * [Yifei Ma](https://github.com/yifeim) from  AWS
 * [Yizhi Liu](https://github.com/yzhliu) from AWS
 
@@ -158,6 +158,7 @@ def is_authorized(name) {
     'frozenbugs', 'peizhou001', 'zheng-da', 'czkkkkkk', 'thvasilo',
     // Intern:
     'keli-wen', 'caojy1998', 'RamonZhou', 'xiangyuzhi', 'Skeleton003', 'yxy235',
+    'hutiechuan',
     // Friends:
     'nv-dlasalle', 'yaox12', 'chang-l', 'Kh4L', 'VibhuJawa', 'kkranen',
     'bgawrych', 'itaraban', 'daniil-sizov', 'anko-intel', 'Kacper-Pietkun',
@@ -317,7 +318,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-cpu"
-                  image "dgllib/dgl-ci-cpu:v230711"
+                  image "dgllib/dgl-ci-cpu:v240123_1000"
                   args "-u root"
                   alwaysPull true
                 }
@@ -336,7 +337,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-cpu"
-                  image "dgllib/dgl-ci-gpu:cu116_v230711"
+                  image "dgllib/dgl-ci-gpu:cu116_v240123_1000"
                   args "-u root"
                   alwaysPull true
                 }
@@ -391,7 +392,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-cpu"
-                  image "dgllib/dgl-ci-cpu:v230711"
+                  image "dgllib/dgl-ci-cpu:v240123_1000"
                   args "-u root"
                   alwaysPull true
                 }
@@ -410,7 +411,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-gpu"
-                  image "dgllib/dgl-ci-gpu:cu116_v230711"
+                  image "dgllib/dgl-ci-gpu:cu116_v240123_1000"
                   args "-u root --runtime nvidia"
                   alwaysPull true
                 }
@@ -450,6 +451,8 @@ pipeline {
                   steps {
                     unit_test_linux('tensorflow', 'cpu')
                   }
+                  // Tensorflow is deprecated.
+                  when { expression { false } }
                 }
               }
               post {
@@ -463,7 +466,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-gpu"
-                  image "dgllib/dgl-ci-gpu:cu116_v230711"
+                  image "dgllib/dgl-ci-gpu:cu116_v240123_1000"
                   args "-u root --runtime nvidia"
                   alwaysPull true
                 }
@@ -488,7 +491,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-cpu"
-                  image "dgllib/dgl-ci-cpu:v230711"
+                  image "dgllib/dgl-ci-cpu:v240123_1000"
                   args "-u root --shm-size=4gb"
                   alwaysPull true
                 }
@@ -541,7 +544,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-gpu"
-                  image "dgllib/dgl-ci-gpu:cu116_v230711"
+                  image "dgllib/dgl-ci-gpu:cu116_v240123_1000"
                   args "-u root --runtime nvidia --shm-size=8gb"
                   alwaysPull true
                 }
@@ -570,7 +573,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-cpu"
-                  image "dgllib/dgl-ci-cpu:v230711"
+                  image "dgllib/dgl-ci-cpu:v240123_1000"
                   args "-u root --shm-size=4gb"
                   alwaysPull true
                 }
@@ -580,7 +583,6 @@ pipeline {
                   steps {
                     unit_distributed_linux('pytorch', 'cpu')
                   }
-                  when { expression { false } }
                 }
               }
               post {
@@ -618,7 +620,7 @@ pipeline {
               agent {
                 docker {
                   label "dgl-ci-linux-cpu"
-                  image "dgllib/dgl-ci-cpu:v230711"
+                  image "dgllib/dgl-ci-cpu:v240123_1000"
                   args "-u root"
                   alwaysPull true
                 }
 
@@ -10,18 +10,17 @@ endif()
 include(CheckCXXCompilerFlag)
 check_cxx_compiler_flag("-std=c++17"   SUPPORT_CXX17)
 
-set(dgl_known_gpu_archs "35" "50" "60" "70")
+set(dgl_known_gpu_archs "35" "50" "60" "70" "75")
 set(dgl_cuda_arch_ptx "70")
 if (CUDA_VERSION_MAJOR GREATER_EQUAL "11")
-  list(APPEND dgl_known_gpu_archs "80")
-  set(dgl_cuda_arch_ptx "80")
+  list(APPEND dgl_known_gpu_archs "80" "86")
+  set(dgl_cuda_arch_ptx "80" "86")
 endif()
-# CMake 3.5 doesn't support VERSION_GREATER_EQUAL
-if (NOT CUDA_VERSION VERSION_LESS "11.8")
+if (CUDA_VERSION VERSION_GREATER_EQUAL "11.8")
   list(APPEND dgl_known_gpu_archs "90")
   set(dgl_cuda_arch_ptx "90")
 endif()
-if (NOT CUDA_VERSION VERSION_LESS "12.0")
+if (CUDA_VERSION VERSION_GREATER_EQUAL "12.0")
   list(REMOVE_ITEM dgl_known_gpu_archs "35")
 endif()
 
@@ -177,17 +176,20 @@ function(dgl_select_nvcc_arch_flags out_variable)
 
   set(__nvcc_flags "--expt-relaxed-constexpr")
   set(__nvcc_archs_readable "")
+  set(__archs "")
 
   # Tell NVCC to add binaries for the specified GPUs
   foreach(__arch ${__cuda_arch_bin})
     if(__arch MATCHES "([0-9]+)\\(([0-9]+)\\)")
       # User explicitly specified PTX for the concrete BIN
       list(APPEND __nvcc_flags -gencode arch=compute_${CMAKE_MATCH_2},code=sm_${CMAKE_MATCH_1})
       list(APPEND __nvcc_archs_readable sm_${CMAKE_MATCH_1})
+      list(APPEND __archs ${CMAKE_MATCH_1})
     else()
       # User didn't explicitly specify PTX for the concrete BIN, we assume PTX=BIN
       list(APPEND __nvcc_flags -gencode arch=compute_${__arch},code=sm_${__arch})
       list(APPEND __nvcc_archs_readable sm_${__arch})
+      list(APPEND __archs ${__arch})
     endif()
   endforeach()
 
@@ -200,6 +202,7 @@ function(dgl_select_nvcc_arch_flags out_variable)
   string(REPLACE ";" " " __nvcc_archs_readable "${__nvcc_archs_readable}")
   set(${out_variable}          ${__nvcc_flags}          PARENT_SCOPE)
   set(${out_variable}_readable ${__nvcc_archs_readable} PARENT_SCOPE)
+  set(CUDA_ARCHITECTURES       ${__archs}               PARENT_SCOPE)
 endfunction()
 
 ################################################################################################
 
@@ -1,6 +1,6 @@
 package:
   name: dgl{{ environ.get('DGL_PACKAGE_SUFFIX', '') }}
-  version: 1.2{{ environ.get('DGL_VERSION_SUFFIX', '') }}
+  version: 2.1{{ environ.get('DGL_VERSION_SUFFIX', '') }}
 
 source:
   git_rev: {{ environ.get('DGL_RELEASE_BRANCH', 'master') }}
 
@@ -1,4 +1,4 @@
-cmake_minimum_required(VERSION 3.5)
+cmake_minimum_required(VERSION 3.8)
 project(dgl_sparse C CXX)
 
 # Find PyTorch cmake files and PyTorch versions with the python interpreter $PYTHON_INTERP
@@ -20,8 +20,16 @@ string(REPLACE "." ";" TORCH_VERSION_LIST ${TORCH_VER})
 list(GET TORCH_VERSION_LIST 0 TORCH_VERSION_MAJOR)
 list(GET TORCH_VERSION_LIST 1 TORCH_VERSION_MINOR)
 
+set(SPARSE_LINKER_LIBS "")
+
 if(USE_CUDA)
   add_definitions(-DDGL_USE_CUDA)
+  enable_language(CUDA)
+endif()
+
+# For windows, define NOMINMAX to avoid conflict with std::min/max
+if(MSVC)
+  add_definitions(-DNOMINMAX)
 endif()
 
 set(Torch_DIR "${TORCH_PREFIX}/Torch")
@@ -32,6 +40,7 @@ set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${TORCH_CXX_FLAGS}")
 set(CMAKE_CXX_FLAGS_DEBUG "${CMAKE_CXX_FLAGS_DEBUG} -O0 -g3 -ggdb")
 
 set(LIB_DGL_SPARSE_NAME "dgl_sparse_pytorch_${TORCH_VER}")
+list(APPEND SPARSE_LINKER_LIBS ${TORCH_LIBRARIES})
 
 set(SPARSE_DIR "${CMAKE_CURRENT_SOURCE_DIR}/src")
 set(SPARSE_INCLUDE "${CMAKE_CURRENT_SOURCE_DIR}/include")
@@ -40,10 +49,17 @@ file(GLOB SPARSE_SRC
   ${SPARSE_DIR}/*.cc
   ${SPARSE_DIR}/cpu/*.cc
 )
+if(USE_CUDA)
+  file(GLOB SPARSE_CUDA_SRC
+    ${SPARSE_DIR}/cuda/*.cu
+  )
+  list(APPEND SPARSE_SRC ${SPARSE_CUDA_SRC})
+endif()
+
 add_library(${LIB_DGL_SPARSE_NAME} SHARED ${SPARSE_SRC} ${SPARSE_HEADERS})
 target_include_directories(
   ${LIB_DGL_SPARSE_NAME} PRIVATE ${SPARSE_DIR} ${SPARSE_HEADERS})
-target_link_libraries(${LIB_DGL_SPARSE_NAME} "${TORCH_LIBRARIES}")
+target_link_libraries(${LIB_DGL_SPARSE_NAME} ${SPARSE_LINKER_LIBS})
 target_compile_definitions(${LIB_DGL_SPARSE_NAME} PRIVATE TORCH_VERSION_MAJOR=${TORCH_VERSION_MAJOR})
 target_compile_definitions(${LIB_DGL_SPARSE_NAME} PRIVATE TORCH_VERSION_MINOR=${TORCH_VERSION_MINOR})
 
 
@@ -6,7 +6,6 @@
 #ifndef SPARSE_MATRIX_OPS_H_
 #define SPARSE_MATRIX_OPS_H_
 
-#include <sparse/sparse_format.h>
 #include <sparse/sparse_matrix.h>
 
 #include <tuple>
@@ -47,7 +46,7 @@ std::tuple<std::shared_ptr<COO>, torch::Tensor, torch::Tensor> COOIntersection(
  */
 std::tuple<c10::intrusive_ptr<SparseMatrix>, torch::Tensor> Compact(
     const c10::intrusive_ptr<SparseMatrix>& mat, int64_t dim,
-    torch::Tensor leading_indices);
+    const torch::optional<torch::Tensor>& leading_indices);
 
 }  // namespace sparse
 }  // namespace dgl