microsoft · jameslamb · Jan 6, 2022 · Dec 21, 2021 · Dec 21, 2021 · Dec 21, 2021
diff --git a/R-package/R/lgb.cv.R b/R-package/R/lgb.cv.R
@@ -333,6 +333,7 @@ lgb.cv <- function(params = list()
 
       booster <- Booster$new(params = params, train_set = dtrain)
       booster$add_valid(data = dtest, name = "valid")
+      booster$reset_parameter(params)
 finally: 
     train_set._reverse_update_params() 
     for valid_set in reduced_valid_sets: 
         valid_set._reverse_update_params() 
 , params = self$get_params() 
 get_params = function() { 
   dataset_params <- unname(unlist(.DATASET_PARAMETERS())) 
   ret <- list() 
   for (param_key in names(private$params)) { 
     if (param_key %in% dataset_params) { 
       ret[[param_key]] <- private$params[[param_key]] 
     } 
   } 
   return(ret) 
 }, 
 .DATASET_PARAMETERS <- function() { 
 config.Set(param); 
 if (verbosity == 1) { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Info); 
 } else if (verbosity == 0) { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Warning); 
 } else if (verbosity >= 2) { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Debug); 
 } else { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Fatal); 
 } 
 int verbosity = 1; 
 params = self.params 
 params <- utils::modifyList(params, train_set$get_params()) 
 LGBM_DatasetUpdateParamChecking_R 
 } else { 
   tryCatch({ 
     .Call( 
       LGBM_DatasetUpdateParamChecking_R 
       , lgb.params2str(params = private$params) 
       , lgb.params2str(params = params) 
     ) 
   }, error = function(e) { 
     # If updating failed but raw data is not available, raise an error because 
     # achieving what the user asked for is not possible 
     if (is.null(private$raw_data)) { 
       stop(e) 
     } 
     # If updating failed but raw data is available, modify the params 
     # on the R side and re-set ("deconstruct") the Dataset 
     private$params <- utils::modifyList(private$params, params) 
     self$finalize() 
   }) 
 finally: 
     train_set._reverse_update_params() 
     for valid_set in reduced_valid_sets: 
         valid_set._reverse_update_params() 
 , params = self$get_params() 
 get_params = function() { 
   dataset_params <- unname(unlist(.DATASET_PARAMETERS())) 
   ret <- list() 
   for (param_key in names(private$params)) { 
     if (param_key %in% dataset_params) { 
       ret[[param_key]] <- private$params[[param_key]] 
     } 
   } 
   return(ret) 
 }, 
 .DATASET_PARAMETERS <- function() { 
 config.Set(param); 
 if (verbosity == 1) { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Info); 
 } else if (verbosity == 0) { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Warning); 
 } else if (verbosity >= 2) { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Debug); 
 } else { 
   LightGBM::Log::ResetLogLevel(LightGBM::LogLevel::Fatal); 
 } 
 int verbosity = 1; 
 params = self.params 
 params <- utils::modifyList(params, train_set$get_params()) 
 LGBM_DatasetUpdateParamChecking_R 
 } else { 
   tryCatch({ 
     .Call( 
       LGBM_DatasetUpdateParamChecking_R 
       , lgb.params2str(params = private$params) 
       , lgb.params2str(params = params) 
     ) 
   }, error = function(e) { 
     # If updating failed but raw data is not available, raise an error because 
     # achieving what the user asked for is not possible 
     if (is.null(private$raw_data)) { 
       stop(e) 
     } 
  
     # If updating failed but raw data is available, modify the params 
     # on the R side and re-set ("deconstruct") the Dataset 
     private$params <- utils::modifyList(private$params, params) 
     self$finalize() 
   }) 
       return(
         list(booster = booster)
       )

@@ -1901,6 +1901,56 @@ test_that("early stopping works with lgb.cv()", {
   )
 })
 
+test_that("lgb.cv() respects changes to logging verbosity", {
+  dtrain <- lgb.Dataset(
+    data = train$data
+    , label = train$label
+  )
+  # (verbose = 1) should be INFO and WARNING level logs
+  lgb_cv_logs <- capture.output({
+    cv_bst <- lgb.cv(
+      params = list()
+      , nfold = 2L
+      , nrounds = 5L
+      , data = dtrain
+      , obj = "binary"
+      , verbose = 1L
+    )
+  })
+  expect_true(any(grepl("\\[LightGBM\\] \\[Info\\]", lgb_cv_logs)))
+  expect_true(any(grepl("\\[LightGBM\\] \\[Warning\\]", lgb_cv_logs)))
+
+  # (verbose = 0) should be WARNING level logs only
+  lgb_cv_logs <- capture.output({
+    cv_bst <- lgb.cv(
+      params = list()
+      , nfold = 2L
+      , nrounds = 5L
+      , data = dtrain
+      , obj = "binary"
+      , verbose = 0L
+    )
+  })
+  expect_false(any(grepl("\\[LightGBM\\] \\[Info\\]", lgb_cv_logs)))
+  expect_true(any(grepl("\\[LightGBM\\] \\[Warning\\]", lgb_cv_logs)))
+
+  # (verbose = -1) no logs
+  lgb_cv_logs <- capture.output({
+    cv_bst <- lgb.cv(
+      params = list()
+      , nfold = 2L
+      , nrounds = 5L
+      , data = dtrain
+      , obj = "binary"
+      , verbose = -1L
+    )
+  })
+  # NOTE: this is not length(lgb_cv_logs) == 0 because lightgbm's
+  #       dependencies might print other messages
+  expect_false(any(grepl("\\[LightGBM\\] \\[Info\\]", lgb_cv_logs)))
+  expect_false(any(grepl("\\[LightGBM\\] \\[Warning\\]", lgb_cv_logs)))
+})
+
 context("linear learner")
 
 test_that("lgb.train() fit on linearly-relatead data improves when using linear learners", {