multiple editing

lobpcg · lobpcg · commit 3546217d2894 · 2018-10-08T15:18:18.000-04:00
diff --git a/sklearn/decomposition/pca.py b/sklearn/decomposition/pca.py
@@ -176,11 +176,14 @@ class PCA(_BasePCA):
             0 < n_components < min(X.shape)
         randomized :
             run randomized SVD by the method of Halko et al.
+        lobpcg :
+            run lobpcg_svd by LOBPCG of Knyazev 2001
 
         .. versionadded:: 0.18.0
 
     tol : float >= 0, optional (default .0)
-        Tolerance for singular values computed by svd_solver == 'arpack'.
+        Tolerance for singular values computed by svd_solver == 'arpack'
+        For svd_solver == 'lobpcg', tol must be reasonable, not .0!
 
         .. versionadded:: 0.18.0
 
@@ -270,6 +273,8 @@ class PCA(_BasePCA):
     "A randomized algorithm for the decomposition of matrices".
     Applied and Computational Harmonic Analysis, 30(1), 47-68.`
 
+    For svd_solver == 'lobpcg', see: lobpcg_svd
+
 
     Examples
     --------
diff --git a/sklearn/decomposition/tests/test_pca.py b/sklearn/decomposition/tests/test_pca.py
@@ -613,8 +613,9 @@ def test_pca_score_with_different_solvers():
     digits = datasets.load_digits()
     X_digits = digits.data
 
+    # the PCA default tol=.0 may break lobpcg_svd
     pca_dict = {svd_solver: PCA(n_components=30, svd_solver=svd_solver,
-                                random_state=0)
+                                random_state=0, tol=1e-4)
                 for svd_solver in solver_list}
 
     for pca in pca_dict.values():
@@ -631,6 +632,8 @@ def test_pca_score_with_different_solvers():
     assert_almost_equal(score_dict['full'], score_dict['arpack'])
     assert_almost_equal(score_dict['full'], score_dict['randomized'],
                         decimal=3)
+    assert_almost_equal(score_dict['full'], score_dict['lobpcg'],
+                        decimal=3)
 
 
 def test_pca_zero_noise_variance_edge_cases():
@@ -716,9 +719,10 @@ def check_pca_float_dtype_preservation(svd_solver):
     X_64 = np.random.RandomState(0).rand(1000, 4).astype(np.float64)
     X_32 = X_64.astype(np.float32)
 
+    # the PCA default tol=.0 may break lobpcg_svd
     pca_64 = PCA(n_components=3, svd_solver=svd_solver,
-                 random_state=0).fit(X_64)
-    pca_32 = PCA(n_components=3, svd_solver=svd_solver,
+                 random_state=0, tol=1-10).fit(X_64)
+    pca_32 = PCA(n_components=3, tol=1-5, svd_solver=svd_solver,
                  random_state=0).fit(X_32)
 
     assert pca_64.components_.dtype == np.float64
@@ -736,10 +740,11 @@ def check_pca_int_dtype_upcast_to_double(svd_solver):
     X_i64 = X_i64.astype(np.int64)
     X_i32 = X_i64.astype(np.int32)
 
+    # the PCA default tol=.0 may break lobpcg_svd
     pca_64 = PCA(n_components=3, svd_solver=svd_solver,
-                 random_state=0).fit(X_i64)
+                 random_state=0, tol=1-10).fit(X_i64)
     pca_32 = PCA(n_components=3, svd_solver=svd_solver,
-                 random_state=0).fit(X_i32)
+                 random_state=0, tol=1-5).fit(X_i32)
 
     assert pca_64.components_.dtype == np.float64
     assert pca_32.components_.dtype == np.float64
diff --git a/sklearn/decomposition/tests/test_truncated_svd.py b/sklearn/decomposition/tests/test_truncated_svd.py
@@ -203,8 +203,9 @@ def test_singular_values():
                         random_state=rng).fit(X)
     rpca = TruncatedSVD(n_components=2, algorithm='randomized',
                         random_state=rng).fit(X)
+    # the PCA default tol=.0 may break lobpcg_svd
     lpca = TruncatedSVD(n_components=2, algorithm='lobpcg',
-                        random_state=rng).fit(X)
+                        random_state=rng, tol=1e-10).fit(X)
     assert_array_almost_equal(apca.singular_values_, rpca.singular_values_, 12)
     assert_array_almost_equal(apca.singular_values_, lpca.singular_values_, 12)
 
@@ -238,8 +239,9 @@ def test_singular_values():
                         random_state=rng)
     rpca = TruncatedSVD(n_components=3, algorithm='randomized',
                         random_state=rng)
+    # the PCA default tol=.0 may break lobpcg_svd
     lpca = TruncatedSVD(n_components=3, algorithm='lobpcg',
-                        random_state=rng)
+                        random_state=rng, tol=1e-8)
     X_apca = apca.fit_transform(X)
     X_rpca = rpca.fit_transform(X)
     X_lpca = rpca.fit_transform(X)
diff --git a/sklearn/utils/lobpcg.py b/sklearn/utils/lobpcg.py
@@ -11,33 +11,18 @@
 
 import numpy as np
 
-from numpy.testing import assert_allclose
-from scipy._lib.six import xrange
 from scipy.linalg import inv, eigh, cho_factor, cho_solve, cholesky
 from scipy.sparse.linalg import aslinearoperator, LinearOperator
 
 __all__ = ['lobpcg']
 
 
-def pause():
-    # Used only when verbosity level > 10.
-    input()
-
-
 def save(ar, fileName):
     # Used only when verbosity level > 10.
     from numpy import savetxt
     savetxt(fileName, ar, precision=8)
 
 
-def _assert_symmetric(M, rtol=1e-5, atol=1e-8):
-    assert_allclose(M.T.conj(), M, rtol=rtol, atol=atol)
-
-
-##
-# 21.05.2007, c
-
-
 def as2d(ar):
     """
     If the input array is 2D return it, if it is 1D, append a dimension,
@@ -271,8 +256,6 @@ def lobpcg(A, X,
         raise ValueError('expected rank-2 array for argument X')
 
     n, sizeX = blockVectorX.shape
-    if sizeX > n:
-        raise ValueError('X column dimension exceeds the row dimension')
 
     A = _makeOperator(A, (n, n))
     B = _makeOperator(B, (n, n))
@@ -336,8 +319,7 @@ def lobpcg(A, X,
         try:
             # gramYBY is a Cholesky factor from now on...
             gramYBY = cho_factor(gramYBY)
-        # E722 do not use bare except
-        except:
+        except linearlyDependentConstraints:
             raise ValueError('cannot handle linearly dependent constraints')
 
         _applyConstraints(blockVectorX, gramYBY, blockVectorBY, blockVectorY)
@@ -383,7 +365,9 @@ def lobpcg(A, X,
     blockVectorAP = None
     blockVectorBP = None
 
-    for iterationNumber in xrange(maxIterations):
+    iterationNumber = -1
+    while iterationNumber < maxIterations:
+        iterationNumber += 1
         if verbosityLevel > 0:
             print('iteration %d' % iterationNumber)
 
@@ -505,9 +489,7 @@ def lobpcg(A, X,
 
         if verbosityLevel > 10:
             print(eigBlockVector)
-            pause()
 
-        ##
         # Compute Ritz vectors.
         if iterationNumber > 0:
             eigBlockVectorX = eigBlockVector[:sizeX]
@@ -534,7 +516,6 @@ def lobpcg(A, X,
             print(pp)
             print(app)
             print(bpp)
-            pause()
 
         blockVectorX = np.dot(blockVectorX, eigBlockVectorX) + pp
         blockVectorAX = np.dot(blockVectorAX, eigBlockVectorX) + app