PCA mit Arpack gibt unterschiedliche Werte zurück, wenn sich die Reihenfolge der Beobachtungen ändert, aber warum? - Programmiererforum

PCA mit Arpack gibt unterschiedliche Werte zurück, wenn sich die Reihenfolge der Beobachtungen ändert, aber warum? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

PCA mit Arpack gibt unterschiedliche Werte zurück, wenn sich die Reihenfolge der Beobachtungen ändert, aber warum?

Report
Quote

Post by Anonymous » 01 Oct 2025, 13:23

Ich habe kürzlich bemerkt, dass Scikit-Learn PCA mit SVD_Solver = "Arpack" verschiedene schwimmende Punktnummern zurückgibt, wenn ich die Reihenfolge der Beobachtungen in einem spärlichen Array ändere. Ist das ein erwartetes Verhalten? Vielen Dank im Voraus!

Code: Select all

import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
import scipy.sparse as sp

# Simulate a sparse gene expression array containing two datasets, dataset1 and 2, both containing 5000 observations
n_obs = 10000 # Total number of observations
n_features = 2000 # Total number of features

# Simulate a concatenated dataset with the order of dataset1 + dataset2
rng = np.random.default_rng(42)
X1 = rng.uniform(0, 5, size=(n_obs, n_features)).astype(np.float32)

# Change the order of the datasets so that it is in the form of dataset2 + dataset1
X2 = np.concatenate((X1[5000:,], X1[:5000,]), axis=0)

X1_sparse = sp.csr_matrix(X1)
X2_sparse = sp.csr_matrix(X2)
print("Matrix 1 shape:", X1_sparse.shape, "nnz:", X1_sparse.nnz)
print("Matrix 2 shape:", X2_sparse.shape, "nnz:", X2_sparse.nnz)

# PCA with ARPACK on X1
pca1 = PCA(n_components=20, svd_solver="arpack", random_state=321)
pcs1 = pca1.fit_transform(X1_sparse.toarray())

# PCA with ARPACK on X2
pca2 = PCA(n_components=20, svd_solver="arpack", random_state=321)
pcs2 = pca2.fit_transform(X2_sparse.toarray())

# Wrap in DataFrames with fake cell IDs
obs_names = [f"cell{i}" for i in range(n_obs)]
pcs1 = pd.DataFrame(pcs1, index=obs_names)
pcs2 = pd.DataFrame(pcs2, index=obs_names[5000:] + obs_names[0:5000])
pcs2 = pcs2.loc[pcs1.index,]

# Compare results
print("\nAre components numerically close (1e-6)?",
np.allclose(np.abs(pcs1), np.abs(pcs2), atol=1e-6))

< /code>
Ich hatte erwartet, dass zwei PCA -Arrays genau gleich sind. Zum Beispiel: PCS1.ILOC [0,0]

Gibt: -2.9909344 wob Diese beiden Antworten unterscheiden sich um 3,34E-5.>

1759317835

Anonymous

Ich habe kürzlich bemerkt, dass Scikit-Learn  PCA mit SVD_Solver = "Arpack"  verschiedene schwimmende Punktnummern zurückgibt, wenn ich die Reihenfolge der Beobachtungen in einem spärlichen Array ändere. Ist das ein erwartetes Verhalten? Vielen Dank im Voraus![code]import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
import scipy.sparse as sp

# Simulate a sparse gene expression array containing two datasets, dataset1 and 2, both containing 5000 observations
n_obs = 10000 # Total number of observations
n_features = 2000 # Total number of features

# Simulate a concatenated dataset with the order of dataset1 + dataset2
rng = np.random.default_rng(42)
X1 = rng.uniform(0, 5, size=(n_obs, n_features)).astype(np.float32)

# Change the order of the datasets so that it is in the form of dataset2 + dataset1
X2 = np.concatenate((X1[5000:,], X1[:5000,]), axis=0)

X1_sparse = sp.csr_matrix(X1)
X2_sparse = sp.csr_matrix(X2)
print("Matrix 1 shape:", X1_sparse.shape, "nnz:", X1_sparse.nnz)
print("Matrix 2 shape:", X2_sparse.shape, "nnz:", X2_sparse.nnz)

# PCA with ARPACK on X1
pca1 = PCA(n_components=20, svd_solver="arpack", random_state=321)
pcs1 = pca1.fit_transform(X1_sparse.toarray())

# PCA with ARPACK on X2
pca2 = PCA(n_components=20, svd_solver="arpack", random_state=321)
pcs2 = pca2.fit_transform(X2_sparse.toarray())

# Wrap in DataFrames with fake cell IDs
obs_names = [f"cell{i}" for i in range(n_obs)]
pcs1 = pd.DataFrame(pcs1, index=obs_names)
pcs2 = pd.DataFrame(pcs2, index=obs_names[5000:] + obs_names[0:5000])
pcs2 = pcs2.loc[pcs1.index,]

# Compare results
print("\nAre components numerically close (1e-6)?",
np.allclose(np.abs(pcs1), np.abs(pcs2), atol=1e-6))

< /code>
Ich hatte erwartet, dass zwei PCA -Arrays genau gleich sind. Zum Beispiel: PCS1.ILOC [0,0] [/code] Gibt: -2.9909344  wob Diese beiden Antworten unterscheiden sich um 3,34E-5.>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Diskrepanz zwischen ->created_at und ->value('created_at') in Laravel: Warum geben sie unterschiedliche Werte zurück?

Last post by Guest « 15 Jan 2025, 17:40
Posted in Php

by Guest » 15 Jan 2025, 17:40 » in Php

Ich habe in meiner Laravel 10 -Anwendung ein Problem, bei dem der Zugriff auf das Attribut „created_at direkt von einer Modellinstanz einen anderen Wert zurückgibt als bei Verwendung der...

0 Replies

26 Views

Last post by Guest
15 Jan 2025, 17:40
Warum gibt meine Davex -Verbindung unterschiedliche Ergebnisse zurück als meine RMI -Verbindung zu einem Remote -Jackrab

Last post by Guest « 16 Feb 2025, 10:27
Posted in Java

by Guest » 16 Feb 2025, 10:27 » in Java

Ich habe Jackrabbit 2.20.15 in einem Tomcat -Anwendungsserver. Die RMI -Unterstützung wird in neueren Releases veraltet/entfernt, sodass ich versuche, eine Verbindung zu einem Remote -Repository...

0 Replies

30 Views

Last post by Guest
16 Feb 2025, 10:27
Js-cookie gibt null zurück, aber Header geben die gesetzten Cookies zurück. Warum?

Last post by Guest « 14 Jan 2025, 13:28
Posted in JavaScript

by Guest » 14 Jan 2025, 13:28 » in JavaScript

import Cookies from 'js-cookie';
//this returns null
const authTokenFromCookies = Cookies.get('authToken');
console.log( AuthToken from cookies: , authTokenFromCookies);

// This returns the token...

0 Replies

32 Views

Last post by Guest
14 Jan 2025, 13:28
Wie setze ich eine Variable auf den Wert des Schlüssels eines Objekts, ohne dass dieser sich ändert, wenn sich der Wert

Last post by Guest « 27 Jan 2025, 06:14
Posted in JavaScript

by Guest » 27 Jan 2025, 06:14 » in JavaScript

function getSpecimenSummary(specimen) {
const dnaSeq = specimen.dnaSeq;
const evolution = simulateEvolution(specimen) //this function changes specimen.dnaSeq

return `DNA sequence: ${dnaSeq}...

0 Replies

28 Views

Last post by Guest
27 Jan 2025, 06:14
ScrollView Scroll -Position ändert sich nicht, wenn sich die Bildlauf -ID von einem anderen Scrollview geändert hat

Last post by Anonymous « 23 May 2025, 01:18
Posted in IOS

by Anonymous » 23 May 2025, 01:18 » in IOS

Konzept Ich versuche zu erstellen, ist zwei Scrollviews, die miteinander synchronisieren. Wenn sich die Position in einem Scrollview ändert (über das Scrolling), wird die Position in Second...

0 Replies

12 Views

Last post by Anonymous
23 May 2025, 01:18

Return to “Python”