Optimale Funktion zum Scannen von Numpy -Matrix

Optimale Funktion zum Scannen von Numpy -Matrix ⇐ Python

1 post • Page 1 of 1

Anonymous

Optimale Funktion zum Scannen von Numpy -Matrix

Report
Quote

Post by Anonymous » 25 Aug 2025, 07:32

Ich habe ein binäres 2D -Numpy -Array, das Transaktionen und Elemente darstellt. Für Punkt I (als Spalten dargestellt) möchte ich die Gesamtzahl der Transaktionen (als Zeilen dargestellt) berechnen, die diesen Artikel gekauft haben, alle Artikel, die neben Punkt I gekauft wurden, und alle Transaktionen, die diesen Artikel zugeordnet sind. Dies geschieht, um Unterstützung, Vertrauen und Heben zwischen den Gegenständen zu berechnen. Meine aktuelle Implementierung verwendet eine verschachtelte Schleife, dauert jedoch zu lange für einen großen Datensatz. Gibt es eine Möglichkeit, eine Matrix optimal zu scannen, wenn ich jedes Mal die Gesamtheit scannen muss? < /P>
Hier ist mein Code mit einem Beispielarray.

Code: Select all

import numpy as np
results = []
data = np.array([[0,1,0,1],[1,1,0,1],[0,0,0,1],[1,1,1,1]])
N = data.shape[0] #total transactions
for i in range(4): # for each item i
#transactions% where item i was purchased
mask_i = data[:,i] == 1
support_i = data[mask_i].shape[0]/N
for j in range(4): # check all items j
#transactions where both i and j are purchased
mask_j = data[:,j] == 1
support_j = data[mask_j].shape[0]/N #transactions% where j is purchased
mask_c = np.logical_and(mask_i,mask_j) # mask for where both i and j were purchased
confidence = (data[mask_c].shape[0]/N) / support_i
lift = confidence/support_j
results.append([i,j,confidence,lift]) #store combination
< /code>
Die Ergebnisliste zeigt jede identifizierte Kombination von Elementen mit anderen Elementen an. < /p>
[[0, 0, 1.0, 2.0], [0, 1, 1.0, 1.3333333333333333], [0, 2, 0.5, 2.0], [0, 3, 1.0, 1.0], [1, 0, 0.6666666666666666, 1.3333333333333333], [1, 1, 1.0, 1.3333333333333333], [1, 2, 0.3333333333333333, 1.3333333333333333], [1, 3, 1.0, 1.0], [2, 0, 1.0, 2.0], [2, 1, 1.0, 1.3333333333333333], [2, 2, 1.0, 4.0], [2, 3, 1.0, 1.0], [3, 0, 0.5, 1.0], [3, 1, 0.75, 1.0], [3, 2, 0.25, 1.0], [3, 3, 1.0, 1.0]]

1756099925

Anonymous

Ich habe ein binäres 2D -Numpy -Array, das Transaktionen und Elemente darstellt. Für Punkt I (als Spalten dargestellt) möchte ich die Gesamtzahl der Transaktionen (als Zeilen dargestellt) berechnen, die diesen Artikel gekauft haben, alle Artikel, die neben Punkt I gekauft wurden, und alle Transaktionen, die diesen Artikel zugeordnet sind. Dies geschieht, um Unterstützung, Vertrauen und Heben zwischen den Gegenständen zu berechnen. Meine aktuelle Implementierung verwendet eine verschachtelte Schleife, dauert jedoch zu lange für einen großen Datensatz. Gibt es eine Möglichkeit, eine Matrix optimal zu scannen, wenn ich jedes Mal die Gesamtheit scannen muss? < /P>
Hier ist mein Code mit einem Beispielarray.[code]import numpy as np
results = []
data = np.array([[0,1,0,1],[1,1,0,1],[0,0,0,1],[1,1,1,1]])
N = data.shape[0] #total transactions
for i in range(4): # for each item i
#transactions% where item i was purchased
mask_i = data[:,i] == 1
support_i = data[mask_i].shape[0]/N
for j in range(4): # check all items j
#transactions where both i and j are purchased
mask_j = data[:,j] == 1
support_j = data[mask_j].shape[0]/N #transactions% where j is purchased
mask_c = np.logical_and(mask_i,mask_j) # mask for where both i and j were purchased
confidence = (data[mask_c].shape[0]/N) / support_i
lift = confidence/support_j
results.append([i,j,confidence,lift]) #store combination
< /code>
Die Ergebnisliste zeigt jede identifizierte Kombination von Elementen mit anderen Elementen an. < /p>
[[0, 0, 1.0, 2.0], [0, 1, 1.0, 1.3333333333333333], [0, 2, 0.5, 2.0], [0, 3, 1.0, 1.0], [1, 0, 0.6666666666666666, 1.3333333333333333], [1, 1, 1.0, 1.3333333333333333], [1, 2, 0.3333333333333333, 1.3333333333333333], [1, 3, 1.0, 1.0], [2, 0, 1.0, 2.0], [2, 1, 1.0, 1.3333333333333333], [2, 2, 1.0, 4.0], [2, 3, 1.0, 1.0], [3, 0, 0.5, 1.0], [3, 1, 0.75, 1.0], [3, 2, 0.25, 1.0], [3, 3, 1.0, 1.0]]
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Warum ist der Aufbau einer spärlichen Matrix langsamer als der Aufbau einer dichten (vollständigen) Matrix?

Last post by Guest « 20 Jan 2025, 18:43
Posted in Python

by Guest » 20 Jan 2025, 18:43 » in Python

Ich habe zwei Funktionen (i) getKglobal und (ii) getKglobal_Sp. Allerdings ist die Zeit für die Sparse-Funktion etwa fünfmal langsamer als für die Fullmatrix-Formulierung. Ich verstehe, dass es...

0 Replies

71 Views

Last post by Guest
20 Jan 2025, 18:43
Was ist die optimale Datenstruktur zum Speichern von Objekten mit einem String-Schlüssel und einem Bool-Hilfswert?

Last post by Anonymous « 27 Nov 2025, 22:52
Posted in C#

by Anonymous » 27 Nov 2025, 22:52 » in C#

Ich benötige eine Datenstruktur wie unten, aber ich muss in der Lage sein, den Bool-Wert zu ändern. Die anderen beiden bleiben so, wie sie bei der Initialisierung waren. Was würden Sie für die beste...

0 Replies

14 Views

Last post by Anonymous
27 Nov 2025, 22:52
Regex zum Scannen von E -Mail -Adressen in E -Mail -Körper funktioniert nicht nach der Migration von Exchange auf O365

Last post by Anonymous « 05 Sep 2025, 02:41
Posted in C#

by Anonymous » 05 Sep 2025, 02:41 » in C#

Die folgende Regex wird verwendet, um E -Mail -Adressen in E -Mail -Körper zu holen. +@ +\. {2,}

Nach der Migration funktioniert der obige Regex nicht mehr.>

0 Replies

86 Views

Last post by Anonymous
05 Sep 2025, 02:41
Wie verwenden wir Numpy, um eine Matrix aller Permutationen von drei separaten Wertebereichen zu erstellen?

Last post by Anonymous « 18 Apr 2025, 02:17
Posted in Python

by Anonymous » 18 Apr 2025, 02:17 » in Python

Ich möchte einen Pandas -Datenframe mit drei Spalten erstellen, so dass die Zeilen alle Permutationen von drei Spalten enthalten, die jeweils einen eigenen Wertebereich enthalten. Außerdem möchte ich...

0 Replies

38 Views

Last post by Anonymous
18 Apr 2025, 02:17
Wie bekomme ich die optimale Anzahl von Clustern mithilfe einer hierarchischen Clusteranalyse automatisch in Python?

Last post by Anonymous « 01 Jul 2025, 12:01
Posted in Python

by Anonymous » 01 Jul 2025, 12:01 » in Python

Ich möchte hierarchische Clusteranalyse verwenden, um die optimale Zahl (k) der Cluster automatisch zu erhalten, und wenden Sie dieses k auf k-mittlere Clustering in Python an.

Nach dem Studium...

0 Replies

23 Views

Last post by Anonymous
01 Jul 2025, 12:01

Return to “Python”