Wie kann ich Float4 -Vektor mit Pycuda richtig an Kernel übergeben? - Programmiererforum

Wie kann ich Float4 -Vektor mit Pycuda richtig an Kernel übergeben? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Wie kann ich Float4 -Vektor mit Pycuda richtig an Kernel übergeben?

Report
Quote

Post by Anonymous » 08 Aug 2025, 03:08

Ich versuche, ein Float4 als Argument an meinen Cuda -Kernel (nach Wert) zu übergeben, indem ich Pycudas make_float4 () unter Verwendung von Pycuda übergeben kann. Aber es scheint eine Fehlausrichtung zu geben, wenn die Daten an den Kernel übertragen werden. Wenn ich die Ausgabe für einen Eingang (1,2,3,4) lese, bekomme ich stattdessen (3,4,0,0). Dies geschieht auch mit int4 , aber int3 und float3 funktionieren gut.

Code: Select all

# --- Minimal PyCUDA Test ---
import pycuda.driver as drv
import pycuda.compiler
import pycuda.gpuarray as gpa
import numpy as np
import pycuda.autoinit

minimal_kernel_code = """
__global__ void write_constant(
int* output,
const int4 test
) {
output[0] = test.x;
output[1] = test.y;
output[2] = test.z;
output[3] = test.w;
}
"""

module_test = pycuda.compiler.SourceModule(minimal_kernel_code)
write_constant_kernel = module_test.get_function("write_constant")

test_gpu_mem = drv.mem_alloc(4 * np.int32().nbytes)

write_constant_kernel(
test_gpu_mem,
gpa.vec.make_int4(1,2,3,4), # Constant value to write
block=(1, 1, 1),
grid=(1, 1)
)

test_cpu_mem = np.empty(4, dtype=np.int32)
drv.memcpy_dtoh(test_cpu_mem, test_gpu_mem)

print(test_cpu_mem)

Die erwartete Ausgabe wäre [1,2,3,4], aber es ist [3,4,0,0].

1754615338

Anonymous

Ich versuche, ein Float4 als Argument an meinen Cuda -Kernel (nach Wert) zu übergeben, indem ich Pycudas make_float4 ()  unter Verwendung von Pycuda [url=viewtopic.php?t=23808]übergeben[/url] kann. Aber es scheint eine Fehlausrichtung zu geben, wenn die Daten an den Kernel übertragen werden. Wenn ich die Ausgabe für einen Eingang (1,2,3,4) lese, bekomme ich stattdessen (3,4,0,0). Dies geschieht auch mit int4 , aber int3  und float3  funktionieren gut.[code]# --- Minimal PyCUDA Test ---
import pycuda.driver as drv
import pycuda.compiler
import pycuda.gpuarray as gpa
import numpy as np
import pycuda.autoinit

minimal_kernel_code = """
__global__ void write_constant(
int* output,
const int4 test
) {
output[0] = test.x;
output[1] = test.y;
output[2] = test.z;
output[3] = test.w;
}
"""

module_test = pycuda.compiler.SourceModule(minimal_kernel_code)
write_constant_kernel = module_test.get_function("write_constant")

test_gpu_mem = drv.mem_alloc(4 * np.int32().nbytes)

write_constant_kernel(
test_gpu_mem,
gpa.vec.make_int4(1,2,3,4), # Constant value to write
block=(1, 1, 1),
grid=(1, 1)
)

test_cpu_mem = np.empty(4, dtype=np.int32)
drv.memcpy_dtoh(test_cpu_mem, test_gpu_mem)

print(test_cpu_mem)
[/code]
Die erwartete Ausgabe wäre [1,2,3,4], aber es ist [3,4,0,0].

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie warte ich einen Kernel, um in einem anderen Kernel in Cuda fertig zu werden?

Last post by Guest « 12 Feb 2025, 08:37
Posted in C++

by Guest » 12 Feb 2025, 08:37 » in C++

Ich setze meine Erkundung bei der Verwendung von CUDA fort und stehe vor einem Problem mit Kernel. Ich rufe einen Kernel in einem anderen Kernel an und möchte schon vor dem Abschluss warten, um im...

0 Replies

22 Views

Last post by Guest
12 Feb 2025, 08:37
So rufen Sie IOCTL vom Kernel Space im Linux-Kernel nach Version 5.18 und für 64-Bit-Bogen an

Last post by Guest « 13 Feb 2025, 12:05
Posted in Linux

by Guest » 13 Feb 2025, 12:05 » in Linux

Guten Morgen,
Ich versuche, einen Linux -Geräte -Treiber aus der vorherigen Version (4.19) in den letzten Kerneln wieder aufzubauen, nämlich 6,1.22 auf eingebetteten Plattformen, ARM64 Arch.
Der...

0 Replies

19 Views

Last post by Guest
13 Feb 2025, 12:05
Wie kann man ein Objekt richtig klonen, das ein polymorphes Objekt enthält, das einen Vektor für mehr dieser polymorphen

Last post by Anonymous « 05 Apr 2025, 09:22
Posted in C++

by Anonymous » 05 Apr 2025, 09:22 » in C++

Ich bin auf C ++ 17 beschränkt. Ich muss eine Baumstruktur (nicht unbedingt binär) erstellen, die tief in 2 unabhängige Klone kopiert werden kann. Derzeit habe ich einen Schnittstellenknoten Klasse,...

0 Replies

15 Views

Last post by Anonymous
05 Apr 2025, 09:22
Wie verwende ich Socket Recv in Kombination mit STD :: Vektor Post C ++ 23?

Last post by Guest « 10 Feb 2025, 04:04
Posted in C++

by Guest » 10 Feb 2025, 04:04 » in C++

Es gab früher eine Methode zum Lesen von Daten aus einem Socket und Speichern der empfangenen Daten in einem std :: vector .
Ein solches Beispiel kann hier gefunden werden.
Für die Bequemlichkeit...

0 Replies

12 Views

Last post by Guest
10 Feb 2025, 04:04
Wie kann man einen benutzerdefinierten Vektor iterieren?

Last post by Anonymous « 09 Apr 2025, 22:33
Posted in C++

by Anonymous » 09 Apr 2025, 22:33 » in C++

Ich habe einige Werte in einem vorhandenen Vektor v . Kann mir jemand helfen zu wissen, wie man über Vektor V iteriert? Bitte beachten Sie, dass das Keyword für automatisch in meinem Compiler nicht...

0 Replies

17 Views

Last post by Anonymous
09 Apr 2025, 22:33

Return to “Python”