Was ist der schnellste Weg, um gleichmäßige und seltsame Indizes mit AVX2 zu spalten? - Programmiererforum

Was ist der schnellste Weg, um gleichmäßige und seltsame Indizes mit AVX2 zu spalten? ⇐ C++

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Was ist der schnellste Weg, um gleichmäßige und seltsame Indizes mit AVX2 zu spalten?

Report
Quote

Post by Anonymous » 04 Mar 2025, 04:45

Zum Beispiel mit welchen Intel AVX/SSE -Intrinsik kann ich eine Reihe komplexer Zahlen in zwei Arrays von realen und imaginären Teilen aufzeigen? 8.0, ...] < /p>
Welche Anweisungen maximieren den Durchsatz für die Durchführung dieser Spaltung? (Duplikat von echten und imaginären Teilen komplexer Zahlen in separate YMM -Register , es sei denn, es gibt etwas Besseres als das, was diese Q & A entwickelt haben.) /> Ich schreibe eine kleine FFT -Bibliothek. Deinterleaving taucht zweimal auf. Bei der Implementierung von Radix-2 und Radix-4 taucht die Deeinterleaving auf, wenn die Bühnenlänge geringer ist als die SIMD-Operandenlänge. Die Deinterleaving ist auch nützlich, um die komplexe Zahl in reale und imaginäre Komponenten zu trennen, sodass der Eingang mit separaten Arrays von realen /imaginären Teilen effizienter verarbeitet werden kann. Ich bin ziemlich verwirrt, warum es für AVX keine äquivalente Anweisung gibt, da diese Anweisung nützlich ist. Und packen Sie 3-mal pro Spur mit 256-Bit-Breitenvektor von 32-Bit-Schwimmer für einen Durchsatz von 3 Zyklen pro Vektor aus. Kann ich es besser machen?

1741059956

Anonymous

Zum Beispiel mit welchen Intel AVX/SSE -Intrinsik kann ich eine Reihe komplexer Zahlen in zwei Arrays von realen und imaginären [url=viewtopic.php?t=13628]Teilen[/url] aufzeigen? 8.0, ...] < /p>
Welche Anweisungen maximieren den Durchsatz für die Durchführung dieser Spaltung? (Duplikat von  echten und imaginären [url=viewtopic.php?t=13628]Teilen[/url] komplexer Zahlen in separate YMM -Register , es sei denn, es gibt etwas Besseres als das, was diese Q & A entwickelt haben.) />  Ich schreibe eine kleine FFT -Bibliothek. Deinterleaving taucht zweimal auf. Bei der Implementierung von Radix-2 und Radix-4 taucht die Deeinterleaving auf, wenn die Bühnenlänge geringer ist als die SIMD-Operandenlänge. Die Deinterleaving ist auch nützlich, um die komplexe Zahl in reale und imaginäre Komponenten zu trennen, sodass der Eingang mit separaten Arrays von realen /imaginären [url=viewtopic.php?t=13628]Teilen[/url] effizienter verarbeitet werden kann. Ich bin ziemlich verwirrt, warum es für AVX keine äquivalente Anweisung gibt, da diese Anweisung nützlich ist. Und packen Sie  3-mal pro Spur mit 256-Bit-Breitenvektor von 32-Bit-Schwimmer für einen Durchsatz von 3 Zyklen pro Vektor aus. Kann ich es besser machen?

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Was ist der schnellste Weg, um Indizes für den Zugriff auf das rechte Dreieck der Hälfte eines quadratischen Arrays zu g

Last post by Anonymous « 11 Apr 2025, 13:17
Posted in Python

by Anonymous » 11 Apr 2025, 13:17 » in Python

Bei einem 2D -Numpy -Array mit gleicher Höhe und Breite sind die Höhe und Breite garantiert gleich, und so ist das Array ein Quadrat. /> Ich habe Funktionen implementiert, die viel effizienter als...

0 Replies

55 Views

Last post by Anonymous
11 Apr 2025, 13:17
KI in Java geschrieben, das gleichmäßige und seltsame Zahlen klassifiziert

Last post by Guest « 05 Feb 2025, 03:47
Posted in Java

by Guest » 05 Feb 2025, 03:47 » in Java

Ich habe derzeit neuronale Netzwerke studiert und als Praxis habe ich versucht, ein Modell zu machen, das Zahlen klassifiziert. Es dauert Zahlen als Eingänge und gibt eine 1 aus, wenn die Zahl gerade...

0 Replies

35 Views

Last post by Guest
05 Feb 2025, 03:47
Was ist der einfachste und schnellste Weg, um zu überprüfen, ob eine Zeichenfolge ein Bcrypt -Hash ist?

Last post by Anonymous « 14 Apr 2025, 21:21
Posted in Php

by Anonymous » 14 Apr 2025, 21:21 » in Php

Ich schreibe einen Unit -Test, der besagt, dass Benutzerkennwörter mit BCRYPT gehasht werden sollten. Um dies zu behaupten, muss ich überprüfen, ob eine Zeichenfolge wie ein Bcrypt -Hash aussieht.

0 Replies

34 Views

Last post by Anonymous
14 Apr 2025, 21:21
Was ist der schnellste Weg, um alle N-Bit-Graucodes mit Numpy zu erzeugen?

Last post by Anonymous « 12 Mar 2025, 02:07
Posted in Python

by Anonymous » 12 Mar 2025, 02:07 » in Python

My goal is to create images using gray codes, an example would be this:

It is all modulo 64 groups in gray codes in polar form.
Now of Natürlich kenne ich die einfache Zuordnung n ^ (n >> 1) aus...

0 Replies

37 Views

Last post by Anonymous
12 Mar 2025, 02:07
Was ist der schnellste Weg, um eine Untergruppe von JSON mit Jackson abzurufen?

Last post by Anonymous « 05 Apr 2025, 12:39
Posted in Java

by Anonymous » 05 Apr 2025, 12:39 » in Java

Nehmen wir an, ich bearbeite große JSON -Nutzlasten, aber ich kümmere mich nur um eine kleine Untergruppe ihrer Eigenschaften. In diesem Szenario wäre die Deserialisierung des Ganzen eine Zeit- und...

0 Replies

26 Views

Last post by Anonymous
05 Apr 2025, 12:39

Return to “C++”