So verwenden Sie Streams, um Blöcke im JPA-Datenstrom zu verarbeiten

So verwenden Sie Streams, um Blöcke im JPA-Datenstrom zu verarbeiten ⇐ Java

1 post • Page 1 of 1

Anonymous

So verwenden Sie Streams, um Blöcke im JPA-Datenstrom zu verarbeiten

Report
Quote

Post by Anonymous » 28 Nov 2025, 22:16

In Spring Boot 2.7 ist das Zurückstreamen von Ergebnissen aus einer Datenbankabfrage und deren stapelweise Verarbeitung mithilfe von JDBC sehr einfach:

Code: Select all

   try (PreparedStatement ps = conn.prepareStatement(MY_SQL)) {
ps.setFetchSize(100);
ResultSet rs = ps.executeQuery();
do {
List chunk = new ArrayList();
while (rs.next() && (rowsReadInThisBatch < myBatchSize)) {
MyEntity entity = new MyEntity();
myEntity.setSomeCol(rs.getLong("some_col");
myEntity.setSomeCol2(rs.getLong("some_col2");
chunk.add(entity)
rowsReadInThisBatch++;
}
// lost more code.
process(chunk);
writeBackToDB(cunk);
// lots more code
} while (rowsReadInThisBatch == myBatchSize);

Die Datenbanktabelle hat > 1 Million Zeilen, daher können wir sie nicht einfach alle in ein einziges 1-Million-Zeilen-Objekt einlesen, da unsere Produktions-Microservice-Server nur über 1 GB RAM verfügen. Im obigen Beispiel haben wir immer nur myBatchSize-Datensätze im RAM und müssen nur total/myBatchSize-Batch-Einfügungen in die Datenbank durchführen (nicht eine Einfügung für jeden Datensatz, was zu 1 Million Roundtrips zur DB führen würde).
Um dies mit Streams in JPA zu tun, gibt es kein Äquivalent zu rs.next(). Stattdessen müssen Sie Lambdas und Java-Streams verwenden.
Es gibt ForEach:

Code: Select all

    try(Stream myStream = postRepository.streamByCreatedOnSince(yesterday)) {
myStream.forEach(
....
);
}

forEach ist jedoch äußerst eingeschränkt, da Sie keine nicht endgültigen Variablen verwenden können, um zu zählen, wie viele verarbeitet wurden usw.
Wie konvertiere ich meine einfachen alten do-Schleifen und while-Schleifen in Javas Streams/Lambda-Sachen, um Chunks einzulesen und Chunks zu verarbeiten und nicht jeden einzeln ohne Chunking zu verarbeiten? Idealerweise keinen Inline-Lambda-Code verwenden, der schwer separat zu testen ist (und für Nicht-Java-Streams-Experten schwer zu verstehen ist)?
Der Knackpunkt ist, dass Java-Streams nicht über das Konzept eines Zählers oder Chunking verfügen.
Dieser Artikel: https://www.baeldung.com/java-stream-batch-processing enthält einige sehr esoterische Lösungen, die zusätzliche Bibliotheken erfordern, die wir vermeiden möchten. Außerdem ist nicht klar, ob ihre Lösungen den gesamten Stream in den Speicher einlesen und ihn dann in Blöcke oder Stapel aufteilen, was wir aufgrund des sehr großen Datensatzes vermeiden möchten.

1764364563

Anonymous

In Spring Boot 2.7 ist das Zurückstreamen von Ergebnissen aus einer Datenbankabfrage und deren stapelweise Verarbeitung mithilfe von JDBC sehr einfach:
[code]   try (PreparedStatement ps = conn.prepareStatement(MY_SQL)) {
ps.setFetchSize(100);
ResultSet rs = ps.executeQuery();
do {
List chunk = new ArrayList();
while (rs.next() && (rowsReadInThisBatch < myBatchSize)) {
MyEntity entity = new MyEntity();
myEntity.setSomeCol(rs.getLong("some_col");
myEntity.setSomeCol2(rs.getLong("some_col2");
chunk.add(entity)
rowsReadInThisBatch++;
}
// lost more code.
process(chunk);
writeBackToDB(cunk);
// lots more code
} while (rowsReadInThisBatch == myBatchSize);
[/code]
Die Datenbanktabelle hat > 1 Million Zeilen, daher können wir sie nicht einfach alle in ein einziges 1-Million-Zeilen-Objekt einlesen, da unsere Produktions-Microservice-Server nur über 1 GB RAM verfügen. Im obigen Beispiel haben wir immer nur myBatchSize-Datensätze im RAM und müssen nur total/myBatchSize-Batch-Einfügungen in die Datenbank durchführen (nicht eine Einfügung für jeden Datensatz, was zu 1 Million Roundtrips zur DB führen würde).
Um dies mit Streams in JPA zu tun, gibt es kein Äquivalent zu rs.next(). Stattdessen müssen Sie Lambdas und Java-Streams verwenden.
Es gibt ForEach:
[code]    try(Stream myStream = postRepository.streamByCreatedOnSince(yesterday)) {
myStream.forEach(
....
);
}
[/code]
forEach ist jedoch äußerst eingeschränkt, da Sie keine nicht endgültigen Variablen verwenden können, um zu zählen, wie viele verarbeitet wurden usw.
Wie konvertiere ich meine einfachen alten do-Schleifen und while-Schleifen in Javas Streams/Lambda-Sachen, um Chunks einzulesen und Chunks zu verarbeiten und nicht jeden einzeln ohne Chunking zu verarbeiten? Idealerweise keinen Inline-Lambda-Code verwenden, der schwer separat zu testen ist (und für Nicht-Java-Streams-Experten schwer zu verstehen ist)?
Der Knackpunkt ist, dass Java-Streams nicht über das Konzept eines Zählers oder Chunking verfügen.
Dieser Artikel: https://www.baeldung.com/java-stream-batch-processing enthält einige sehr esoterische Lösungen, die zusätzliche Bibliotheken erfordern, die wir [url=viewtopic.php?t=15143]vermeiden[/url] möchten. Außerdem ist nicht klar, ob ihre Lösungen den gesamten Stream in den Speicher einlesen und ihn dann in Blöcke oder Stapel aufteilen, was wir aufgrund des sehr großen Datensatzes [url=viewtopic.php?t=15143]vermeiden[/url] möchten.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie kann ich Kinesis Video -Streams -Fragmente richtig lesen und verarbeiten?

Last post by Anonymous « 20 Mar 2025, 23:48
Posted in Python

by Anonymous » 20 Mar 2025, 23:48 » in Python

Ich arbeite an der Verarbeitung von Echtzeit-Audio von Amazon Connect, indem ich Fragmente aus Kinesis-Video-Streams abhebt und auf S3 speichert. Die MKV -Datei, die ich in S3 exportiert, ist jedoch...

0 Replies

12 Views

Last post by Anonymous
20 Mar 2025, 23:48
So reservieren Sie Platz für reaktionsschnelle IMG (Stoppen Sie die Blöcke, die nach unten springen)

Last post by Anonymous « 09 Mar 2025, 12:53
Posted in HTML

by Anonymous » 09 Mar 2025, 12:53 » in HTML

Wie löst ich ein Problem des Abspringens von Blöcken nach dem Bildlast, wenn das Bild reagieren sollte? Bildgröße
JS kann verwendet werden

Idee:
Wenn es ohne Bildgrößendaten nicht möglich ist,...

0 Replies

18 Views

Last post by Anonymous
09 Mar 2025, 12:53
So reservieren Sie Platz für reaktionsschnelle IMG (Stoppen Sie die Blöcke, die nach unten springen)

Last post by Anonymous « 09 Mar 2025, 12:53
Posted in CSS

by Anonymous » 09 Mar 2025, 12:53 » in CSS

Wie löst ich ein Problem des Abspringens von Blöcken nach dem Bildlast, wenn das Bild reagieren sollte? Bildgröße
JS kann verwendet werden

Idee:
Wenn es ohne Bildgrößendaten nicht möglich ist,...

0 Replies

20 Views

Last post by Anonymous
09 Mar 2025, 12:53
GroupingBy in Streams with scallingandthen -Methode -> So entfernen Sie optional und verwenden Sie Max auf der Karte :)

Last post by Anonymous « 04 Feb 2025, 22:54
Posted in Java

by Anonymous » 04 Feb 2025, 22:54 » in Java

scheint die Konzepte von Gruppingby & Collectors & Sorting nicht ganz zu verstehen. Erhalten Sie dann eine Kategorie mit maximaler Menge und drucken Sie es auf dem Bild als Einzelkartenzeile mit Top...

0 Replies

13 Views

Last post by Anonymous
04 Feb 2025, 22:54
Holen Sie sich WooCommerce Custom Payment Gateway -Werte in Process_Payment -Funktion für Blöcke Kasse

Last post by Anonymous « 27 Feb 2025, 08:15
Posted in Php

by Anonymous » 27 Feb 2025, 08:15 » in Php

Ich erstelle benutzerdefiniertes Zahlungs -Plugin für WooCommerce. Ich habe Probleme, während ich die Daten zum Checkout -Formular in Process_Payment Funktion der WooCommerce -Zahlungsklasse...

0 Replies

27 Views

Last post by Anonymous
27 Feb 2025, 08:15

Return to “Java”