Spark SQL nicht in oder nicht existiert

Spark SQL nicht in oder nicht existiert ⇐ Java

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Post by Anonymous » 12 Feb 2025, 03:01

Ich habe ein Szenario, in dem es zwei Blätter gibt (CSV). Es wurde zwei Tabellen dafür erstellt.
Wenn es gute Daten gibt, könnte ich sie mit einem Wert (ID -Statistikwert) aus der zweiten Tabelle abbilden. Wenn ich schlechte Daten habe, sollte ich sie erneut mit dem iD -statistischen Wert zuordnen (aber einem anderen Wert). Ich kann jedoch nicht in Spark SQL verwendet werden. Und ich erhalte den Fehler unten: < /p>

Nichtübereinstimmende Eingabe 'von' Erwartung {, 'wo', 'gruppe', 'order', 'haben', 'limit',. "Lateral", "Fenster", "Vereinigung", "außer", "Schnittpunkt", "Sort", "Cluster", "Distribute"} (Zeile 1, POS 386) < /p>

at org.apache.spark.sql.catalyst.parser.ParseException.withCommand(ParseDriver.scala:197)
at org.apache.spark.sql.catalyst.parser.AbstractSqlParser.parse(ParseDriver.scala:99)
at org.apache.spark.sql.execution.SparkSqlParser.parse(SparkSqlParser.scala:45)
< /code>

Code: < /p>

select
a.ptf_id,a.ptf_code,a.share_id,a.share_code,a.bench_id,a.bench_code
, a.l1_calculation_date,a.l1_begin_date,a.l1_end_date,a.l1_running_date
, a.l1_frequency,a.l1_calculation_step,a.l1_performance_currency
, a.l1_configuration,a.l1_valuation_source,a.l1_nav_valuation_type
, a.l1_setting_reference_type, a.l1_setting_valuation_type
, a.l1_sharpe_ratio_annualized as value,b.id_statistic
from
parquetFile a,
pairRDD b,
stats c
where
a.l1_nav_valuation_type= b.l1_nav_valuation_type
and a.l1_valuation_source = b.l1_valuation_source
and b.l1_Perf = 'l1_sharpe_ratio_annualized'
OR (a.ptf_id not EXISTS (
select e.ptf_id from pairRDD d, parquetFile e
where d.l1_valuation_source = e.l1_valuation_source
AND d.l1_nav_valuation_type = e.l1_nav_valuation_type)
and b.l1_valuation_source ='')
< /code>

Diese Abfrage funktioniert in SQL, wenn ich "nicht in"
benutze, bitte helfen Sie mir, welche anderen Optionen in diesem Szenario als nicht existiert. < / P>

1739325680

Anonymous

Ich habe ein Szenario, in dem es zwei Blätter gibt (CSV). Es wurde zwei Tabellen dafür erstellt.
Wenn es gute Daten gibt, könnte ich sie mit einem Wert (ID -Statistikwert) aus der zweiten Tabelle abbilden. Wenn ich schlechte Daten habe, sollte ich sie erneut mit dem iD -statistischen Wert zuordnen (aber einem anderen Wert). Ich kann jedoch nicht in Spark SQL verwendet werden. Und ich erhalte den Fehler unten: < /p>

Nichtübereinstimmende Eingabe 'von' Erwartung {, 'wo', 'gruppe', 'order', 'haben', 'limit',. "Lateral", "Fenster", "Vereinigung", "außer", "Schnittpunkt", "Sort", "Cluster", "Distribute"} (Zeile 1, POS 386) < /p>

at org.apache.spark.sql.catalyst.parser.ParseException.withCommand(ParseDriver.scala:197)
at org.apache.spark.sql.catalyst.parser.AbstractSqlParser.parse(ParseDriver.scala:99)
at org.apache.spark.sql.execution.SparkSqlParser.parse(SparkSqlParser.scala:45)
< /code>



Code: < /p>

select
a.ptf_id,a.ptf_code,a.share_id,a.share_code,a.bench_id,a.bench_code
, a.l1_calculation_date,a.l1_begin_date,a.l1_end_date,a.l1_running_date
, a.l1_frequency,a.l1_calculation_step,a.l1_performance_currency
, a.l1_configuration,a.l1_valuation_source,a.l1_nav_valuation_type
, a.l1_setting_reference_type, a.l1_setting_valuation_type
, a.l1_sharpe_ratio_annualized as value,b.id_statistic
from
parquetFile a,
pairRDD b,
stats c
where
a.l1_nav_valuation_type= b.l1_nav_valuation_type
and a.l1_valuation_source = b.l1_valuation_source
and b.l1_Perf = 'l1_sharpe_ratio_annualized'
OR (a.ptf_id not EXISTS (
select e.ptf_id from pairRDD d, parquetFile e
where d.l1_valuation_source = e.l1_valuation_source
AND d.l1_nav_valuation_type = e.l1_nav_valuation_type)
and b.l1_valuation_source ='')
< /code>

Diese Abfrage funktioniert in SQL, wenn ich "nicht in"
benutze, bitte helfen Sie mir, welche anderen Optionen in diesem Szenario als nicht existiert. < / P>

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Fehler: Spark User hat den Spark -Kontext nicht initialisiert

Last post by Anonymous « 13 May 2025, 04:16
Posted in Python

by Anonymous » 13 May 2025, 04:16 » in Python

Ich bekomme diesen Fehler vom Spark mit Hadoop und PySpark
ApplicationMaster: Waiting for spark context initialization...
25/05/12 23:56:11 INFO ApplicationMaster: Final app status: FAILED,...

0 Replies

14 Views

Last post by Anonymous
13 May 2025, 04:16
Ist es möglich, Daten von Spark Executors in Java Spark zu schreiben?

Last post by Anonymous « 27 Mar 2025, 15:45
Posted in Java

by Anonymous » 27 Mar 2025, 15:45 » in Java

Ich habe eine Java -Spark -Anwendung, die Daten von Kafka erhält, einige Arbeiten an den Daten ausführt und dann mit dem Befehl toundswrite () Parquetdateien in S3 speichert. Bis zu diesem Zeitpunkt...

0 Replies

18 Views

Last post by Anonymous
27 Mar 2025, 15:45
Ist es möglich, Daten von Spark Executors in Java Spark zu schreiben?

Last post by Anonymous « 02 Apr 2025, 12:13
Posted in Java

by Anonymous » 02 Apr 2025, 12:13 » in Java

Ich habe eine Java -Spark -Anwendung, die Daten von Kafka erhält, einige Arbeiten an den Daten ausführt und dann mit dem Befehl toundswrite () Parquetdateien in S3 speichert. Bis zu diesem Zeitpunkt...

0 Replies

15 Views

Last post by Anonymous
02 Apr 2025, 12:13
Anhänge an Delta -Tabellen im Stoff mit Spark VS ohne Spark

Last post by Anonymous « 10 Apr 2025, 12:53
Posted in Python

by Anonymous » 10 Apr 2025, 12:53 » in Python

Ich bin neu im Stoff und habe ein paar Udemy -Kurse durchgeführt. Ich bin mir jedoch nicht sicher, wie ich dieses Problem angehen soll. Die Transformationen sind kleine, umgebende Spalten...

0 Replies

15 Views

Last post by Anonymous
10 Apr 2025, 12:53
Spark SQL interpretiert ein datetime.date -Objekt als mathematische Formel oder Ganzzahl in der Anweisung

Last post by Anonymous « 13 Feb 2025, 23:06
Posted in Python

by Anonymous » 13 Feb 2025, 23:06 » in Python

Ich habe ein Problem in Spark SQL gestoßen. Es interpretiert ein datetime.date Objekt als mathematische Formel oder Ganzzahl in einer SQL-Anweisung, die ich schreibe. currentDateAndTime =...

0 Replies

12 Views

Last post by Anonymous
13 Feb 2025, 23:06

Return to “Java”