Spark Declarative Pipelines (SDP) – TABLE_OR_VIEW_NOT_FOUND für Upstream-Tabelle, obwohl sie definiert ist

Spark Declarative Pipelines (SDP) – TABLE_OR_VIEW_NOT_FOUND für Upstream-Tabelle, obwohl sie definiert ist ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Spark Declarative Pipelines (SDP) – TABLE_OR_VIEW_NOT_FOUND für Upstream-Tabelle, obwohl sie definiert ist

Report
Quote

Post by Anonymous » 09 Jan 2026, 13:15

Ich versuche, Spark Declarative Pipelines (Spark 4.0 / pyspark.pipelines) lokal mithilfe der Spark-Pipelines-CLI zu erlernen.
Ich habe eine einfache Bronze → Silver → Gold-Pipeline, aber ich erhalte ständig Folgendes:

pyspark.errors.Exceptions.connect.AnalysisException:
[TABLE_OR_VIEW_NOT_FOUND] Die Tabelle oder Ansicht „bronze_raw“ kann nicht gefunden werden

obwohl bronze_raw mit @sdp.table definiert ist.

Code: Select all

Environment
•   Spark: 4.1.0
•   PySpark
•   Spark Connect (used implicitly by spark-pipelines)
•   Local machine (macOS)
•   Running with: spark-pipelines run pipeline.yml

Folgend sind die beiden Dateien in meinem Arbeitsordner, keine Unterordner.
Pipeline-Spezifikation:pipeline.yml

Code: Select all

name: bronze_silver_gold_pipeline

storage:
root: file:///tmp/spark-pipelines/bronze_silver_gold_pipeline

libraries:
- glob:
include: "pipeline_definitions.py"

Pipeline-Definitionen: (pipeline_defiitions.py)

Code: Select all

from pyspark import pipelines as sdp
import pyspark.sql.functions as F
spark = SparkSession.active()
# Bronze Layer
@sdp.table(name="bronze_raw")
def bronze_raw():
return (
spark.read
.option("header", True)
.csv("file:///Users/abhisheknarayanchaudhury/Desktop/Spark Learning/dirty_data_2.csv")
)

# Silver Layer
@sdp.materialized_view(name="silver_cleaned")
def silver_cleaned():
df_bronze = spark.table("bronze_raw")

df = (
df_bronze
.withColumn("rn", F.monotonically_increasing_id())
.filter(F.col("rn") > 1)
.drop("rn")
)

return df

# Gold Layer
@sdp.materialized_view(name="gold_unpivoted")
def gold_unpivoted():
df_silver = spark.table("silver_cleaned")
return df_silver

Fehlermeldung:

AnalysisException: [TABLE_OR_VIEW_NOT_FOUND]
Die Tabelle oder Ansicht „bronze_raw“ wurde nicht gefunden.
'UnresolvedRelation [bronze_raw]

Der Fehler tritt während der Pipeline auf Registrierung,
Was ich bereits versucht habe
• Definieren von bronze_raw mit @sdp.table
• Sicherstellen absoluter Dateipfade für CSV
• Entfernen von SparkSession.builder und SparkSession.getActiveSession()
• Verwenden von spark.table("bronze_raw") für Downstream Abhängigkeiten
Trotzdem kann silver_cleaned bronze_raw nicht auflösen.
Frage

Was ist der richtige Weg, um Upstream-Tabellen in Spark Declarative Pipelines zu referenzieren?
Ist spark.table("bronze_raw") der richtige Ansatz?
Gibt es etwas Bestimmtes am Spark Connect- oder SDP-Ausführungskontext, das diesen Fehler verursacht?
Gibt es zusätzliche Anforderungen für die Deklaration oder Materialisierung von Upstream-Tabellen? Jedes minimale Arbeitsbeispiel oder jede Erklärung des Ausführungsmodells wäre sehr hilfreich.

Erwartetes Verhalten: Spark-Pipelines sollten bronze_raw als Upstream-Abhängigkeit erkennen und silver_cleaned erlauben, darauf zu verweisen.

1767960936

Anonymous

Ich versuche, [b]Spark Declarative Pipelines (Spark 4.0 / pyspark.pipelines)[/b] lokal mithilfe der Spark-Pipelines-CLI zu erlernen.
Ich habe eine einfache [b]Bronze → Silver → Gold[/b]-Pipeline, aber ich erhalte ständig Folgendes:

pyspark.errors.Exceptions.connect.AnalysisException:
[TABLE_OR_VIEW_NOT_FOUND] Die Tabelle oder Ansicht „bronze_raw“ kann [url=viewtopic.php?t=22532]nicht gefunden[/url] werden

obwohl bronze_raw mit @sdp.table definiert ist.
[code]Environment
•   Spark: 4.1.0
•   PySpark
•   Spark Connect (used implicitly by spark-pipelines)
•   Local machine (macOS)
•   Running with: spark-pipelines run pipeline.yml
[/code]
Folgend sind die beiden Dateien in meinem Arbeitsordner, keine Unterordner.
[b]Pipeline-Spezifikation[/b]:pipeline.yml
[code]name: bronze_silver_gold_pipeline

storage:
root: file:///tmp/spark-pipelines/bronze_silver_gold_pipeline

libraries:
- glob:
include: "pipeline_definitions.py"
[/code]
[b]Pipeline-Definitionen[/b]: (pipeline_defiitions.py)
[code]from pyspark import pipelines as sdp
import pyspark.sql.functions as F
spark = SparkSession.active()
# Bronze Layer
@sdp.table(name="bronze_raw")
def bronze_raw():
return (
spark.read
.option("header", True)
.csv("file:///Users/abhisheknarayanchaudhury/Desktop/Spark Learning/dirty_data_2.csv")
)

# Silver Layer
@sdp.materialized_view(name="silver_cleaned")
def silver_cleaned():
df_bronze = spark.table("bronze_raw")

df = (
df_bronze
.withColumn("rn", F.monotonically_increasing_id())
.filter(F.col("rn") > 1)
.drop("rn")
)

return df

# Gold Layer
@sdp.materialized_view(name="gold_unpivoted")
def gold_unpivoted():
df_silver = spark.table("silver_cleaned")
return df_silver
[/code]
[b]Fehlermeldung:[/b]

AnalysisException: [TABLE_OR_VIEW_NOT_FOUND]
Die Tabelle oder Ansicht „bronze_raw“ wurde nicht gefunden.
'UnresolvedRelation [bronze_raw]

Der Fehler tritt während der Pipeline auf Registrierung,
[b]Was ich bereits versucht habe[/b]
• Definieren von bronze_raw mit @sdp.table
• Sicherstellen absoluter Dateipfade für CSV
• Entfernen von SparkSession.builder und SparkSession.getActiveSession()
• Verwenden von spark.table("bronze_raw") für Downstream Abhängigkeiten
Trotzdem kann silver_cleaned bronze_raw nicht auflösen.
[b]Frage[/b]
[list]
[*]Was ist der richtige Weg, um Upstream-Tabellen in Spark Declarative Pipelines zu referenzieren?

[*]Ist spark.table("bronze_raw") der richtige Ansatz?

[*]Gibt es etwas Bestimmtes am Spark Connect- oder SDP-Ausführungskontext, das diesen Fehler verursacht?

[*]Gibt es zusätzliche Anforderungen für die Deklaration oder Materialisierung von Upstream-Tabellen? Jedes minimale Arbeitsbeispiel oder jede Erklärung des Ausführungsmodells wäre sehr hilfreich.

[/list]
[b]Erwartetes Verhalten[/b]: Spark-Pipelines sollten bronze_raw als Upstream-Abhängigkeit erkennen und silver_cleaned erlauben, darauf zu verweisen.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Spark Declarative Pipelines (SDP) – TABLE_OR_VIEW_NOT_FOUND für Upstream-Tabelle, obwohl sie definiert ist

Last post by Anonymous « 09 Jan 2026, 10:55
Posted in Python

by Anonymous » 09 Jan 2026, 10:55 » in Python

Ich versuche, Spark Declarative Pipelines (Spark 4.0 / pyspark.pipelines) lokal mithilfe der Spark-Pipelines-CLI zu erlernen.
Ich habe eine einfache Bronze → Silver → Gold -Pipeline, aber ich erhalte...

0 Replies

2 Views

Last post by Anonymous
09 Jan 2026, 10:55
Target file "lib/main.dart" not found ~ Futterflow

Last post by Guest « 13 Jan 2025, 14:46
Posted in IOS

by Guest » 13 Jan 2025, 14:46 » in IOS

Ich erhalte diesen Fehler und kann die lokale Ausführung nicht verwenden, nachdem ich meinen Flutterdflow auf die neueste Version aktualisiert habe. Ich habe es satt, die Dateien zu überprüfen, und...

0 Replies

66 Views

Last post by Guest
13 Jan 2025, 14:46
Target file "lib/main.dart" not found ~ Futterflow

Last post by Guest « 16 Jan 2025, 07:52
Posted in IOS

by Guest » 16 Jan 2025, 07:52 » in IOS

Ich bin neu bei Flutterflow/Flutter und erhalte diesen Build-Fehler. Ich habe es satt, die Dateien zu überprüfen, und es gibt main.dart im lib-Ordner lib/main.dart. Ich bin mir also nicht sicher, was...

0 Replies

70 Views

Last post by Guest
16 Jan 2025, 07:52
Ich habe ein Core-PHP-Projekt auf Docker eingerichtet, erhalte jedoch die Fehlermeldung 404 Not Found Error

Last post by Guest « 19 Jan 2025, 18:36
Posted in Php

by Guest » 19 Jan 2025, 18:36 » in Php

Ich versuche, ein Kern-PHP-Projekt auf Docker bereitzustellen, aber wenn ich den Localhost-Server ausführe, erhalte ich die Meldung 404 Nicht gefunden.
docker-compose.yml
services:
app:...

0 Replies

58 Views

Last post by Guest
19 Jan 2025, 18:36
Htaccess: 404 Not Found Error Beim Versuch von ErrorDocument

Last post by Anonymous « 09 Jan 2026, 23:07
Posted in Php

by Anonymous » 09 Jan 2026, 23:07 » in Php

Ich verwende die .htaccess-Datei, um auf Fehlerseiten umzuleiten, wenn ein Fehler aufgetreten ist, der Fehler jedoch nicht gefunden wurde. Ich teste, ob die error.php-Seiten funktionieren, habe aber...

0 Replies

1 Views

Last post by Anonymous
09 Jan 2026, 23:07

Return to “Python”