Einnahme einer NULL INT -Säule: Pandas und Pandera

Einnahme einer NULL INT -Säule: Pandas und Pandera ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Einnahme einer NULL INT -Säule: Pandas und Pandera

Report
Quote

Post by Anonymous » 11 Jul 2025, 16:58

Ich verwende Pandas mit Pandera für die Schema -Validierung, aber ich bin auf ein Problem gestoßen, da in den Daten eine Null -Integer -Spalte enthält. < /p>

Code: Select all

from prefect import task, Flow          #type:ignore
from pandera import Check, Column, DataFrameSchema
import prefect
import pandas as pd
import pandera as pa
import numpy as np

def pschema(d):
logger = prefect.utilities.logging.get_logger()  # type: ignore
engine = connect_db(prefect.config.kv.p.staging_db_constring, logger) #type:ignore

table_name = "MyTable"
org = "myOrg"

k = {}
df = pd.read_sql(
f"SELECT NameStrNotQuoted, FieldTypeName, SizeStr, Precision, Scale FROM dbo.vw_cx_meta WHERE [Table] = '{table_name}' and Organization='{org}' AND ETL_Active = 1",
engine,
)
for row in df.itertuples(index=False):
if row.FieldTypeName == "int":
k.update({row.NameStrNotQuoted:Column(int,Check(lambda x: pd.Series([x.fillna(0)],dtype='Int64')),coerce=True, nullable=True)})
elif row.FieldTypeName == 'bit':
k.update({row.NameStrNotQuoted:Column(pa.Bool, coerce=True)})
sch = DataFrameSchema(k)

sch.validate(d)
return k
< /code>
Die Fehler: < /p>
ValueError: cannot convert float NaN to integer
.
.
.
File "/usr/local/lib/python3.8/site-packages/pandera/schemas.py", line 1789, in coerce_dtype
raise errors.SchemaError(
pandera.errors.SchemaError: Error while coercing 'CopySourceID' to type int64: Could not coerce  data_container into type int64:

Ich bin mir von Pandas 'Gotcha' mit Nulls in int -Spalten bewusst und habe jede Permutation der Lambda -Funktion von Check ausprobiert, um dies zu lösen. Jede Hilfe wäre geschätzt, danke.

1752245882

Anonymous

Ich verwende Pandas mit Pandera für die Schema -Validierung, aber ich bin auf ein [url=viewtopic.php?t=26065]Problem[/url] gestoßen, da in den Daten eine Null -Integer -Spalte enthält. < /p>
[code]from prefect import task, Flow          #type:ignore
from pandera import Check, Column, DataFrameSchema
import prefect
import pandas as pd
import pandera as pa
import numpy as np

def pschema(d):
logger = prefect.utilities.logging.get_logger()  # type: ignore
engine = connect_db(prefect.config.kv.p.staging_db_constring, logger) #type:ignore

table_name = "MyTable"
org = "myOrg"

k = {}
df = pd.read_sql(
f"SELECT NameStrNotQuoted, FieldTypeName, SizeStr, Precision, Scale FROM dbo.vw_cx_meta WHERE [Table] = '{table_name}' and Organization='{org}' AND ETL_Active = 1",
engine,
)
for row in df.itertuples(index=False):
if row.FieldTypeName == "int":
k.update({row.NameStrNotQuoted:Column(int,Check(lambda x: pd.Series([x.fillna(0)],dtype='Int64')),coerce=True, nullable=True)})
elif row.FieldTypeName == 'bit':
k.update({row.NameStrNotQuoted:Column(pa.Bool, coerce=True)})
sch = DataFrameSchema(k)

sch.validate(d)
return k
< /code>
Die Fehler: < /p>
ValueError: cannot convert float NaN to integer
.
.
.
File "/usr/local/lib/python3.8/site-packages/pandera/schemas.py", line 1789, in coerce_dtype
raise errors.SchemaError(
pandera.errors.SchemaError: Error while coercing 'CopySourceID' to type int64: Could not coerce  data_container into type int64:
[/code]
Ich bin mir von Pandas 'Gotcha' mit Nulls in int -Spalten bewusst und habe jede Permutation der Lambda -Funktion von Check  ausprobiert, um dies zu lösen. Jede Hilfe wäre geschätzt, danke.

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Was ist der Typhinweis für (a:int,b:int=1,c:int=2,*d:str,**e:int)->int oder einige komplexere Funktionen in Python? [ges

Last post by Guest « 13 Jan 2025, 19:04
Posted in Python

by Guest » 13 Jan 2025, 19:04 » in Python

Wie der Titel schon sagt, wenn es einige Funktionen wie diese gibt:
def f1(a: int, b: int = 1, c: int = 2, *d: str, **e: str):
pass

def f2(a: int, /, b: int, c: int = 2, *, d: int):
pass

und...

0 Replies

36 Views

Last post by Guest
13 Jan 2025, 19:04
Wie drucke ich Array -Elemente in Java nach der Einnahme von Benutzereingaben korrekt aus?

Last post by Anonymous « 04 Mar 2025, 08:49
Posted in Java

by Anonymous » 04 Mar 2025, 08:49 » in Java

Ich versuche, Benutzereingaben mit einem Array in Java zu nehmen, aber ich habe Probleme, die Elemente des Arrays nach dem Speichern der Werte zu drucken. Ich verwende einen Scanner, um die Eingabe...

0 Replies

12 Views

Last post by Anonymous
04 Mar 2025, 08:49
Wie drucke ich Array -Elemente in Java nach der Einnahme von Benutzereingaben korrekt aus? [Duplikat]

Last post by Anonymous « 06 Mar 2025, 10:41
Posted in Java

by Anonymous » 06 Mar 2025, 10:41 » in Java

Ich versuche, Benutzereingaben mit einem Array in Java zu nehmen, aber ich habe Probleme, die Elemente des Arrays nach dem Speichern der Werte zu drucken. Ich verwende einen Scanner, um die Eingabe...

0 Replies

9 Views

Last post by Anonymous
06 Mar 2025, 10:41
Unterschied zwischen int[]-Array und int-Array[]

Last post by Guest « 22 Dec 2024, 18:09
Posted in Java

by Guest » 22 Dec 2024, 18:09 » in Java

Ich habe kürzlich über den Unterschied zwischen den beiden Möglichkeiten zur Definition eines Arrays nachgedacht:

int[] array
int array[]

Gibt es einen Unterschied?

0 Replies

25 Views

Last post by Guest
22 Dec 2024, 18:09
Unterschied zwischen int[]-Array und int-Array[]

Last post by Guest « 27 Dec 2024, 10:35
Posted in Java

by Guest » 27 Dec 2024, 10:35 » in Java

Ich habe kürzlich über den Unterschied zwischen den beiden Möglichkeiten zur Definition eines Arrays nachgedacht:

int[] array
int array[]

Gibt es einen Unterschied?

0 Replies

33 Views

Last post by Guest
27 Dec 2024, 10:35

Return to “Python”