Kann ich Daten mit einem einzigen „Wann“ bedingt in mehrere Spalten extrahieren? - Programmiererforum

Kann ich Daten mit einem einzigen „Wann“ bedingt in mehrere Spalten extrahieren? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Kann ich Daten mit einem einzigen „Wann“ bedingt in mehrere Spalten extrahieren?

Report
Quote

Post by Anonymous » 16 Jan 2026, 02:02

Wenn ich die folgenden Spielzeugdaten hätte:

Code: Select all

import polars as pl
data = [
{"name_full": "McCartney, Paul"},
{"name_last": "Lennon", "name_first": "John"},
{"name_full": "Starr, Ringo"},
{"name_last": "Harrison", "name_first": "George"}
]
df = pl.DataFrame(data)
df

Code: Select all

shape: (4, 3)
┌─────────────────┬───────────┬────────────┐
│ name_full       ┆ name_last ┆ name_first │
│ ---             ┆ ---       ┆ ---        │
│ str             ┆ str       ┆ str        │
╞═════════════════╪═══════════╪════════════╡
│ McCartney, Paul ┆ null      ┆ null       │
│ null            ┆ Lennon    ┆ John       │
│ Starr, Ringo    ┆ null      ┆ null       │
│ null            ┆ Harrison  ┆ George     │
└─────────────────┴───────────┴────────────┘

Gibt es in Polars eine empfohlene Möglichkeit, die vollständigen Namensdaten in mehrere Spalten aufzuteilen, ohne dass für jede Zielspalte ein separates pl.when erforderlich ist? Es scheint, dass dies mit einer Struktur erreicht werden kann, aber mir gelingt es nicht, die richtige Logik/Syntax zu finden.
Ich kann die gewünschten Ergebnisse mit Folgendem erzielen, aber es ist schwierig, dies für komplexere Daten zu skalieren, da für jede Spalte, in der Daten landen müssen, ein separates pl.when erforderlich ist.

Code: Select all

(
df.with_columns(
pl.col("name_full").str.split(",").list.eval(pl.element().str.strip_chars()).alias("name_parts")
).with_columns(
pl.when(pl.col("name_last").is_null())
.then(pl.col("name_parts").list.get(0, null_on_oob=True))
.otherwise(pl.col("name_last")).alias("name_last"),
pl.when(pl.col("name_first").is_null())
.then(pl.col("name_parts").list.get(1, null_on_oob=True))
.otherwise(pl.col("name_first")).alias("name_first")
).select(pl.all().exclude("name_full", "name_parts"))
)

Code: Select all

shape: (4, 2)
┌───────────┬────────────┐
│ name_last ┆ name_first │
│ ---       ┆ ---        │
│ str       ┆ str        │
╞═══════════╪════════════╡
│ McCartney ┆ Paul       │
│ Lennon    ┆ John       │
│ Starr     ┆ Ringo      │
│ Harrison  ┆ George     │
└───────────┴────────────┘

1768525347

Anonymous

Wenn ich die folgenden Spielzeugdaten hätte:
[code]import polars as pl
data = [
{"name_full": "McCartney, Paul"},
{"name_last": "Lennon", "name_first": "John"},
{"name_full": "Starr, Ringo"},
{"name_last": "Harrison", "name_first": "George"}
]
df = pl.DataFrame(data)
df
[/code]
[code]shape: (4, 3)
┌─────────────────┬───────────┬────────────┐
│ name_full       ┆ name_last ┆ name_first │
│ ---             ┆ ---       ┆ ---        │
│ str             ┆ str       ┆ str        │
╞═════════════════╪═══════════╪════════════╡
│ McCartney, Paul ┆ null      ┆ null       │
│ null            ┆ Lennon    ┆ John       │
│ Starr, Ringo    ┆ null      ┆ null       │
│ null            ┆ Harrison  ┆ George     │
└─────────────────┴───────────┴────────────┘
[/code]
Gibt es in Polars eine empfohlene Möglichkeit, die vollständigen Namensdaten in mehrere Spalten aufzuteilen, ohne dass für jede Zielspalte ein separates pl.when erforderlich ist?  Es scheint, dass dies mit einer Struktur erreicht werden kann, aber mir gelingt es nicht, die richtige Logik/Syntax zu finden.
Ich kann die gewünschten Ergebnisse mit Folgendem erzielen, aber es ist schwierig, dies für komplexere Daten zu skalieren, da für jede Spalte, in der Daten landen müssen, ein separates pl.when erforderlich ist.
[code](
df.with_columns(
pl.col("name_full").str.split(",").list.eval(pl.element().str.strip_chars()).alias("name_parts")
).with_columns(
pl.when(pl.col("name_last").is_null())
.then(pl.col("name_parts").list.get(0, null_on_oob=True))
.otherwise(pl.col("name_last")).alias("name_last"),
pl.when(pl.col("name_first").is_null())
.then(pl.col("name_parts").list.get(1, null_on_oob=True))
.otherwise(pl.col("name_first")).alias("name_first")
).select(pl.all().exclude("name_full", "name_parts"))
)
[/code]
[code]shape: (4, 2)
┌───────────┬────────────┐
│ name_last ┆ name_first │
│ ---       ┆ ---        │
│ str       ┆ str        │
╞═══════════╪════════════╡
│ McCartney ┆ Paul       │
│ Lennon    ┆ John       │
│ Starr     ┆ Ringo      │
│ Harrison  ┆ George     │
└───────────┴────────────┘
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wann sollte ich PowerShell.AddCommand() und wann sollte ich PowerShell.AddScript() verwenden?

Last post by Anonymous « 10 Oct 2025, 08:50
Posted in C#

by Anonymous » 10 Oct 2025, 08:50 » in C#

Ich verwende C# und PowerShell, um Git-Befehle zu automatisieren und viele Repositorys zu synchronisieren. Ich habe zwei Möglichkeiten zum Ausführen von Powershell-Befehlen gefunden:...

0 Replies

36 Views

Last post by Anonymous
10 Oct 2025, 08:50
Wie erstelle ich mehrere Seiten in einem einzigen HTML? [Duplikat]

Last post by Anonymous « 27 Dec 2025, 14:56
Posted in HTML

by Anonymous » 27 Dec 2025, 14:56 » in HTML

Ich spiegele derzeit meine Webcomics auf meiner Hauptseite und frage mich, ob es möglich wäre, zwischen verschiedenen Seiten zu wechseln UND die URL in einem einzigen HTML-Code zu ändern, damit ich...

0 Replies

1 Views

Last post by Anonymous
27 Dec 2025, 14:56
NUnit: Mehrere Behauptungen in einem einzigen Test ausführen

Last post by Anonymous « 23 Dec 2024, 11:30
Posted in C#

by Anonymous » 23 Dec 2024, 11:30 » in C#

Ich wurde gebeten, eine Testanwendung zu schreiben, die eine neue gespeicherte Prozedur in mehreren Zeilen in einer Datenbank testen muss. Im Wesentlichen möchte ich so etwas tun:

public void...

0 Replies

37 Views

Last post by Anonymous
23 Dec 2024, 11:30
Polars: Manipulation von Spalten durch „dtype“, wodurch mehrere neue Spalten entstehen

Last post by Anonymous « 28 Oct 2025, 19:36
Posted in Python

by Anonymous » 28 Oct 2025, 19:36 » in Python

Mit dem angegebenen Code möchte ich für jede von pl.DATETIME_DTYPES ausgewählte Spalte neue Spalten mit dem extrahierten Jahr erstellen.
import polars as pl

data = { col1 : , col2 : }

df =...

0 Replies

39 Views

Last post by Anonymous
28 Oct 2025, 19:36
Wie formatiere ich Daten in Great Tables bedingt?

Last post by Anonymous « 01 Nov 2025, 00:09
Posted in Python

by Anonymous » 01 Nov 2025, 00:09 » in Python

Ich versuche, Tabellendaten mithilfe von Great Tables bedingt zu formatieren, bin mir aber nicht sicher, wie das geht.
Um die Farbe aller Zellen hervorzuheben (eine Art Heatmap), deren Werte höher...

0 Replies

54 Views

Last post by Anonymous
01 Nov 2025, 00:09

Return to “Python”