Polarsimplementierung zum Erstellen von Objekten, die bestimmte Attribute auswählen

Polarsimplementierung zum Erstellen von Objekten, die bestimmte Attribute auswählen ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Polarsimplementierung zum Erstellen von Objekten, die bestimmte Attribute auswählen

Report
Quote

Post by Anonymous » 30 Sep 2025, 19:35

Die Strophe Annotation -Pipeline verarbeitet einen Text und erstellt Satz s, die wiederum aus Word s umfassen. Dies sind Objekte, die von Strophe erstellt wurden. Ich möchte spezifische Attribute der Word -Objekte auswählen, die Stanza erstellt und meine eigenen Objekte in einer Liste von Listen erstellt (die äußere Liste ist der gesamte Text und die inneren Listen sind die Sätze). Mit einem Pandas DataFrame hat ich jede Textannotation in einer DataFrame -Zelle, ich würde eine Funktion mit einem Doppel für die Schleife erstellen, um dies zu erreichen. Ich möchte die Polars Bibliothek verwenden. Kann ich das mit den Polars api tun, oder ich mache das wie die Pandas Implementierung?

Code: Select all

import stanza
from typing import NamedTuple

nlp = stanza.Pipeline('en')

class Word(NamedTuple):
id: int
head_id: int
text: str
span: list[int]

def get_doc_words(doc: stanza.Document) -> list[list[Word]]:

doc_words = []
for sentence in doc.sentences:
sentence_words = []
for sent_word in sentence.words:
word = Word(
id=sent_word.id,
head_id=sent_word.head,
text=sent_word.text,
span=[sent_word.start_char, sent_word.end_char],
)
sentence_words.append(word)
doc_words.append(sentence_words)

return doc_words

df=pd.DataFrame(
{
'text': [
'This is some sample text. A second sentence.',
'And a second sample. Having a second sentence as well'
]
}
)
df['stanza_annotation'] = df['text'].apply(nlp)
df['stanza_words'] = df['stanza_annotation'].apply(get_doc_words)
< /code>
Und dies ist die Ausgabe, die ich für jeden Textstück erwarte.[[Word(id=1, head_id=5, text='This', span=[0, 4]),
Word(id=2, head_id=5, text='is', span=[5, 7]),
Word(id=3, head_id=5, text='some', span=[8, 12]),
Word(id=4, head_id=5, text='sample', span=[13, 19]),
Word(id=5, head_id=0, text='text', span=[20, 24]),
Word(id=6, head_id=5, text='.', span=[24, 25]],
[Word(id=1, head_id=3, text='A', span=[26, 27]),
Word(id=2, head_id=3, text='second', span=[28, 34]),
Word(id=3, head_id=0, text='sentence', span=[35, 43]),
Word(id=4, head_id=3, text='.', span=[43, 44])]]

1759253705

Anonymous

Die Strophe  Annotation -Pipeline verarbeitet einen Text und erstellt Satz  s, die wiederum aus Word  s umfassen. Dies sind Objekte, die von Strophe erstellt wurden. [url=viewtopic.php?t=30561]Ich möchte[/url] spezifische Attribute der Word  -Objekte auswählen, die Stanza erstellt und meine eigenen Objekte in einer Liste von Listen erstellt (die äußere Liste ist der gesamte Text und die inneren Listen sind die Sätze). Mit einem Pandas  DataFrame  hat ich jede Textannotation in einer DataFrame  -Zelle, ich würde eine Funktion mit einem Doppel für die Schleife erstellen, um dies zu erreichen. [url=viewtopic.php?t=30561]Ich möchte[/url] die Polars  Bibliothek verwenden. Kann ich das mit den Polars  api tun, oder ich mache das wie die Pandas  Implementierung?[code]import stanza
from typing import NamedTuple

nlp = stanza.Pipeline('en')

class Word(NamedTuple):
id: int
head_id: int
text: str
span: list[int]

def get_doc_words(doc: stanza.Document) -> list[list[Word]]:

doc_words = []
for sentence in doc.sentences:
sentence_words = []
for sent_word in sentence.words:
word = Word(
id=sent_word.id,
head_id=sent_word.head,
text=sent_word.text,
span=[sent_word.start_char, sent_word.end_char],
)
sentence_words.append(word)
doc_words.append(sentence_words)

return doc_words

df=pd.DataFrame(
{
'text': [
'This is some sample text. A second sentence.',
'And a second sample. Having a second sentence as well'
]
}
)
df['stanza_annotation'] = df['text'].apply(nlp)
df['stanza_words'] = df['stanza_annotation'].apply(get_doc_words)
< /code>
Und dies ist die Ausgabe, die ich für jeden Textstück erwarte.[[Word(id=1, head_id=5, text='This', span=[0, 4]),
Word(id=2, head_id=5, text='is', span=[5, 7]),
Word(id=3, head_id=5, text='some', span=[8, 12]),
Word(id=4, head_id=5, text='sample', span=[13, 19]),
Word(id=5, head_id=0, text='text', span=[20, 24]),
Word(id=6, head_id=5, text='.', span=[24, 25]],
[Word(id=1, head_id=3, text='A', span=[26, 27]),
Word(id=2, head_id=3, text='second', span=[28, 34]),
Word(id=3, head_id=0, text='sentence', span=[35, 43]),
Word(id=4, head_id=3, text='.', span=[43, 44])]]
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie greife ich auf Daten in einem Array von Objekten zu, das Arrays von Objekten enthält? [Duplikat]

Last post by Guest « 16 Jan 2025, 04:06
Posted in Php

by Guest » 16 Jan 2025, 04:06 » in Php

Ich habe Probleme mit der Anzeige des Ländernamens, des Länderpräfixes, gefolgt von Stadtname und Stadtpräfix, um sie in PHP anzuzeigen
Array (
=> stdClass Object
(
=> Russian Federation
=> 7
=>...

0 Replies

54 Views

Last post by Guest
16 Jan 2025, 04:06
Die am meisten wartbarste und lesbare Methode zum Erstellen von Objekten mit vielen Feldern

Last post by Anonymous « 14 Apr 2025, 01:56
Posted in Java

by Anonymous » 14 Apr 2025, 01:56 » in Java

Ich erstelle eine Java -Klasse, die die sechs Orbitalelemente eines himmlischen Objekts, die sechs osculierenden Elemente desselben himmlischen Objekts, die Masse des Körpers und den Namen des...

0 Replies

20 Views

Last post by Anonymous
14 Apr 2025, 01:56
Verwenden von Jackson zum Zuordnen von Objekten von einem bestimmten Knoten im JSON-Baum

Last post by Anonymous « 24 Dec 2024, 09:29
Posted in Java

by Anonymous » 24 Dec 2024, 09:29 » in Java

Ist es möglich, dass Jacksons ObjectMapper nur von einem bestimmten Knoten (und „nach unten“) in einem JSON-Baum unmarshallt?

Der Anwendungsfall ist ein erweiterbares Dokumentformat. Ich möchte den...

0 Replies

25 Views

Last post by Anonymous
24 Dec 2024, 09:29
Wie man N-te-Kind-Selektoren (2) zum Auswählen von Elementen verwendet [Duplikat]

Last post by Guest « 13 Jan 2025, 17:00
Posted in CSS

by Guest » 13 Jan 2025, 17:00 » in CSS

warum nth-child(2) alles auswählt

div 1
p1 in div 1
p2 in Div 1
p3 in Div 1

div 2
p1 in div 2
p2 in div 2
p3 in div 2

div 3
p1 in div 3
p2 in div 3
p3 in div 3

0 Replies

28 Views

Last post by Guest
13 Jan 2025, 17:00
Linux SED -Expression zum Auswählen von Text zwischen Markern

Last post by Anonymous « 27 Mar 2025, 13:23
Posted in Linux

by Anonymous » 27 Mar 2025, 13:23 » in Linux

Hier ist eine Herausforderung für Regex Gurus. Benötigen Sie einen sehr einfachen SED -Ausdruck, um Text zwischen Markierungen auszuwählen.
Hier ist ein Beispieltext. Bitte denken Sie daran, dass es...

0 Replies

21 Views

Last post by Anonymous
27 Mar 2025, 13:23

Return to “Python”