Wie erhalte ich mit Sklearn eine Menge Wörter und die Häufigkeit von Begriffen im Textformat? - Programmiererforum

Wie erhalte ich mit Sklearn eine Menge Wörter und die Häufigkeit von Begriffen im Textformat? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Wie erhalte ich mit Sklearn eine Menge Wörter und die Häufigkeit von Begriffen im Textformat?

Post by Guest » 12 Jan 2025, 11:28

Ich möchte die Liste der Wörter (d. h. eine Menge Wörter) für jedes Dokument in einem Coprus und ihre jeweilige Begriffshäufigkeit (im Textformat) mit Sklearns CountVectorizer ausdrucken. Wie könnte ich das erreichen?
Hier ist mein Code:

Code: Select all

from sklearn.feature_extraction.text import CountVectorizer

#instantiate vectorizer
vectorizer=CountVectorizer()

#Document creation
document1='this is a sunny day';document2= 'today is a very very very pleasant day and we have fun fun fun';document3= 'this is an amazin experience'

#list
list_of_words= [document1,document2,document3]

#bag of words
bag_of_words = vectorizer.fit(list_of_words)

#verify vocabulary of repeated word
print (vectorizer.vocabulary_.get('very'))

print (vectorizer.vocabulary_.get('fun'))

#transform
bag_of_words=vectorizer.transform(list_of_words)

print(bag_of_words)>>>>
(0, 3) 1 (0, 7) 1 (0, 9) 1 (0, 10) 1 (1, 2) 1 (1, 3) 1 (1, 5) 3 (1, 6) 1 (1, 7) 1 (1, 8) 1 (1, 11) 1 (1, 12) 3 (1, 13) 1 (2, 0) 1 (2, 1) 1 (2, 4) 1 (2, 7) 1 (2, 10) 1

1736677732

Guest

Ich möchte die Liste der Wörter (d. h. eine Menge Wörter) für jedes Dokument in einem Coprus und ihre jeweilige Begriffshäufigkeit (im Textformat) mit Sklearns CountVectorizer ausdrucken. Wie könnte ich das erreichen?
Hier ist mein Code:
[code]from sklearn.feature_extraction.text import CountVectorizer

#instantiate vectorizer
vectorizer=CountVectorizer()

#Document creation
document1='this is a sunny day';document2= 'today is a very very very pleasant day and we have fun fun fun';document3= 'this is an amazin experience'

#list
list_of_words= [document1,document2,document3]

#bag of words
bag_of_words = vectorizer.fit(list_of_words)

#verify vocabulary of repeated word
print (vectorizer.vocabulary_.get('very'))

print (vectorizer.vocabulary_.get('fun'))

#transform
bag_of_words=vectorizer.transform(list_of_words)

print(bag_of_words)>>>>
(0, 3) 1 (0, 7) 1 (0, 9) 1 (0, 10) 1 (1, 2) 1 (1, 3) 1 (1, 5) 3 (1, 6) 1 (1, 7) 1 (1, 8) 1 (1, 11) 1 (1, 12) 3 (1, 13) 1 (2, 0) 1 (2, 1) 1 (2, 4) 1 (2, 7) 1 (2, 10) 1
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Sobald ich auf der Produktarchivseite auf eine Farbvariation klicke, wird die Option der Menge der Menge und die Schaltf

Last post by Guest « 07 Feb 2025, 10:47
Posted in Php

by Guest » 07 Feb 2025, 10:47 » in Php

Ich habe einen Code, der funktioniert, aber mir nicht die Option gibt, dass nach der Auswahl einer Farbvariation das Produktbild nach Color
auch der Code ist:
add_filter(...

0 Replies

9 Views

Last post by Guest
07 Feb 2025, 10:47
Bestimmte Wörter werden für die Codeanalyseregel IDE1006 auf die weiße Liste gesetzt: „Diese Wörter müssen mit Großbuchs

Last post by Anonymous « 29 Dec 2024, 10:52
Posted in C#

by Anonymous » 29 Dec 2024, 10:52 » in C#

In einem C#-/.NET-Projekt haben wir während des Builds die Codeanalyse aktiviert. Wir verwenden die .editorconfig, um anzupassen, welche Regeln aktiviert/deaktiviert werden und den Schweregrad...

0 Replies

23 Views

Last post by Anonymous
29 Dec 2024, 10:52
Ich möchte die Häufigkeit eines INT -Arrays durch einen HashMap bekommen

Last post by Anonymous « 03 Apr 2025, 08:39
Posted in Java

by Anonymous » 03 Apr 2025, 08:39 » in Java

public int[] topKFrequent(int[] nums, int k) {
if (nums == null || nums.length == 0 || k

0 Replies

13 Views

Last post by Anonymous
03 Apr 2025, 08:39
Wie kann sichergestellt werden, dass das Scroll-Ereignis mit einer angemessenen Häufigkeit ausgelöst wird?

Last post by Guest « 14 Jan 2025, 10:02
Posted in HTML

by Guest » 14 Jan 2025, 10:02 » in HTML

Ich implementieren eine Pivot-Tabelle, die aus drei Teilen besteht: Pivot-Körper, Zeilenüberschriften und Spaltenüberschriften.
https:// i.sstatic.net/QmDf1ynZ.png

Ich habe die...

0 Replies

15 Views

Last post by Guest
14 Jan 2025, 10:02
Wie kann sichergestellt werden, dass das Scroll-Ereignis mit einer angemessenen Häufigkeit ausgelöst wird?

Last post by Guest « 14 Jan 2025, 10:02
Posted in JavaScript

by Guest » 14 Jan 2025, 10:02 » in JavaScript

Ich implementieren eine Pivot-Tabelle, die aus drei Teilen besteht: Pivot-Körper, Zeilenüberschriften und Spaltenüberschriften.
https:// i.sstatic.net/QmDf1ynZ.png

Ich habe die...

0 Replies

14 Views

Last post by Guest
14 Jan 2025, 10:02

Return to “Python”