Ich habe einen Datensatz mit Spalten für Organismen und Medikamente. Für jeden Organismus werden nur einige Medikamente verabreicht, und übersprungene Medikamente sind leere Zellen. Die übersprungenen Werte sind aussagekräftig (d. h. dem Patienten wurde kein Medikament verabreicht). Andere Spalten enthalten aufgrund fehlender Daten ebenfalls leere Zellen.
Soll ich leere Zellen in Medikamentenspalten mit „übersprungen“ füllen, um die Absicht anzuzeigen, und NaN für fehlende/Nicht-Arzneimittelzellen verwenden? Oder ist es besser, NaN überall für Analysen,
Weiterbildungen und andere Prozesse zu verwenden?
Ich habe noch keine Lösungen ausprobiert
Beispiel, wie es aussieht:
Organismus
Familie
CAZ_MIC
CIP_MIC
FEP_MIC
GM_MIC
MEM_MIC
Serratia ureilytica
Enterobacteriaceae
0,25
-
0,2499
-
3,9999
Serratia liquefaciens
Enterobacteriaceae
0,06
-
0,2499
0,987
3,9999
Serratia rubidaea
Enterobacteriaceae
0,5
0,9
-
-
3,9999
Serratia ureilytica
Enterobacteriaceae
0,25
-
0,2499
0,5
-
			
			
			
			
						Sollte ich für leere Zellen in Spalten zur Analyse „übersprungen“ oder „NaN“ verwenden? [geschlossen] ⇐ Python
- 
				- Similar Topics
- Replies
- Views
- Last post
 
- 
				- 
												Problem mit Nan in Python (Pandas): Das Programm kann das Nan nicht erkennen
 by Anonymous » » in Python
- 0 Replies
- 33 Views
- 
						Last post by Anonymous															
									
								
														
 
 
- 
												
 Mobile version
 Mobile version