Stellen Sie mit Numpy einheitliche Gruppengrößen sicher

Stellen Sie mit Numpy einheitliche Gruppengrößen sicher ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Stellen Sie mit Numpy einheitliche Gruppengrößen sicher

Post by Anonymous » 10 Apr 2025, 13:31

Ich habe eine Funktion, die einheitliche Größen für gruppierte Daten gewährleistet, indem fehlende Werte mit einem fill_value gepolstert werden. Die Funktion verwendet derzeit eine für Schleife, um das gepolsterte Array zu füllen.

Code: Select all

def ensure_uniform_groups(
groups: np.ndarray,
values: np.ndarray,
fill_value: np.number = np.nan) -> tuple[np.ndarray, np.ndarray]:
"""
Ensure uniform group lengths by padding each group to the same size.

Args:
groups : np.ndarray
1D array of group identifiers, assumed to be consecutive.
values : np.ndarray
1D/2D array of values corresponding to the group identifiers.
fill_value : np.number, optional
Value to use for padding groups. Default is np.nan.

Returns:
tuple[np.ndarray, np.ndarray]
A tuple containing uniform groups with padded values.
"""
# set common type
dtype = np.result_type(fill_value, values)

# derive group infos
n = groups.size
mask = np.r_[True, groups[:-1] != groups[1:]]
starts = np.arange(n)[mask]
ends = np.r_[starts[1:] - 1, n-1]
sizes = ends - starts + 1
max_size = np.max(sizes)

# check if data is uniform already
if np.all(sizes == max_size):
return groups, values

# generate uniform arrays
unique_groups = groups[starts]
full_groups = np.repeat(unique_groups, max_size)
full_values = np.full((full_groups.shape[0], values.shape[1]), fill_value=fill_value, dtype=dtype)
for i, (ia, ie) in enumerate(np.column_stack([starts, ends+1])):
ua = i * max_size
ue = ua + ie-ia
full_values[ua:ue] = values[ia:ie]
return full_groups, full_values
< /code>
Hier ist ein Beispiel: < /p>
groups = np.array([1, 1, 1, 2, 2, 3])   # size by group should be 3
values = np.column_stack([groups*10, groups*100])
fill_value = np.nan
ugroups, uvalues = ensure_uniform_groups(groups, values, fill_value)
out = np.vstack([ugroups, uvalues.T])
print(out)
# [[  1.   1.   1.   2.   2.   2.   3.   3.   3.]
#  [ 10.  10.  10.  20.  20.  nan  30.  nan  nan]
#  [100. 100. 100. 200. 200.  nan 300.  nan  nan]]
< /code>
Bearbeiten: Hier ist ein Benchmark, mit dem "besser" in Bezug auf die Leistung definiert werden kann: < /p>
from timeit import timeit

runs = 10
groups = np.sort(np.random.randint(1, 100, 100_000))
values = np.random.rand(groups.size, 2)

baseline = timeit(lambda: ensure_uniform_groups(groups, values), number=runs)
time_better = timeit(lambda: ensure_uniform_groups_better(groups, values), number=runs)

print("Ratio compared to baseline (>1 is faster)")
print(f"ensure_uniform_groups_better:  {baseline/time_better:.2f}")

1744284719

Anonymous

Ich habe eine Funktion, die einheitliche Größen für gruppierte Daten gewährleistet, indem fehlende Werte mit einem fill_value gepolstert werden. Die Funktion verwendet derzeit eine für Schleife, um das gepolsterte Array zu füllen.[code]def ensure_uniform_groups(
groups: np.ndarray,
values: np.ndarray,
fill_value: np.number = np.nan) -> tuple[np.ndarray, np.ndarray]:
"""
Ensure uniform group lengths by padding each group to the same size.

Args:
groups : np.ndarray
1D array of group identifiers, assumed to be consecutive.
values : np.ndarray
1D/2D array of values corresponding to the group identifiers.
fill_value : np.number, optional
Value to use for padding groups. Default is np.nan.

Returns:
tuple[np.ndarray, np.ndarray]
A tuple containing uniform groups with padded values.
"""
# set common type
dtype = np.result_type(fill_value, values)

# derive group infos
n = groups.size
mask = np.r_[True, groups[:-1] != groups[1:]]
starts = np.arange(n)[mask]
ends = np.r_[starts[1:] - 1, n-1]
sizes = ends - starts + 1
max_size = np.max(sizes)

# check if data is uniform already
if np.all(sizes == max_size):
return groups, values

# generate uniform arrays
unique_groups = groups[starts]
full_groups = np.repeat(unique_groups, max_size)
full_values = np.full((full_groups.shape[0], values.shape[1]), fill_value=fill_value, dtype=dtype)
for i, (ia, ie) in enumerate(np.column_stack([starts, ends+1])):
ua = i * max_size
ue = ua + ie-ia
full_values[ua:ue] = values[ia:ie]
return full_groups, full_values
< /code>
Hier ist ein Beispiel: < /p>
groups = np.array([1, 1, 1, 2, 2, 3])   # size by group should be 3
values = np.column_stack([groups*10, groups*100])
fill_value = np.nan
ugroups, uvalues = ensure_uniform_groups(groups, values, fill_value)
out = np.vstack([ugroups, uvalues.T])
print(out)
# [[  1.   1.   1.   2.   2.   2.   3.   3.   3.]
#  [ 10.  10.  10.  20.  20.  nan  30.  nan  nan]
#  [100. 100. 100. 200. 200.  nan 300.  nan  nan]]
< /code>
Bearbeiten: Hier ist ein Benchmark, mit dem "besser" in Bezug auf die Leistung definiert werden kann: < /p>
from timeit import timeit

runs = 10
groups = np.sort(np.random.randint(1, 100, 100_000))
values = np.random.rand(groups.size, 2)

baseline = timeit(lambda: ensure_uniform_groups(groups, values), number=runs)
time_better = timeit(lambda: ensure_uniform_groups_better(groups, values), number=runs)

print("Ratio compared to baseline (>1 is faster)")
print(f"ensure_uniform_groups_better:  {baseline/time_better:.2f}")
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Stellen Sie mit Numpy einheitliche Gruppengrößen sicher

Last post by Anonymous « 05 Apr 2025, 12:56
Posted in Python

by Anonymous » 05 Apr 2025, 12:56 » in Python

Ich habe eine Funktion, die einheitliche Größen für gruppierte Daten gewährleistet, indem fehlende Werte mit einem fill_value gepolstert werden. Die Funktion verwendet derzeit eine für Schleife, um...

0 Replies

6 Views

Last post by Anonymous
05 Apr 2025, 12:56
Python - Sonarqube -Fehler stellen Sie sicher, dass die Konfiguration dieses Loggers sicher ist

Last post by Anonymous « 27 Jan 2025, 09:57
Posted in Python

by Anonymous » 27 Jan 2025, 09:57 » in Python

Eine Alternative zur Protokollierung.Config.DictConfig (config)? Ich kann das Sonarqube -Qualitätstor aufgrund des folgenden Sonarqube -Fehlers nicht umgehen: logging.config.dictconfig (config):...

0 Replies

24 Views

Last post by Anonymous
27 Jan 2025, 09:57
Wie bekomme ich eine einheitliche Verteilung in einem Bereich [R1, R2] in Pytorch?

Last post by Anonymous « 05 Mar 2025, 13:46
Posted in Python

by Anonymous » 05 Mar 2025, 13:46 » in Python

Ich möchte eine 2-D-Fackel abrufen.

0 Replies

11 Views

Last post by Anonymous
05 Mar 2025, 13:46
So stellen Sie eine reibungslose Animation derselben Ansicht in verschiedenen Stapeln sicher, wenn Sie das Fokusereignis

Last post by Guest « 03 Jan 2025, 04:11
Posted in IOS

by Guest » 03 Jan 2025, 04:11 » in IOS

Ich habe matchedGeometryEffect verwendet, um die Größe und Position der beiden Ansichten miteinander zu „verknüpfen“.
Aber ich habe versucht, Textfield zu verwenden und den Zeitpunkt des Auslösens...

0 Replies

24 Views

Last post by Guest
03 Jan 2025, 04:11
Stellen Sie sicher, dass Sie das Attribut decoder_start_token_id der Konfiguration des Modells festlegen. Fehler

Last post by Anonymous « 12 Apr 2025, 02:28
Posted in Python

by Anonymous » 12 Apr 2025, 02:28 » in Python

from transformers import AutoProcessor, MusicgenForConditionalGeneration, EncodecModel

model = MusicgenForConditionalGeneration.from_pretrained( facebook/musicgen-small )
processor =...

0 Replies

17 Views

Last post by Anonymous
12 Apr 2025, 02:28

Return to “Python”