Tokenizer-Konfiguration – MLX - Programmiererforum

Tokenizer-Konfiguration – MLX ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Anonymous

Report
Quote

Post by Anonymous » 19 Jan 2026, 05:18

Ich versuche gerade, ein Modell auf MLX zu laden. Aber wenn ich das Modell lade und den Tokenizer verwende, tritt das folgende Problem auf:

mit einem falschen Regex-Muster: https://huggingface.co/mistralai/Mistra ... e709447d5e. Dies führt zu einer falschen Tokenisierung. Sie sollten beim Laden dieses Tokenizers das Flag fix_mistral_regex=True setzen, um dieses Problem zu beheben.

Aber ich verstehe nicht, wie ich das mit meinem Code machen soll:

Code: Select all

from mlx_lm import load, generate

out = load("mlx-community/translategemma-12b-it-4bit")
if len(out) == 2:
model, tokenizer = out
else:
model, tokenizer, struct = out

prompt = "Write a story about Einstein"
messages = [{"role": "user", "content": prompt}]
prompt = tokenizer.apply_chat_template(
messages,
add_generation_prompt=True
)

text = generate(model, tokenizer, prompt=prompt, verbose=True)

1768796295

Anonymous

Ich versuche gerade, ein Modell auf MLX zu laden. Aber wenn ich das Modell lade und den Tokenizer verwende, tritt das folgende [url=viewtopic.php?t=26065]Problem[/url] auf:

mit einem falschen Regex-Muster: https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503/discussions/84#69121093e8b480e709447d5e. Dies führt zu einer falschen Tokenisierung. Sie sollten beim Laden dieses Tokenizers das Flag fix_mistral_regex=True setzen, um dieses [url=viewtopic.php?t=26065]Problem[/url] zu beheben.

Aber ich verstehe nicht, wie ich das mit meinem Code machen soll:
[code]from mlx_lm import load, generate

out = load("mlx-community/translategemma-12b-it-4bit")
if len(out) == 2:
model, tokenizer = out
else:
model, tokenizer, struct = out

prompt = "Write a story about Einstein"
messages = [{"role": "user", "content": prompt}]
prompt = tokenizer.apply_chat_template(
messages,
add_generation_prompt=True
)

text = generate(model, tokenizer, prompt=prompt, verbose=True)
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Subject:

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Warum ist das Dateifeld leer (Array ([], dType = int8)) beim Laden von Datensatz mit mlx.data?

Last post by Anonymous « 13 Feb 2025, 06:19
Posted in Python

by Anonymous » 13 Feb 2025, 06:19 » in Python

Ich verwende mlx.data, um einen Bilddatensatz zu laden, in dem jede Klasse durch einen separaten Ordner dargestellt wird. Meine Funktionsdateien_and_classes generiert eine Liste von Wörterbüchern,...

0 Replies

49 Views

Last post by Anonymous
13 Feb 2025, 06:19
Warum ist das Dateifeld leer (Array ([], dType = int8)) beim Laden von Datensatz mit mlx.data?

Last post by Guest « 13 Feb 2025, 12:08
Posted in Python

by Guest » 13 Feb 2025, 12:08 » in Python

Ich verwende mlx.data, um einen Bilddatensatz zu laden, in dem jede Klasse durch einen separaten Ordner dargestellt wird. Meine Funktionsdateien_and_classes generiert eine Liste von Wörterbüchern,...

0 Replies

55 Views

Last post by Guest
13 Feb 2025, 12:08
Warum ist das Dateifeld leer (Array ([], dType = int8)) beim Laden von Datensatz mit mlx.data?

Last post by Anonymous « 14 Feb 2025, 06:59
Posted in Python

by Anonymous » 14 Feb 2025, 06:59 » in Python

Ich verwende mlx.data, um einen Bilddatensatz zu laden, in dem jede Klasse durch einen separaten Ordner dargestellt wird. Meine Funktionsdateien_and_classes generiert eine Liste von Wörterbüchern,...

0 Replies

27 Views

Last post by Anonymous
14 Feb 2025, 06:59
Warum stürzt mlx.core.sqrt () auf meinem MacBook Air M2 ab, wenn er auf ein komplexes Argument angewendet wird?

Last post by Anonymous « 13 Apr 2025, 01:21
Posted in Python

by Anonymous » 13 Apr 2025, 01:21 » in Python

mlx.core.sqrt() stürzt auf meinem MacBook Air M2 ab, wenn er auf ein komplexes Argument angewendet wird:
Python 3.11.11 (main, Dec 3 2024, 17:20:40) on darwin
Type help , copyright , credits or...

0 Replies

45 Views

Last post by Anonymous
13 Apr 2025, 01:21
Warum stürzt mlx.core.sqrt () auf meinem MacBook Air M2 ab, wenn er auf ein komplexes Argument angewendet wird?

Last post by Anonymous « 14 Apr 2025, 01:18
Posted in Python

by Anonymous » 14 Apr 2025, 01:18 » in Python

mlx.core.sqrt() stürzt auf meinem MacBook Air M2 ab, wenn er auf ein komplexes Argument angewendet wird:
Python 3.11.11 (main, Dec 3 2024, 17:20:40) on darwin
Type help , copyright , credits or...

0 Replies

39 Views

Last post by Anonymous
14 Apr 2025, 01:18

Return to “Python”