Wie verarbeite ich Anfragen von mehreren Benutzern mithilfe des ML-Modells und FastAPI? - Programmiererforum

Wie verarbeite ich Anfragen von mehreren Benutzern mithilfe des ML-Modells und FastAPI? ⇐ Python

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Guest

Wie verarbeite ich Anfragen von mehreren Benutzern mithilfe des ML-Modells und FastAPI?

Post by Guest » 05 Jan 2025, 09:40

Ich untersuche den Prozess der Verteilung von Modulen für künstliche Intelligenz über FastAPI.
Ich habe eine FastAPI-App erstellt, die Fragen mithilfe eines vorab erlernten Modells für maschinelles Lernen beantwortet.In diesem Fall ist es für einen Benutzer kein Problem, es zu verwenden, aber wenn mehrere Benutzer es gleichzeitig verwenden, kann die Reaktion zu langsam sein.
Wenn also mehrere Benutzer eine Frage eingeben, gibt es dann eine Möglichkeit, das Modell zu kopieren und sofort laden?

Code: Select all

class sentencebert_ai():
def __init__(self) -> None:
super().__init__()

def ask_query(self,query, topN):
startt = time.time()

ask_result = []
score = []
result_value = []
embedder = torch.load(model_path)
corpus_embeddings = embedder.encode(corpus, convert_to_tensor=True)
query_embedding = embedder.encode(query, convert_to_tensor=True)
cos_scores = util.pytorch_cos_sim(query_embedding, corpus_embeddings)[0] #torch.Size([121])121개의 말뭉치에 대한 코사인 유사도 값이다.
cos_scores = cos_scores.cpu()

top_results = np.argpartition(-cos_scores, range(topN))[0:topN]

for idx in top_results[0:topN]:
ask_result.append(corpusid[idx].item())
#.item()으로 접근하는 이유는 tensor(5)에서 해당 숫자에 접근하기 위한 방식이다.
score.append(round(cos_scores[idx].item(),3))

#서버에 json array 형태로 내보내기 위한 작업
for i,e in zip(ask_result,score):
result_value.append({"pred_id":i,"pred_weight":e})
endd = time.time()
print('시간체크',endd-startt)
return result_value
# return ','.join(str(e) for e in ask_result),','.join(str(e) for e in score)

class Item_inference(BaseModel):
text : str
topN : Optional[int] = 1

@app.post("/retrieval", tags=["knowledge recommendation"])
async def Knowledge_recommendation(item: Item_inference):

# db.append(item.dict())
item.dict()
results = _ai.ask_query(item.text, item.topN)

return results

if __name__ == "__main__":
parser = argparse.ArgumentParser()
parser.add_argument("--port", default='9003', type=int)
# parser.add_argument("--mode", default='cpu', type=str, help='cpu for CPU mode, gpu for GPU mode')
args = parser.parse_args()

_ai = sentencebert_ai()
uvicorn.run(app, host="0.0.0.0", port=args.port,workers=4)

korrigierte Version

Code: Select all

@app.post("/aaa") def your_endpoint(request: Request, item:Item_inference): start = time.time() model = request.app.state.model item.dict() #커널 실행시 필요 _ai = sentencebert_ai() results = _ai.ask_query(item.text, item.topN,model) end = time.time() print(end-start) return results ```

1736066450

Guest

Ich untersuche den Prozess der Verteilung von Modulen für künstliche Intelligenz über FastAPI.
Ich habe eine FastAPI-App erstellt, die Fragen mithilfe eines vorab erlernten Modells für maschinelles Lernen beantwortet.In diesem Fall ist es für einen Benutzer kein Problem, es zu verwenden, aber wenn mehrere Benutzer es gleichzeitig verwenden, kann die Reaktion zu langsam sein.
Wenn also mehrere Benutzer eine Frage eingeben, gibt es dann eine Möglichkeit, das Modell zu kopieren und sofort laden?
[code]class sentencebert_ai():
def __init__(self) -> None:
super().__init__()

def ask_query(self,query, topN):
startt = time.time()

ask_result = []
score = []
result_value = []
embedder = torch.load(model_path)
corpus_embeddings = embedder.encode(corpus, convert_to_tensor=True)
query_embedding = embedder.encode(query, convert_to_tensor=True)
cos_scores = util.pytorch_cos_sim(query_embedding, corpus_embeddings)[0] #torch.Size([121])121개의 말뭉치에 대한 코사인 유사도 값이다.
cos_scores = cos_scores.cpu()

top_results = np.argpartition(-cos_scores, range(topN))[0:topN]

for idx in top_results[0:topN]:
ask_result.append(corpusid[idx].item())
#.item()으로 접근하는 이유는 tensor(5)에서 해당 숫자에 접근하기 위한 방식이다.
score.append(round(cos_scores[idx].item(),3))

#서버에 json array 형태로 내보내기 위한 작업
for i,e in zip(ask_result,score):
result_value.append({"pred_id":i,"pred_weight":e})
endd = time.time()
print('시간체크',endd-startt)
return result_value
# return ','.join(str(e) for e in ask_result),','.join(str(e) for e in score)

class Item_inference(BaseModel):
text : str
topN : Optional[int] = 1

@app.post("/retrieval", tags=["knowledge recommendation"])
async def Knowledge_recommendation(item: Item_inference):

# db.append(item.dict())
item.dict()
results = _ai.ask_query(item.text, item.topN)

return results

if __name__ == "__main__":
parser = argparse.ArgumentParser()
parser.add_argument("--port", default='9003', type=int)
# parser.add_argument("--mode", default='cpu', type=str, help='cpu for CPU mode, gpu for GPU mode')
args = parser.parse_args()

_ai = sentencebert_ai()
uvicorn.run(app, host="0.0.0.0", port=args.port,workers=4)
[/code]
korrigierte Version
[code]@app.post("/aaa") def your_endpoint(request: Request, item:Item_inference): start = time.time() model = request.app.state.model item.dict() #커널 실행시 필요 _ai = sentencebert_ai() results = _ai.ask_query(item.text, item.topN,model) end = time.time() print(end-start) return results ```
[/code]

Post Reply Previous topic Next topic

1 post • Page 1 of 1

Quick Reply

Username:

Change Text Case:

Smilies

View more smilies

Similar Topics

Replies

Views

Last post

Wie verarbeitet man Anfragen von mehreren Benutzern mit ML -Modell und Fastapi?

Last post by Guest « 13 Feb 2025, 11:11
Posted in Python

by Guest » 13 Feb 2025, 11:11 » in Python

Ich studiere den Prozess der Verteilung künstlicher Intelligenzmodule über Fastapi. Br /> In diesem Fall ist es für einen Benutzer kein Problem, es zu verwenden, aber wenn mehrere Benutzer...

0 Replies

17 Views

Last post by Guest
13 Feb 2025, 11:11
Wie leite ich FastAPI-Anfragen an einen anderen Server weiter?

Last post by Guest « 23 Jan 2025, 08:13
Posted in Python

by Guest » 23 Jan 2025, 08:13 » in Python

Ich habe eine FastAPI-Anwendung für Test-/Entwicklungszwecke. Ich möchte, dass jede Anfrage, die bei meiner App eintrifft, automatisch so wie sie ist an eine andere App auf einem anderen Server...

0 Replies

10 Views

Last post by Guest
23 Jan 2025, 08:13
Verstecken des Feldinhalts des Kennworts vor Benutzern

Last post by Anonymous « 28 Feb 2025, 10:14
Posted in HTML

by Anonymous » 28 Feb 2025, 10:14 » in HTML

Ich würde gerne wissen, ob es mir möglich ist, etwas aus Folgendem zu tun:

1) Ersetzen Sie den Quellcode, der in der Sichtweise Quelle sichtbar ist, durch ein Bild oder gar nichts. .

Danke im...

0 Replies

6 Views

Last post by Anonymous
28 Feb 2025, 10:14
Verstecken des Feldinhalts des Kennworts vor Benutzern

Last post by Anonymous « 28 Feb 2025, 10:14
Posted in Jquery

by Anonymous » 28 Feb 2025, 10:14 » in Jquery

Ich würde gerne wissen, ob es mir möglich ist, etwas aus Folgendem zu tun:

1) Ersetzen Sie den Quellcode, der in der Sichtweise Quelle sichtbar ist, durch ein Bild oder gar nichts. .

Danke im...

0 Replies

8 Views

Last post by Anonymous
28 Feb 2025, 10:14
Was ist der richtige Weg, um nachgelagerte HTTP-Anfragen innerhalb von Uvicorn/FastAPI zu stellen?

Last post by Guest « 22 Dec 2024, 07:29
Posted in Python

by Guest » 22 Dec 2024, 07:29 » in Python

Ich habe einen API-Endpunkt (FastAPI / Uvicorn). Unter anderem stellt es eine Informationsanfrage an eine weitere API. Wenn ich meine API mit mehreren gleichzeitigen Anfragen lade, erhalte ich die...

0 Replies

30 Views

Last post by Guest
22 Dec 2024, 07:29

Return to “Python”