Update 1/model.py

This commit is contained in:
cheetahadmin 2025-09-18 00:17:19 +00:00
parent 7e3b328d91
commit a979dd59fc

@ -1,4 +1,4 @@
# model.py # modify model.py
import triton_python_backend_utils as pb_utils import triton_python_backend_utils as pb_utils
import numpy as np import numpy as np
import json import json
@ -21,68 +21,62 @@ class TritonPythonModel:
def execute(self, requests): def execute(self, requests):
"""
Triton이 추론 요청에 대해 호출하는 실행 함수입니다.
"""
responses = [] responses = []
# 각 추론 요청을 순회하며 처리합니다.
for request in requests: for request in requests:
# Triton 입력 파싱 # INPUT
input_text = self._get_input_value(request, "INPUT") input_text = self._get_input_value(request, "INPUT")
self.logger.log_info(f"INPUT 출력:\n{input_text}") self.logger.log_info(f"INPUT 출력:\n{input_text}")
random_string = ''.join(random.choice(string.ascii_letters + string.digits) for _ in range(16))
output = random_string # 랜덤 문자열 생성
self.logger.log_info(f"OUTPUT 출력:\n{output}") random_string = ''.join(
random.choice(string.ascii_letters + string.digits) for _ in range(16)
)
self.logger.log_info(f"OUTPUT 출력:\n{random_string}")
# 생성된 텍스트를 Triton 출력 텐서로 변환합니다. # Triton이 요구하는 shape [1] STRING 출력
output_tensor = pb_utils.Tensor("OUTPUT", np.array(output.encode('utf-8'), dtype=np.bytes_)) output_tensor = pb_utils.Tensor(
"OUTPUT",
np.array([random_string.encode("utf-8")], dtype=np.object_)
)
# 응답 객체를 생성하고 출력 텐서를 추가합니다. responses.append(pb_utils.InferenceResponse(
responses.append(pb_utils.InferenceResponse(output_tensors=[output_tensor])) output_tensors=[output_tensor]
))
return responses return responses
# 수정 후
def _get_input_value(self, request, input_name: str, default=None): def _get_input_value(self, request, input_name: str, default=None):
tensor_value = pb_utils.get_input_tensor_by_name(request, input_name)
if tensor_value is None:
return default
# 텐서의 데이터 타입을 확인
# bytes 타입의 경우, as_numpy()를 호출하면 NumPy 배열이 아닌 bytearray가 반환될 수 있음
# 따라서 issubdtype를 사용하여 데이터 타입을 확인하고, 적절히 처리
# 만약 입력 텐서가 bytes 타입이라면 as_numpy()로 변환 시 오류 발생 가능
# 이를 방지하기 위해 issubdtype를 사용하여 조건 처리
if np.issubdtype(tensor_value.as_numpy().dtype, np.bytes_):
# bytes 타입 텐서는 바로 디코딩
return self._np_decoder(tensor_value.as_numpy())
else:
# 그 외의 타입은 기존 방식 유지 (첫 번째 요소만 가져옴)
return self._np_decoder(tensor_value.as_numpy()[0])
def _np_decoder(self, obj):
""" """
NumPy 객체의 데이터 타입을 확인하고 Python 기본 타입으로 변환합니다. Triton 추론 요청에서 특정 이름의 입력 텐서 값을 가져옵니다.
Args: Args:
obj (numpy.ndarray element): 변환할 NumPy 배열의 요소. request (pb_utils.InferenceRequest): Triton 추론 요청 객체.
input_name (str): 가져올 입력 텐서의 이름.
default (any, optional): 입력 텐서가 없을 경우 반환할 기본값. Defaults to None.
Returns: Returns:
any: 해당 NumPy 요소에 대응하는 Python 기본 타입 (str, int, float, bool). any: 디코딩된 입력 텐서의 . 텐서가 없으면 기본값을 반환합니다.
bytes 타입인 경우 UTF-8 디코딩합니다.
""" """
if isinstance(obj, bytes): tensor_value = pb_utils.get_input_tensor_by_name(request, input_name)
return obj.decode('utf-8')
if np.issubdtype(obj, np.integer): if tensor_value is None:
return int(obj) return default
if np.issubdtype(obj, np.floating):
return round(float(obj), 3) return self._np_decoder(tensor_value.as_numpy()[0])
if isinstance(obj, np.bool_):
return bool(obj) def _np_decoder(self, obj):
if isinstance(obj, (bytes, np.bytes_)):
return obj.decode('utf-8')
if isinstance(obj, str):
return obj
if np.issubdtype(type(obj), np.integer):
return int(obj)
if np.issubdtype(type(obj), np.floating):
return round(float(obj), 3)
if isinstance(obj, (np.bool_, bool)):
return bool(obj)
return obj
def finalize(self): def finalize(self):
""" """