透過動態批次處理、並行執行、最佳設定以及串流音訊和視訊,將輸送量和使用率提升到最高。Triton 支援所有NVIDIA GPU、x86 和Arm® CPU,以及AWS Inferentia。
確定! 回上一頁