






















在 onnxruntime python 库中可以加载在内存或者显存中,分别使用 cpu 和 gpu 进行推断运算,本文记录 onnxruntime 将模型加载到指定 gpu 的步骤。
这里我们使用 1.18.0 的 onnx 库
1 | |
将需要加载模型的 gpu id 填入 device_id,需要用字符串类型
1 | |
也有一种实现思路是在 Docker 内仅映射部分 gpu
1 | |
文章链接:
https://www.zywvvd.com/notes/study/deep-learning/deploy/onnx-percific-gpu/onnx-percific-gpu/
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。