请问，一张卡为什么无法加载多个模型？ #2893

Jimmy-L99 · 2025-02-19T18:39:48Z

Feature request / 功能建议

如题，我用xinference vllm框架在A100*2运行了deepseek-r1-qwen-distill-32B，双卡各占用50%。此时两张卡都剩余50%显存。我再用xinference运行一个bge-m3 embedding模型，GPU 0或者1都设置过了，点击运行的时候显示0/1已被deepseek-r1-qwen-distill-32B占用。

所以，请教一下，是强制要求专卡专用吗还是设置上有问题。

Motivation / 动机

Your contribution / 您的贡献

GreenerZ · 2025-02-20T03:56:46Z

先启动embedding，再启动llm

此外，xinference有一个限制是，一张卡无法加载多个llm模型，包括chat，vl以及其他语音stt,tts,图片生成等模型

jackleeforce · 2025-02-20T07:37:03Z

这个问题我的解决办法是再启用一个xinference 实例，如果是docker部署，就再启动一个xinference 容器，端口不一样。这样就可以在同一张卡上运行多个模型，只要显存够。

ascacl · 2025-02-21T07:20:16Z

这个问题我的解决办法是再启用一个xinference 实例，如果是docker部署，就再启动一个xinference 容器，端口不一样。这样就可以在同一张卡上运行多个模型，只要显存够。

麻烦问下你用的什么版本？我1.0.0的版本就这么干的，升级到1.2.2就不可以了

jackleeforce · 2025-02-21T07:22:10Z

这个问题我的解决办法是再启用一个xinference 实例，如果是docker部署，就再启动一个xinference 容器，端口不一样。这样就可以在同一张卡上运行多个模型，只要显存够。

麻烦问下你用的什么版本？我1.0.0的版本就这么干的，升级到1.2.2就不可以了

我用的就是1.2.2的docker部署方式，分别启了三个容器，三个容器上分别部署了LLM， Whisper, TTS

ascacl · 2025-02-21T07:27:38Z

这个问题我的解决办法是再启用一个xinference 实例，如果是docker部署，就再启动一个xinference 容器，端口不一样。这样就可以在同一张卡上运行多个模型，只要显存够。

麻烦问下你用的什么版本？我1.0.0的版本就这么干的，升级到1.2.2就不可以了

我用的就是1.2.2的docker部署方式，分别启了三个容器，三个容器上分别部署了LLM， Whisper, TTS

那可能不同模型可以，相同模型好像不行

Jimmy-L99 · 2025-02-21T07:42:15Z

这个问题我的解决办法是再启用一个xinference 实例，如果是docker部署，就再启动一个xinference 容器，端口不一样。这样就可以在同一张卡上运行多个模型，只要显存够。

whisper和tts我不太清楚，上面@GreenerZ 的方法对我来说挺有用，因为我是embedding和llm，先开embedding后就可以开llm了，反之不行。

Jimmy-L99 added the feature label Feb 19, 2025

XprobeBot added the gpu label Feb 19, 2025

XprobeBot added this to the v1.x milestone Feb 19, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问，一张卡为什么无法加载多个模型？ #2893

请问，一张卡为什么无法加载多个模型？ #2893

Jimmy-L99 commented Feb 19, 2025

GreenerZ commented Feb 20, 2025

jackleeforce commented Feb 20, 2025

ascacl commented Feb 21, 2025

jackleeforce commented Feb 21, 2025

ascacl commented Feb 21, 2025

Jimmy-L99 commented Feb 21, 2025

请问，一张卡为什么无法加载多个模型？ #2893

请问，一张卡为什么无法加载多个模型？ #2893

Comments

Jimmy-L99 commented Feb 19, 2025

Feature request / 功能建议

Motivation / 动机

Your contribution / 您的贡献

GreenerZ commented Feb 20, 2025

jackleeforce commented Feb 20, 2025

ascacl commented Feb 21, 2025

jackleeforce commented Feb 21, 2025

ascacl commented Feb 21, 2025

Jimmy-L99 commented Feb 21, 2025