集成LoRA#

当前,Xinference 可以在启动 LLMimage 模型时连带一个 LoRA 微调模型用以辅助基础模型。

使用方式#

不同于内置模型,Xinference 目前不会涉及管理 LoRA 模型。用户需要首先下载对应的 LoRA 模型,然后将模型存储路径提供给 Xinference 。

xinference launch <options>
--lora-modules <lora_name1> <lora_model_path1>
--lora-modules <lora_name2> <lora_model_path2>
--image-lora-load-kwargs <load_params1> <load_value1>
--image-lora-load-kwargs <load_params2> <load_value2>
--image-lora-fuse-kwargs <fuse_params1> <fuse_value1>
--image-lora-fuse-kwargs <fuse_params2> <fuse_value2>

注意事项#

  • 上述 image_lora_load_kwargsimage_lora_fuse_kwargs 选项只应用于 image 模型。它们对应于 diffusers 库的 load_lora_weightsfuse_lora 接口中的额外参数。如果启动的是 LLM 模型,则无需设置这些选项。

  • 对于 LLM 聊天模型,当前仅支持那些微调后不更改原始基础模型的提示词模版的 LoRA 模型。

  • 使用 GPU 时,LoRA 模型与其基础模型在同样的设备上,不会对其他模型造成影响。