协同推理能力

端侧、边侧设备中安装ModelBox Agent后会以某种设备发现机制将他们绑定在一起,使设备之间可以保持协同,具体体现在以下几点:

  • 设备代理:在端侧设备无法联网前提下,可由边侧设备做代理进行推理。
  • 分布式推理:当某一台设备负载达到瓶颈后可以由ModelBox调度到协同的设备中进行推理,并且由ModelBox对返回的数据进行帧重组,上层用户对此无感知。
  • 大小模型协同推理:对端侧推理能力有限的场景,可以先由端侧ModelBox使用小模型对数据进行预处理,在精度达不到要求时将数据发送到边侧设备调用大模型进行推理,此过程用户无感,大小模型应用的安装也可以由边侧设备安装后自动分发到端侧设备。

results matching ""

    No results matching ""