大模型设备端部署

Introduction to On-Device AI

  • 经济高效:通过最小化依赖性或云计算资源来降低经常性成本
  • 高效:通过利用本地计算能力,更快的处理速度和能效。
  • 隐私:在设备上保留数据,增强安全性并保护用户隐私。
  • 个性化:允许连续定制模型,无需外部数据传输或更新

使用场景

  • 音频和语音:文本到语音转换,语音识别,机器翻译,去噪
  • 图像和视频:照片分类,QR码检测,虚拟背景分割
  • 传感器:键盘,身体活动检测,数字手写识别

image-20240522202211757

部署过程

捕获,编译,验证,测试性能

qualcomm 人工智能中心

image-20240522202349427