软件信息
Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。该软件运行在Windows平台上,支持高性能GPGPU处理,可利用GPU加速运算。使用该软件需要结合语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large),模型大小影响识别效果与速度。
软件截图
软件功能
- 高性能GPGPU:支持使用GPU进行高性能计算,通过DirectCompute实现与供应商无关的GPGPU,加速语音识别处理。
- 纯C++实现:软件采用纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系,运行稳定高效。
- 混合F16/F32精度:支持混合使用F16/F32精度,提升计算效率。Windows需要自D3D版本10.0起支持缓冲区R16_FLOAT。
- 内置性能探查器:提供内置性能探查器,可测量单个计算着色器的执行时间,帮助优化处理效率。
- 低内存使用率:软件内存使用率较低,提高系统资源利用率。
- 音频处理:支持大多数音频和视频格式(Ogg Vorbis除外),以及在Windows上运行的大多数音频捕获设备,包括语音活动检测。
软件特点
- 高性能:利用GPU加速进行语音识别,运行效率高。
- 低内存占用:内存使用率较低,减少系统资源压力。
- COM样式API:提供易于使用的COM样式API,以及惯用C#包装器。
- 预构建二进制文件:提供预构建的二进制文件,方便用户快速使用。