Volver a tapWhisper

Perfil del Modelo

Modelos en Dispositivo Soportados

tapWhisper está diseñado para ejecutarse completamente sin conexión y en el dispositivo para una máxima privacidad y rendimiento. Explore los modelos compatibles.

Apple Inc.
1 variante

Apple Speech en macOS

Apple Speech es el motor de transcripción por defecto y sin configuración de tapWhisper.

Licencia: Apple platform terms (macOS system framework; no separate model download)

Ver Especificaciones →
OpenAI (pesos originales), comunidad GGML / whisper.cpp (archivos cuantizados)
16 variantes

OpenAI Whisper GGML

Whisper es el modelo de reconocimiento de voz de propósito general más avanzado de OpenAI.

Licencia: MIT

Ver Especificaciones →
Useful Sensors
2 variantes

Useful Sensors Moonshine

Moonshine es un modelo de reconocimiento de voz de baja latencia altamente optimizado para dictado en tiempo real en dispositivos con recursos limitados.

Licencia: MIT model; Apache-2.0 Sherpa ONNX runtime

Ver Especificaciones →
NVIDIA (equipo NeMo), comunidad Sherpa ONNX
1 variante

NVIDIA Parakeet ONNX

Parakeet de NVIDIA es un modelo de conversión de voz a texto de última generación optimizado para el inglés.

Licencia: CC BY 4.0 model; Apache-2.0 Sherpa ONNX runtime

Ver Especificaciones →
NVIDIA (equipo NeMo), comunidad Sherpa ONNX
1 variante

NVIDIA Canary ONNX

Canary de NVIDIA es un modelo avanzado de traducción y transcripción de voz multilíngüe.

Licencia: CC BY 4.0 model; Apache-2.0 Sherpa ONNX runtime

Ver Especificaciones →
Google DeepMind
3 variantes

Google Gemma Audio

Gemma Audio es un modelo nativo de extremo a extremo de audio a texto.

Licencia: Gemma Terms of Use; publicly downloadable community LiteRT-LM conversion.

Ver Especificaciones →
Alibaba Group / comunidad llama.cpp
4 variantes

Formateador Alibaba Qwen 3

Qwen 3 es una familia de modelos de lenguaje ligeros y de alto rendimiento (0.

Licencia: Apache-2.0 (Qwen 3 GGUF); Apple platform terms (built-in cleanup)

Ver Especificaciones →