Retour à tapWhisper

Profil du Modèle

Modèles sur l'appareil pris en charge

tapWhisper est conçu pour fonctionner entièrement hors ligne et sur l'appareil pour une confidentialité et des performances maximales. Découvrez nos modèles.

Apple Inc.
1 variante

Apple Speech sur macOS

Apple Speech est le moteur de transcription par défaut de tapWhisper, sans configuration requise.

Licence: Apple platform terms (macOS system framework; no separate model download)

Voir les Spécifications →
OpenAI (poids originaux), communauté GGML / whisper.cpp (fichiers quantifiés)
16 variantes

OpenAI Whisper GGML

Whisper est le modèle de reconnaissance vocale polyvalent le plus avancé d'OpenAI.

Licence: MIT

Voir les Spécifications →
Useful Sensors
2 variantes

Useful Sensors Moonshine

Moonshine est un modèle de reconnaissance vocale à faible latence hautement optimisé pour la dictée en temps réel sur les appareils aux ressources limitées.

Licence: MIT model; Apache-2.0 Sherpa ONNX runtime

Voir les Spécifications →
NVIDIA (équipe NeMo), communauté Sherpa ONNX
1 variante

NVIDIA Parakeet ONNX

Parakeet de NVIDIA est un modèle de conversion parole-texte de pointe optimisé pour l'anglais.

Licence: CC BY 4.0 model; Apache-2.0 Sherpa ONNX runtime

Voir les Spécifications →
NVIDIA (équipe NeMo), communauté Sherpa ONNX
1 variante

NVIDIA Canary ONNX

Canary de NVIDIA est un modèle avancé de transcription et de traduction vocale multilingue.

Licence: CC BY 4.0 model; Apache-2.0 Sherpa ONNX runtime

Voir les Spécifications →
Google DeepMind
3 variantes

Google Gemma Audio

Gemma Audio est un modèle natif de bout en bout de l'audio au texte.

Licence: Gemma Terms of Use; publicly downloadable community LiteRT-LM conversion.

Voir les Spécifications →
Alibaba Group / communauté llama.cpp
4 variantes

Formateur Alibaba Qwen 3

Qwen 3 est une famille de modèles de langage légers et performants (0.

Licence: Apache-2.0 (Qwen 3 GGUF); Apple platform terms (built-in cleanup)

Voir les Spécifications →