ਮਾਡਲ ਪ੍ਰੋਫਾਈਲ

ਸਮਰਥਿਤ ਆਨ-ਡੀਵਾਈਸ ਮਾਡਲ

tapWhisper ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਪ੍ਰਾਈਵੇਸੀ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਪੂਰੀ ਤਰ੍ਹਾਂ ਆਫਲਾਈਨ ਅਤੇ ਆਨ-ਡੀਵਾਈਸ ਚਲਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਸਾਡੇ ਇੰਜਣ ਦੁਆਰਾ ਸਮਰਥਿਤ ਮਾਡਲ ਦੇਖੋ।

Apple Inc.

1 ਵੇਰੀਐਂਟ

macOS ਤੇ Apple Speech

Apple Speech, tapWhisper ਵਿੱਚ ਡਿਫੌਲਟ, ਜ਼ੀਰੋ-ਕੌਂਫਿਗਰੇਸ਼ਨ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਇੰਜਣ ਹੈ। ਇਹ Apple ਦੇ ਇਨ-ਬਿਲਟ Speech ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ 100% ਡਿਵਾਈਸ ਤੇ ਹੀ ਚੱਲਦਾ ਹੈ। ਇਹ ਲਗਭਗ ਜ਼ੀਰੋ ਸੈੱਟਅੱਪ ਸਮਾਂ ਲੈਂਦਾ ਹੈ, ਬਹੁਤ ਘੱਟ ਰੈਮ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਅਤੇ Apple Silicon (M1/M2/M3/M4) ਅਤੇ Intel ਚਿੱਪਾਂ ਲਈ ਬਹੁਤ ਵਧੀਆ ਹੈ। ਕਿਉਂਕਿ ਇਹ ਸਿਸਟਮ API ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਮਾਡਲ ਫਾਈਲਾਂ ਡਾਊਨਲੋਡ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਪੈਂਦੀ।

ਲਾਇਸੈਂਸ: Apple platform terms (macOS system framework; no separate model download)

ਮਾਡਲ ਵੇਰਵਾ ਦੇਖੋ →

OpenAI (ਅਸਲ ਵੇਟਸ), GGML / whisper.cpp ਕਮਿਊਨਿਟੀ (ਕੁਆਂਟਾਈਜ਼ਡ ਫਾਈਲਾਂ)

16 ਵੇਰੀਐਂਟ

OpenAI Whisper GGML

Whisper, OpenAI ਦਾ ਵਿਸ਼ਵ-ਪੱਧਰੀ ਭਾਸ਼ਣ ਪਛਾਣ ਮਾਡਲ ਹੈ। tapWhisper ਵਿੱਚ, Whisper ਮਾਡਲ Apple Silicon ਤੇ ਪੂਰੇ ਮੈਟਲ ਜੀਪੀਯੂ ਨਾਲ whisper.

ਲਾਇਸੈਂਸ: MIT

ਮਾਡਲ ਵੇਰਵਾ ਦੇਖੋ →

Useful Sensors

2 ਵੇਰੀਐਂਟ

Useful Sensors Moonshine

Moonshine ਇੱਕ ਬਹੁਤ ਹੀ ਹਲਕਾ ਅਤੇ ਘੱਟ ਲੇਟੈਂਸੀ ਵਾਲਾ ਮਾਡਲ ਹੈ ਜੋ ਰੀਅਲ-ਟਾਈਮ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਬਹੁਤ ਘੱਟ ਮੈਮੋਰੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵ੍ਹੀਸਪਰ ਜਿੰਨੀ ਹੀ ਸ਼ੁੱਧਤਾ ਨਾਲ ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਕੰਮ ਕਰਦਾ ਹੈ। ਇਹ Sherpa ONNX ਰਨਟਾਈਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਚੱਲਦਾ ਹੈ।

ਲਾਇਸੈਂਸ: MIT model; Apache-2.0 Sherpa ONNX runtime

ਮਾਡਲ ਵੇਰਵਾ ਦੇਖੋ →

NVIDIA (NeMo ਟੀਮ), Sherpa ONNX ਕਮਿਊਨਿਟੀ

1 ਵੇਰੀਐਂਟ

NVIDIA Parakeet ONNX

NVIDIA ਦਾ Parakeet ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾ ਲਈ ਇੱਕ ਸ਼ਾਨਦਾਰ ਮਾਡਲ ਹੈ। ਇਹ Sherpa ONNX ਇੰਜਣ ਰਾਹੀਂ ਚਲਾਉਣ ਲਈ INT8 ONNX ਫਾਰਮੈਟ ਵਿੱਚ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਕੋਡਿੰਗ ਅਤੇ ਆਮ ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਸਹੀ ਅਤੇ ਤੇਜ਼ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ।

ਲਾਇਸੈਂਸ: CC BY 4.0 model; Apache-2.0 Sherpa ONNX runtime

ਮਾਡਲ ਵੇਰਵਾ ਦੇਖੋ →

NVIDIA (NeMo ਟੀਮ), Sherpa ONNX ਕਮਿਊਨਿਟੀ

1 ਵੇਰੀਐਂਟ

NVIDIA Canary ONNX

NVIDIA ਦਾ Canary ਇੱਕ ਉੱਨਤ ਬਹੁਭਾਸ਼ਾਈ ਮਾਡਲ ਹੈ ਜੋ ਅੰਗਰੇਜ਼ੀ, ਸਪੈਨਿਸ਼, ਜਰਮਨ ਅਤੇ ਫ੍ਰੈਂਚ ਭਾਸ਼ਾਵਾਂ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। ਇਹ ਆਨ-ਡਿਵਾਈਸ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਰੱਖਦਾ ਹੈ। ਇਹ ਸ਼ੇਰਪਾ ਓਐਨਐਨਐਕਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਹੁਤ ਵਧੀਆ ਕੰਮ ਕਰਦਾ ਹੈ।

ਲਾਇਸੈਂਸ: CC BY 4.0 model; Apache-2.0 Sherpa ONNX runtime

ਮਾਡਲ ਵੇਰਵਾ ਦੇਖੋ →

Google DeepMind

3 ਵੇਰੀਐਂਟ

Google Gemma ਆਡੀਓ ਮਾਡਲ

Gemma Audio ਇੱਕ ਨੇਟਿਵ ਐਂਡ-ਟੂ-ਐਂਡ ਆਡੀਓ-ਟੂ-ਟੈਕਸਟ ਮਾਡਲ ਹੈ। ਇਹ ਸਿੱਧਾ ਆਵਾਜ਼ ਦੀ ਤਰੰਗ ਨੂੰ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਬਿਨਾਂ ਵਿਚਕਾਰਲੇ ਕਿਸੇ ਸਟੈਪ ਦੇ। ਇਹ ਇੱਕ ਲੋਕਲ LiteRT-LM ਸਰਵਰ ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ। ਡਿਕਟੇਸ਼ਨ ਦੌਰਾਨ ਤੁਰੰਤ ਵਰਤੋਂ ਲਈ ਇਹ ਹਮੇਸ਼ਾ ਮੈਮੋਰੀ ਵਿੱਚ ਰਹਿੰਦਾ ਹੈ।

ਲਾਇਸੈਂਸ: Gemma Terms of Use; publicly downloadable community LiteRT-LM conversion.

ਮਾਡਲ ਵੇਰਵਾ ਦੇਖੋ →

Alibaba Group / llama.cpp ਕਮਿਊਨਿਟੀ

4 ਵੇਰੀਐਂਟ

Alibaba Qwen 3 ਫਾਰਮੈਟਰ

Qwen 3 ਇੱਕ ਹਲਕਾ ਅਤੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲਾ ਭਾਸ਼ਾ ਮਾਡਲ ਹੈ ਜੋ ਟੈਕਸਟ ਦੇ ਫਾਰਮੈਟ ਨੂੰ ਸੁਧਾਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। tapWhisper ਵਿੱਚ, ਇਹ ਲੋਕਲ ਹੋਸਟ llama.

ਲਾਇਸੈਂਸ: Apache-2.0 (Qwen 3 GGUF); Apple platform terms (built-in cleanup)

ਮਾਡਲ ਵੇਰਵਾ ਦੇਖੋ →