tapWhisper ਤੇ ਵਾਪਸ ਜਾਓ
ਮਾਡਲ ਪ੍ਰੋਫਾਈਲ

Google Gemma ਆਡੀਓ ਮਾਡਲ

3 ਵੇਰੀਐਂਟ

ਤਕਨੀਕੀ ਵੇਰਵੇ

ਆਕਾਰ 4 GB ਤੋਂ 12 GB
ਆਰਕੀਟੈਕਚਰ ਮਲਟੀ-ਮੋਡਲ ਐਲਐਲਐਮ
ਲੇਟੈਂਸੀ ਘੱਟ (ਐਂਡ-ਟੂ-ਐਂਡ)
ਭਾਸ਼ਾ ਬਹੁਭਾਸ਼ਾਈ

ਡਿਵੈਲਪਰ / ਨਿਰਮਾਤਾ

Google DeepMind

ਲਾਇਸੈਂਸ

Gemma Terms of Use; publicly downloadable community LiteRT-LM conversion.

ਡਾਊਨਲੋਡ ਸਰੋਤ

Source Repository

Hugging Face ਹੱਬ / ਗੂਗਲ ਮਾਡਲ ਰਜਿਸਟਰੀ

litert-community Gemma 4 & Gemma 3n Mirror

ਮਾਡਲ ਸੰਖੇਪ ਜਾਣਕਾਰੀ

Gemma Audio ਇੱਕ ਨੇਟਿਵ ਐਂਡ-ਟੂ-ਐਂਡ ਆਡੀਓ-ਟੂ-ਟੈਕਸਟ ਮਾਡਲ ਹੈ। ਇਹ ਸਿੱਧਾ ਆਵਾਜ਼ ਦੀ ਤਰੰਗ ਨੂੰ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਬਿਨਾਂ ਵਿਚਕਾਰਲੇ ਕਿਸੇ ਸਟੈਪ ਦੇ। ਇਹ ਇੱਕ ਲੋਕਲ LiteRT-LM ਸਰਵਰ ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ। ਡਿਕਟੇਸ਼ਨ ਦੌਰਾਨ ਤੁਰੰਤ ਵਰਤੋਂ ਲਈ ਇਹ ਹਮੇਸ਼ਾ ਮੈਮੋਰੀ ਵਿੱਚ ਰਹਿੰਦਾ ਹੈ।

ਉਪਲਬਧ ਮਾਡਲ ਵੇਰੀਐਂਟ

ਮਾਡਲ ਵੇਰੀਐਂਟ ਫਾਈਲ ਅਕਾਰ ਰੈਮ ਵਰਤੋਂ ਫਾਰਮੈਟ/ਕੁਆਂਟ ਭਾਸ਼ਾਵਾਂ ਵੇਰਵਾ
Gemma 3n 3.41 GB 3.8 GB INT4 (LiteRT) ਬਹੁ-ਭਾਸ਼ਾਈ ਜੇਮਾ ਵਰਤੋਂ ਦੀਆਂ ਸ਼ਰਤਾਂ; ਜਨਤਕ ਤੌਰ 'ਤੇ ਡਾਊਨਲੋਡ ਕਰਨ ਯੋਗ ਕਮਿਊਨਿਟੀ LiteRT-LM ਰੂਪਾਂਤਰਣ।
Gemma 4 E2B 2.41 GB 1.7 GB INT8 (LiteRT) ਬਹੁ-ਭาਸ਼ਾਈ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ-ਸਮਰੱਥ LiteRT-LM ਮਾਡਲ। ਬਹੁਤ ਕੁਸ਼ਲ ਐਂਡ-ਟੂ-ਐਂਡ ਮਾਡਲ।
Gemma 4 E4B 3.41 GB 3.3 GB INT8 (LiteRT) ਬਹੁ-ਭਾਸ਼ਾਈ ਉੱਨਤ ਸਮਰੱਥਾ ਵਾਲਾ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ ਮਾਡਲ। ਉੱਨਤ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ।
Gemma 4 12B 6.10 GB 12.0 GB INT8 (LiteRT) ਬਹੁ-ਭਾਸ਼ਾਈ ਉੱਚ ਸ਼ੁੱਧਤਾ ਲਈ ਵੱਡਾ ਗੂਗਲ ਜੇਮਾ 4 ਆਡੀਓ ਮਾਡਲ। ਉੱਚ ਰੈਮ ਦੀ ਲੋੜ।