Handy : l'application de reconnaissance vocale open source
Handy est une application de reconnaissance vocale open source et extensible, optimisée pour la confidentialité, que j'ai explorée. Elle fonctionne totalement hors ligne.
J'ai récemment exploré Handy, une application de reconnaissance vocale entièrement gratuite et open source qui fonctionne sans connexion Internet. Développée avec Tauri (Rust + React/TypeScript), Handy se concentre sur une transcription vocale simple et respectueuse de la vie privée. En appuyant sur un raccourci clavier, vous pouvez dicter votre texte qui apparaîtra dans n'importe quel champ, sans que votre voix ne soit envoyée dans le cloud.
« Handy ne cherche pas à être la meilleure application, mais la plus adaptable ». C'est là son véritable objectif.
Pourquoi j'utilise Handy
Handy comble un vide pour une réelle solution open source de reconnaissance vocale. Comme mentionné sur handy.computer :
- Gratuit : Les outils d'accessibilité doivent être accessibles à tous.
- Open Source : Chacun peut l'étendre pour ses besoins et contribuer à un projet plus vaste.
- Privé : Votre voix reste sur votre ordinateur, jamais dans le cloud.
- Simple : Un seul outil, une seule fonction : transcrire ce que vous dites dans une boîte de texte.
Comment cela fonctionne
Vous appuyez sur un raccourci clavier configurable pour commencer/arrêter l'enregistrement (ou en utilisant le mode push-to-talk). Vous parlez pendant que le raccourci est actif, puis la transcription est réalisée localement et collée directement dans l'application que vous utilisez.
Technologie derrière Handy
VAD(Voice Activity Detection) avecSilerofiltre les silences.- Choix entre divers modèles de transcription :
- Modèles
Whisper(Petit/Moyen/Turbo/Grand) avec accélération GPU si disponible. Parakeet V3— modèle optimisé pour CPU avec détection automatique de la langue.
Compatible avec Windows, macOS et Linux, Handy se révèle être une solution pratique.
Premiers pas et installation
Pour commencer, il faut télécharger la dernière version depuis la page de publications ou le site web, puis suivre les instructions spécifiques à la plateforme. Handy nécessite des autorisations système : microphone, accessibilité. Ensuite, vous configurez vos raccourcis clavier préférés dans les paramètres et commencez à transcrire.
Impossible d'éviter certains problèmes
Ce projet en développement actif présente quelques limitations, telles que des crashs des modèles Whisper sur certaines configurations Windows et Linux. De plus, Handy offre un support limité pour le serveur d'affichage Wayland sur Linux.
Mon verdict
En conclusion, Handy propose une approche libre et modulaire de la transcription vocale, idéale pour ceux qui souhaitent une solution locale et personnalisable à la reconnaissance vocale. Attention toutefois à ses limites techniques actuelles. Je recommande Handy pour les environnements bien structurés.
Article inspiré de GitHub