El fundador de Handy, conocido como CJ Pais, empezó a crear esta aplicación para dictar los textos a la computadora cuando se fracturó un dedo y no podía escribir en su teclado, pues su mano quedó inutilizada con una escayola o yeso.
“Probé algunas de las aplicaciones de voz a texto existentes, pero ninguna era de código abierto ni extensible”, dice CJ Pais en el sitio web de la aplicación. “Así que Handy nació para llenar este vacío. Probablemente sea la aplicación de voz a texto más sencilla. Su única función es escribir lo que dices en un cuadro de texto”.
El creador de Handy reitera que es un punto de partida para cuando se requieren funciones de accesibilidad, para quienes desean experimentar con la computación de voz o simplemente prefiere una herramienta que se pueda personalizar.
“El objetivo es crear algo que sirva como herramienta útil y como base para que otros puedan construir sobre ella; un lugar donde la comunidad pueda unirse para crear algo mejor de lo que cualquier persona podría crear sola”, explicó.
La solución se une a otros avances en la materia. De hecho, ya se encuentran disponibles diversas aplicaciones y herramientas, cada una con diferentes grados de efectividad dependiendo de la dicción de la persona, el volumen de la voz y otras situaciones.
Algunas (Good Tape, Pinpoint, Transcriptor, TurboScribe y Amazon Transcribe) realizan transcripciones de archivos de audio a textos y en algunos casos desde videos o llamadas telefónicas. Podemos sumarle el robot Vibe Bot que graba y transcribe reuniones, que fue presentado en el CES 2026.
Pero lo que más se espera ver en este 2026 es la transcripción en tiempo real de voz a texto con miras a sustituir el teclado, como cuando usted dicta una lista, una frase y textos más extensos en su móvil mediante la aplicación de notas. The New York Times definió que esta es una de las tendencias del año 2026.

Handy
Handy es una aplicación de dictado de voz que convierte la voz en texto de manera rápida y sencilla. Está disponible gratis para computadoras personales con sistemas operativos Windows, macOS y Linux.
Utiliza modelos de inteligencia artificial (IA) como OpenAI Whisper y Nvidia Parakeet para realizar la transcripción, garantizando privacidad y seguridad de los datos del usuario.
OpenAI Whisper y Nvidia Parakeet son dos modelos de código abierto y se destacan por los importantes avances en la conversión de voces humanas en texto, así como al añadir correctamente la puntuación y las mayúsculas. Pero son complicados de configurar.
Esto es lo que resuelve Handy. Usted descarga la aplicación y, después de unos pasos simples, la puede utilizar.
Para dictar, usted hace clic simultáneo en las teclas de Ctrl + Barra de espacio y las sostiene mientras va dictando el texto. Si se personaliza un atajo en el teclado o un micrófono se puede dictar el texto sin necesidad de mantener presionadas esas dos teclas.
En todo caso, usted verá una superposición en la parte inferior que indica que está transcribiendo y al terminar aparecerá el texto. Una ventaja es que la aplicación filtra el ruido ambiente (música, televisores, aire acondicionado, motores, otras personas conversando).
La configuración avanzada permite refinar las opciones, iniciando el software al encender la PC o la laptop. También se puede añadir palabras personalizadas.
En mis pruebas, el texto generado fue muy limpio y solamente requirió algunos cambios menores.
Otras herramientas
Si usted desea probar otras soluciones, puede recurrir a las siguientes, tanto en el ámbito personal como en su empresa:
Scribe v2
Es un modelo de voz a texto en tiempo real muy preciso: detecta automáticamente cuándo comienza y termina el dictado y lo segmenta para el procesamiento en vivo más fluido.
La transcripción se ejecuta en menos de 150 milisegundos y ofrece protección de datos a nivel empresarial mediante encriptación “en tránsito y en reposo”.
Está disponible mediante una aplicación tipo API o agentes de IA, al tiempo que utiliza la plataforma de transmisión de ElevenLabs (una empresa de IA especializada en la síntesis de voz) para convertir voz en vivo en texto instantáneamente en más de 90 idiomas.
Crea subtítulos y transcripciones editables para podcasts, videos, entrevistas y otros contenidos grabados.
Dictation
Se trata de una web muy sencilla y sin grandes complicaciones que sirve para dictar textos que se transcriban.
Tiene la ventaja de que ofrece un enlace a los comandos de formato para señalar la puntuación: el punto, la coma, guion u otros signos o elementos.
El resultado lo muestra en una hoja virtual de papel, con opciones para darle formato al texto resultante, copiarlo o guardarlo en la PC, imprimirlo y hasta compartirlo en redes sociales si lo desea.
No requiere registro.
En Google Docs
Si usted es usuario de Gmail, en los documentos creados en Google Drive podrá ir a Herramientas y encontrar Escribir por voz (a la par verá el ícono de micrófono).
Es útil, en especial, para transcripciones cortas, pues para las largas (clases o reuniones) no funciona con la misma eficiencia, de acuerdo a las diferentes reseñas. Tampoco es eficiente con la puntuación.
También es gratuito y funciona con gran cantidad de idiomas. No tiene funciones para transcripción de archivos de audio (Google ofrece Pinpoint en este último caso).
En mis pruebas, el texto generado requirió mayor cuidado, intervención y edición. Pese a eso, es una buena alternativa si desea dictar sus textos.
Microsoft Speech to Text
Microsoft cuenta con una funcionalidad de dictado de voz en las PC, pero en este momento indica no estar disponible en Costa Rica actualmente.
Aparte, la firma tiene un servicio de transcripción de textos (Speech to Text) mediante su plataforma en la nube Azure para empresas y desarrolladores.
Para pequeñas traducciones se podría utilizar una demo gratuita y sin necesidad de registrarse.
ListenAll
Es una aplicación de origen español disponible para dispositivos con sistemas operativos Android o iOS.
El funcionamiento también es sencillo: el usuario dicta y la aplicación lo transcribe en la pantalla.
Las notas resultantes se pueden editar, guardar o exportar.
