septiembre 9, 2025
imgNota1284

Por Redacción:

Ciudad de México, martes 9 de septiembre de 2025. La app de Gemini añadió soporte oficial para subir archivos de audio y procesarlos directamente en la conversación: puedes transcribir, resumir y extraer puntos clave de notas de voz, entrevistas o podcasts sin pasar por herramientas externas. Según la cobertura técnica más reciente, los usuarios gratis pueden cargar hasta 10 minutos de audio con cinco prompts diarios, mientras que AI Pro/Ultra admiten hasta tres horas por archivo y múltiples adjuntos en una sola sesión; la novedad está disponible en Android, iOS y web. Estas capacidades se apoyan en las funciones de “audio understanding” documentadas por Google para los modelos Gemini 2.5, que incluyen descripción, resumen y transcripción textual de clips sonoros.

En la práctica, el flujo es sencillo y ya verificable: abrir gemini.google.com o la app móvil, adjuntar el audio (MP3/WAV/FLAC, entre otros) y pedir “transcribe”, “resúmelo por temas” o “extrae acuerdos y tareas con marcas de tiempo”. La app permite varios archivos en la misma conversación y —si lo necesitas— comprimirlos en ZIP para su análisis conjunto. Con este cambio, Google acerca a usuarios finales lo que ya ofrecía a desarrolladores vía API para casos de transcripción a escala y análisis de medios largos.

Para quienes trabajan en equipo o en clase, la integración con el ecosistema de Google sigue siendo relevante: en Meet, la opción “Take notes for me” (Gemini en Workspace) genera notas y transcripción durante la videollamada —según la documentación y demostraciones oficiales—, mientras que en la app de Gemini también puedes convertir fuentes en audio tipo “podcast” con Audio Overviews para repasar materiales sin leerlos. Son caminos distintos pero complementarios: Meet cubre la transcripción en vivo; Gemini app procesa audios que ya tienes.

Si hoy quieres configurarlo y evitar transcribir a mano: entra a la app de Gemini o a la web, autoriza el acceso a archivos, adjunta tu audio y formula la instrucción (por ejemplo: “transcribe palabra por palabra y agrega marcas de tiempo cada 30 segundos”). Si estás en Workspace y usas Meet, activa Gemini en tu dominio y, al iniciar la videollamada, pulsa “Take notes for me” para que genere notas y transcripción al cierre. Recuerda los límites de plan y que las funciones de audio de la app están ya desplegándose globalmente.

About The Author

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *