Nuestro primer vistazo a las nuevas descripciones de video

Unos días antes de que Google iniciara la E/S 2025, vimos evidencia de que la compañía estaba trabajando en una característica emocionante para uno de sus productos de IA más interesantes. Notebooklm obtendría vistas generales de video en la parte superior de la función de descripción general de audio existente que le permite convertir los informes de IA en podcasts, incluidos los interactivos donde puede hablar con la IA.

Las descripciones de video suenan aún más geniales. Como expliqué en ese momento, ya estoy soñando con un futuro en el que pueda pedirle a la IA que cree una ilustración visual de un concepto que me explica. Preferiría un video en lugar de una imagen, pero eso aún no es posible.

Luego se cayó la nota de apertura oficial de E/S 2025, llena de anuncios de IA. Géminis y Ai fueron todo de los que Google podía hablar. No había espacio para nada más, lo que ya sabíamos, considerando que Google tenía la parte de Android 16 de la presentación la semana pasada.

Google no mencionó las descripciones de video durante la nota principal principal, pero resulta que la función llegará a NotebookLM, y las primeras muestras están disponibles ahora.

Google anunció en una publicación de blog que está infundiendo Learnlm en Gemini 2.5, algo que escuchamos durante la principal nota principal. Pero ahí es donde Google también dejó caer el anuncio de visión de videos.

Primero, Google anunció que los usuarios de NotebookLM podrán personalizar la longitud de los podcasts de descripción general de audio. Podrá elegir entre versiones más cortas y más largas de los resúmenes de audio generados por AI que obtenga al alimentar fuentes en NotebookLM.

Le expliqué más de una vez que deseo que ChatGPT Deep Research apoyara una característica similar, por lo que puedo convertir esos grandes informes en experiencias de audio para escuchar en mis carreras. La capacidad de ajustar la longitud del resumen de audio debe ser útil.

Google también confirmó que están ocurriendo vistas generales de video, diciendo que “escuchó de los usuarios que les gustaría más pistas visuales durante las descripciones general”. Las descripciones de video no estarán disponibles de inmediato para los usuarios. Pronto llegarán, pero no está claro cuánto tiempo llevará.

Google proporcionó algunas muestras, y mi primera reacción es que debes moderar tus expectativas. Google no está utilizando la nueva tecnología VEO 3 para crear algún tipo de videoclips sorprendentes para explicar los contenidos en sus informes de cuaderno. Pero creará diapositivas y usará imágenes del material fuente para convertir esos resúmenes en contenido de video que es más fácil de digerir.

Por ejemplo, la siguiente descripción general del video analiza las placas tectónicas después de una excursión. El clip claramente se dirige a los estudiantes jóvenes y resume lo que aprendieron durante su viaje. Tiene solo un minuto, pero es una excelente manera de usar la función para explicar los conceptos.

El video presenta diapositivas de texto, pero también algunas imágenes para ayudar a explicar los conceptos que los niños aprendieron. No está claro si esas imágenes fueron generadas por IA o si son parte de los materiales que el maestro habría subido a cuaderno.

Las descripciones de video pueden ser más largas, ya que Google también compartió dos videos adicionales para una audiencia diferente: las personas interesadas en las noticias de Gemini, ya sean usuarios o desarrolladores regulares de IA.

Gemini usó la función para crear presentaciones de video que dan aproximadamente 10 minutos cada una. Como puede ver a continuación, hacen un gran trabajo que resume los anuncios de E/S 2025 de Google.

Las descripciones de video incluyen imágenes de los blogs y videos que Google solía anunciar las nuevas funciones de IA, y son fáciles de digerir. Un anfitrión generado por IA te habla sobre los diversos temas, explicando cosas en el camino.

Una vez más, no es nada demasiado sofisticado, y algunas personas podrían no apreciar las descripciones de video. Pero es una característica con gran potencial. Con suerte, lo veremos pronto en Notebooklm y la aplicación Gemini.

Como usuario de ChatGPT desde hace mucho tiempo, me gustaría resumen similares en ChatGPT. En esa nota, ahora que NotebookLM está disponible como una aplicación de Android y iPhone, puede convertir su investigación de chatgpt profunda en PDFS y luego alimentarlos en NotebookLM para descripción de audio. Una vez que estén disponibles las descripciones de video, es posible que desee hacer la cosa.