La Inteligencia Artificial es probablemente el tema más importante del año en materia de innovación y tecnología. La llegada de la cuarta versión de ChatGPT, o los avances que mostró Dall-E son algunas de las cosas que sucedieron este 2024.
No obstante, cuando parecía que por este año no había lugar para nada más, esta semana tuvimos importantes novedades en Gork, Sora y NotebookLM.
Grok
La IA perteneciente a la red social X, lanzada en 2023, cierra el año de manera hiper promisoria. A principios de 2024, X lanzó Grok-1.5, una versión mejorada del chatbot, diseñada exclusivamente para los suscriptores premium. Con esta actualización, la plataforma buscó mejorar la interacción y fidelizar a su comunidad de usuarios más comprometidos.
En marzo, Musk anunció el lanzamiento de Grok 2, acompañado de una decisión estratégica: liberar su código y mantenerlo como un beneficio exclusivo para usuarios premium.
La expectativa alrededor de esta IA fue creciendo, especialmente con la breve introducción de “Grok 2 + Aurora”, una función para generar imágenes fotorealistas que luego fue sustituida por “Grok 2 + FLUX beta”. Yo, por ejemplo, le pedí que hiciera la foto de algo que no sucedió: Diego Maradona entregándole la Copa del Mundo a Lionel Messi, como se ve en la foto que ilustra esta nota. El nivel de realismo es impresionante.
Cerrando el año, en diciembre de 2024, X amplió el acceso a Grok de forma gratuita para todos sus usuarios. Sin embargo, los no suscriptores enfrentan límites en el uso: un máximo de 10 preguntas cada dos horas.
Sora
El 9 de diciembre de 2024, OpenAI presentó oficialmente Sora, un modelo de inteligencia artificial capaz de generar videos a partir de texto, imágenes y clips preexistentes. Promete ampliar los horizontes creativos al permitir a los usuarios crear, mezclar y combinar contenido visual de forma intuitiva e hiper sofisticada.
La herramienta se encuentra disponible para suscriptores de los planes ChatGPT Plus y Pro, con opciones de generación que varían en resolución y duración. Por ejemplo, los usuarios del plan Pro pueden crear videos en calidad Full HD de hasta 20 segundos, descargarlos sin marca de agua y disfrutar de generaciones ilimitadas. No obstante, su disponibilidad inicial está restringida a Estados Unidos y otros países seleccionados, mientras que en regiones como Europa, Suiza y el Reino Unido, el acceso se ha retrasado debido a regulaciones locales y preocupaciones de privacidad.
Otro punto no menor es el consumo energético: un video de 30 segundos puede requerir el equivalente entre 0,5 y 4 lts de agua. Algo similar a lo que sucede con ChatGPT, que consume 1 litro de agua por cada 100 preguntas. Habrá que darle un uso responsable.
NotebookLM
Aunque fue lanzada hace algunos meses, reconozco que comencé a utilizar NotebookLM recientemente. Esta herramienta, desarrollada por Google, se posiciona como un asistente de IA centrado en la organización y síntesis de información para el aprendizaje y la productividad. Una de sus características más distintivas es que su interacción inicia con “las fuentes”.
El usuario carga documentos, como artículos, PDFs, notas o cualquier otro contenido relevante —incluyendo a todo el ecosistema de Google, como videos de Youtube—, y NotebookLM utiliza esas fuentes como base para responder preguntas, generar resúmenes o crear explicaciones detalladas. Esto asegura que las respuestas sean contextualizadas y personalizadas según los materiales proporcionados. Videos aburridos de 20 minutos ahora se resumen en pocas palabras.
Desde su lanzamiento, Google ha implementado actualizaciones importantes. En octubre de 2024, la herramienta añadió la capacidad de trabajar con múltiples fuentes simultáneamente, permitiendo a los usuarios combinar datos de distintos documentos para generar análisis más profundos. También introdujo una funcionalidad de exportación optimizada, que permite transformar los resúmenes generados en informes editables listos para compartir.
Sin embargo, el verdadero potencial de NotebookLM reside en su enfoque educativo y profesional. Para estudiantes, investigadores o creativos, es una herramienta que promete revolucionar la manera en que estructuramos y reutilizamos el conocimiento. Su implementación aún es limitada geográficamente, pero se espera que su alcance se expanda significativamente en 2025.
Cada una de estas innovaciones refleja un avance significativo en cómo interactuamos con la tecnología y ampliamos nuestras capacidades creativas y de análisis. Sin duda, 2024 cierra como un año fundamental en la historia y democratización de la Inteligencia Artificial. ¿Estamos preparados para lo que viene?