27.3 C
Resistencia
24 octubre, 2024

Todo sobre Sora, la excitante inteligencia artificial para generar videos complejos con órdenes simples

Es un nuevo desarrollo de OpenAI, la organización detrás del famoso ChatGPT. ¿Cómo se usa, para qué sirve y cuándo se lanza a nivel general?

Uriel Bederman

24 de febrero 2024, 05:37hs

Lanzado este mes, Sora expande los servicios basados en IA que ofrece OpenAI. (Foto: Adobe Stock)

Lanzado este mes, Sora expande los servicios basados en IA que ofrece OpenAI. (Foto: Adobe Stock)

El reciente lanzamiento de Sora, un sistema de inteligencia artificial para generar videos desde cero, partiendo de indicaciones por escrito, no ha provocado tanta excitación como cuando ChatGPT apareció en escena, en noviembre de 2022. ¿Acaso nos acostumbramos a este presente futurista? Como fuere, la nueva propuesta de OpenAI merece que soltemos alaridos de entusiasmo. Ocurre que, tal como dicen en Genbeta, no solo permite crear clips hiperrealistas: también inventa nuevos mundos.

¿Querés recibir más noticias de Tecno?

Suscribite acáEn esta nota de TN Tecno revisaremos los detalles de OpenAI Sora. Cómo funciona, qué contenidos permite crear, cuándo estará disponible para echar mano en el sistema y qué medidas de seguridad precisará. Además, algunas curiosidades sobre el generador.

¿Qué es Sora, el generador de videos de OpenAI?

Ya abordamos esta pregunta en ocasión del anuncio de Sora, que la organización estadounidense realizó este mismo mes. Para ensayar una definición, lo primero que hay que decir es que se trata de un modelo de inteligencia artificial generativa para la creación de videos. Proviniendo de OpenAI, es esperable que herede características del famoso bot conversacional ChatGPT y de DALL-E, un programa que para generar imágenes y dibujos.

Video PlaceholderVideo creado por Sora, la nueva inteligencia artificial de OpenAI. (Video: OpenAI)

Igual que aquellos modelos, Sora comprende indicaciones en formato de texto; en este caso, las “traduce” a un video en lugar de párrafos o imágenes. En la práctica, el usuario de este ingenio escribe su pedido —prompt, en la jerga de la inteligencia artificial— para que el sistema responda con contenido. Por ejemplo, para un clip como el que sigue habría que escribir algo como esto: “Un hombre y una mujer, sentados en reposeras, en una playa, cerca del mar. Él lee un libro y ella se sobresalta cuando en el agua asoman tiburones”.

Video Placeholder

Detalles sobre el funcionamiento de OpenAI Sora

¿Cómo logra sus encantadores resultados? Igual que otros modelos de su especie, la clave es el entrenamiento con datos. En este caso, una amplia biblioteca de imágenes con movimiento, debidamente etiquetadas. Así, si le pedimos un video de gatitos revisará las coincidencias en su base.La versión anunciada genera videos de hasta 60 segundos de duración.En el sitio web oficial del proyecto, OpenAI publica varios ejemplos; allí vemos clips en formato horizontal y también en vertical.Igual que ocurre con ChatGPT y afines, la clave para generar buen contenido es la adecuada generación de los prompts. Anteriormente, en TN Tecno enumeramos consejos para hacerle pedidos a las nuevas IAs generativas. Los más relevantes: usar un lenguaje llano, evitar rodeos y ahondar en detalles.Sora es como DALL-E o Midjourney, aunque en lugar de generar imágenes estáticas crea clips con movimiento.

Una curiosidad: ¿qué significa la palabra Sora?

OpenAI encabeza el auge de la IA generativa y acaba de sumar a Sora a su catálogo de servicios.

OpenAI encabeza el auge de la IA generativa y acaba de sumar a Sora a su catálogo de servicios. Por: AP

No encontramos una referencia oficial, dicha por OpenAI, respecto al significado del término Sora que eligieron para bautizar al generador de videos. Una pesquisa muestra las siguientes posibilidades y la primera encajaría.

En japonés, significa “cielo”; representa la vastedad y la libertad. También apunta a las capacidades y habilidades.En la Biblia, es una región o ciudad en las llanuras que pertenece al territorio de Judá.

¿Cómo usar Sora de OpenAI?

La respuesta podría desilusionarte. Por ahora, Sora no está disponible para jugar y crear. Según explicaron desde OpenAI, en este momento evalúan aspectos críticos para limpiar al sistema de posibles daños, vulnerabilidades y riesgos. “Estamos compartiendo el progreso de nuestra investigación desde el principio para comenzar a trabajar y recibir comentarios de terceros para brindarle al público una idea de las capacidades de IA que hay en el horizonte”, señalaron desde la organización que lidera Sam Altman.

Leé también: Las novias creadas con inteligencia artificial son “tóxicas y generan dependencia”, asegura un estudio

En este período de prueba inicial, solo algunos privilegiados tienen acceso a Sora, entre ellos diseñadores, artistas visuales y cineastas. El propósito es recibir comentarios de los profesionales para ajustar las tuercas que sea necesario apretar, antes de un lanzamiento generalizado.

El grupo radicado en California aún no anunció cuándo prevé lanzar el generador. Ahora, todo es expectativa. Mientras tanto, es posible probar algunas alternativas a Sora. Algunas disponibles son Pika y Runway, aunque los resultados que arrojan no siempre se ajustan a la excelencia. Claro: el generador de OpenAI tiene, por el momento, la ventaja de no haber sido lanzado al público general. Así, los videos que vemos son “oficiales” y, en ese sentido, encantadores y sin fisuras. Por eso, para un veredicto certero será necesario esperar. Y las fallas no nos sorprenderían, considerando que la IA generativa no es siempre perfecta al trabajar con imágenes, incluso con las estáticas. ¡Quién no recuerda las extrañas manos con seis dedos creadas por DALL-E y otros programas del rubro!

Videos sintéticos: el gesto evolutivo de la inteligencia artificial generativa y los riesgos a tener en cuenta

Dice OpenAI que “Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo”. Además, presume que “el modelo no solo comprende lo que el usuario pidió en el mensaje, sino también cómo existen esas cosas en el mundo físico”.

Las promesas son excitantes. Tal como subrayamos al inicio de este repaso, no se trata únicamente de la creación de clips. En paralelo, este generador permitirá crear mundos y materializar extravagancias de la imaginación sin más esfuerzo que algunas instrucciones bien redactadas. El mismísimo Altman compartió algunos ejemplos en sus redes sociales. Uno de los más alocados muestra a una criatura mitad pato, mitad dragón, pronto a volar bajo las instrucciones de un ratoncito ensombrerado.

Video PlaceholderUn video generado con Sora de OpenAI. (Video: X/sama)

Hay otro fantástico —en el sentido amplio del término— en el que vemos a un montón de bichos marinos andando en bicicleta.

Video PlaceholderUn video generado con Sora de OpenAI. (Video: X/sama)

Las capacidades de Sora no se agotan en los videos que parecen ciencia ficción o surgidos de mentes surrealistas. En su receta además hay animaciones y también hiperrealismo, como el clip en el que vemos a una señora cocinando. Eso sí: ciertos movimientos delatan su carácter sintético.

Video PlaceholderUn video generado con Sora de OpenAI. (Video: X/sama)

No es que seamos muy astutos al encontrar esos signos de irrealidad en el video. Los propios creadores de Sora reconocieron que el modelo actual presenta algunas debilidades. “Puede tener dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, y es posible que después no tenga la marca del mordisco”, observan.

En este punto, cabe notar que los riesgos aumentarán conforme el trabajo de Sora gane realismo. Los videos sumarán más problemas a los que ya provocan las imágenes, textos y voces que se generan con IA. ¿Cómo distinguirlos de los creados por humanos y/o los “reales”? Esto no es trivial. Si bien es fácil saber que hubo edición, por ejemplo, si vemos un video en el que un gato gigantesco está sentado en un trono de rey; serán más problemáticos otros casos. Por ejemplo, deepfakes que desnudan a celebridades y otras falsificaciones que podrían hacernos creer escenas que jamás ocurrieron en el mundo tangible.

Video PlaceholderOpenAI prometió tomar cartas en el asunto. “Tendremos varias medidas de seguridad importantes antes de que Sora esté disponible (…) Estamos trabajando con expertos en áreas como desinformación, contenido de odio y prejuicios, que probarán el modelo de manera inversa”. Esa última referencia apunta a una práctica cada vez más frecuente entre los desarrolladores de inteligencia artificial, que para ello conforman “equipos rojos”. ¿De qué se trata? Es una metodología tomada de la Guerra Fría, que consiste en probar los escenarios menos favorables y más desafiantes. En este caso, testear las funciones más nocivas del modelo para trabajar sobre ellas en un ambiente controlado.

Leé también: Google, Meta y Apple crearán “equipos rojos” para abordar los riesgos de la inteligencia artificial

“También estamos creando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede indicar cuándo Sora generó un video. Además, nuestro clasificador de texto verificará y rechazará las solicitudes de ingreso de texto que infrinjan nuestras políticas de uso, como aquellas que solicitan violencia extrema, contenido sexual, imágenes de odio, imágenes de celebridades o la propiedad intelectual de terceros”, indicaron desde OpenAI.

Video PlaceholderUn video generado con Sora de OpenAI. (Video: X/sama)

Ellos arreglan lo que les corresponde y nosotros esperamos con ansias que el sistema sea encantador, seguro, respetuoso y eficiente. Mientras tanto, nos deleitamos con la promesa que parece salida de la serie Black Mirror. ¿Quién imaginó, hace poquitos años, que con algunas pocas palabras será posible generar un video tan estrambótico como aquel en el que vemos a dos perritos, cual locutores o podcasters, en un escenario montañoso; y otro en el que un bicho animado y rarísimo juega con la llama de una vela?

Últimas Noticias
NOTICIAS RELACIONADAS