Odysséeune startup fondée par des pionniers autonomes Oliver Cameron et Jeff Hawkea développé un modèle d’IA qui permet aux utilisateurs de «interagir» avec la vidéo en streaming.
Disponible sur le Net dans une «démo précoce», le modèle génère et diffuse des cadres vidéo tous les 40 millisecondes. By way of les contrôles de base, les téléspectateurs peuvent explorer les domaines d’une vidéo, similaire à un jeu vidéo rendu en 3D.
«Compte tenu de l’état actuel du monde, d’une motion entrante et d’une histoire des États et des actions, le modèle tente de prédire le prochain état du monde», » Explique Odyssey dans un article de weblog. « Alimentation Ceci est un nouveau modèle mondial, démontrant des capacités comme la génération de pixels qui semblent réalistes, le maintien de la cohérence spatiale, l’apprentissage des actions à partir de vidéo et la sortie de flux vidéo cohérents pendant 5 minutes ou plus. »
Un sure nombre de startups et de grandes entreprises technologiques poursuivent Modèles mondiauxy compris Profondeurchercheur influent du chercheur Fei-Fei Lee Laboratoires du monde, Microsoftet Décart. Ils croient que les modèles mondiaux pourraient un jour être utilisés pour créer des médias interactifs, tels que des jeux et des movies, et exécuter des simulations réalistes comme des environnements d’entraînement pour les robots.
Mais les créatifs ont des sentiments mitigés sur la technologie. UN récent Wired Investigation a révélé que des studios de jeu comme Activision Blizzard, qui a licencié des dizaines de travailleurs, utilisent l’IA pour couper les cash et le fight. Et un 2024 étude Commandée par la Guilde Animation, un syndicat représentant des animateurs et des caricaturistes hollywoodiens, a estimé que plus de 100 000 emplois de cinéma, de télévision et d’animation basés aux États-Unis seront perturbés par l’IA dans les prochains mois.
Pour sa half, Odyssey s’interact à collaborer avec des professionnels créatifs – pas les remplacer.
«La vidéo interactive (…) ouvre la porte à des formes de divertissement entièrement nouvelles, où des histoires peuvent être générées et explorées à la demande, exemptes des contraintes et des coûts de la manufacturing traditionnelle», écrit l’entreprise dans son article de weblog. « Au fil du temps, nous pensons que tout ce qui est vidéo aujourd’hui – divertissement, publicités, éducation, formation, voyage et plus – évoluera en vidéo interactive, toutes alimentées par Odyssey. »
La démo d’Odyssey est un peu difficile sur les bords, ce que la société reconnaît dans son poste. Les environnements génèrent le modèle sont flous et déformés et instables dans le sens où leurs tendencies ne restent pas toujours les mêmes. Avancez dans une course pendant un sure temps ou retournez-vous, et l’environnement pourrait soudainement être différent.
Mais la société promet d’améliorer rapidement le modèle, qui peut actuellement diffuser des vidéos jusqu’à 30 photographs par seconde de grappes de GPU NVIDIA H100 au coût de 1 à 2 $ par «heure de l’utilisateur».
«Pour l’avenir, nous recherchons des représentations mondiales plus riches qui capturent la dynamique beaucoup plus fidèlement, tout en augmentant la stabilité temporelle et l’état persistant», écrit Odyssey dans son article. «En parallèle, nous élargissons l’espace d’motion de l’interplay de mouvement vers le monde, apprenant des actions ouvertes à partir de vidéos à grande échelle.»
Odyssey adopte une approche différente de celle de nombreux laboratoires d’IA dans l’espace de modélisation du monde. Il a conçu un Système de caméra monté sur sac à dos à 360 degrés Pour capturer des paysages du monde réel, qui, selon Odyssey, peut servir de base à des modèles de meilleure qualité que les modèles formés uniquement sur les données accessibles au public.
À ce jour, Odyssey a levé 27 tens of millions de {dollars} auprès d’investisseurs, dont EQT Ventures, GV et Air Road Capital. Ed Catmull, l’un des co-fondateurs de Pixar et ancien président de Walt Disney Animation Studios, est au conseil d’administration de la startup.
En décembre dernier, Odyssey dit Il travaillait sur un logiciel qui permet aux créateurs de charger des scènes générées par ses modèles en outils tels que Unreal Engine, Blender et Adobe After Results afin qu’ils puissent être édités à la predominant.