Aquesta setmana, OpenAI ha llançat Sora 2, el model d’IA generativa de vídeos de nova generació molt esperat, disponible com a aplicació independent per a iOS en mode convidat i de manera gratuïta—lamentablement, encara no hi ha suport per a Android. Després d’obtenir una invitació, he estat explorant l’aplicació i creant vídeos (fins i tot aconseguint diners fent-ho). Les meves impressions són diverses: la tecnologia és indubtablement impressionant, i l’aplicació és divertida de navegar, tot i que algun contingut va despertar certa inquietud. Sora 2, desenvolupat per OpenAI (els creadors de ChatGPT), crea vídeos amb diàleg i àudio sincronitzats a partir de frases en llenguatge natural. És un veritable competidor de Veo 3 de Google, que ha dominat la generació de vídeos amb IA des de la seva arribada a principis d’aquest any. En canvi, les eines Llama o Grok Imagine de Meta quedem endarrera, tot i que Meta podria guanyar avantatge utilitzant tecnologia de Midjourney. Com Veo 3, Sora 2 principalment produeix memes virals i vídeos curts semblants a TikTok—amb escenaris humorístics com un Golden Retriever detingut per robar costelles o un cangur aturat a la seguretat de l’aeroport. Aquests són divertits, però posen de manifest la fina línia entre l’entreteniment i l’ús indegut de l’aplicació. Com més realistes són els vídeos de Sora 2, més grans són els riscos de deepfakes i de desinformació, una preocupació que augmenta per la qualitat de l’aplicació. Tot i això, les mesures de seguretat de continguts d’OpenAI superen les de Grok Imagine d’Elon Musk, que ha estat criticada per una moderació lax i per deepfakes sexuals ofensius. Sora 2 bloqueja vídeos amb cares detectades, tret que es facin a través de la funció Cameos—que permet usar la semblança només amb el consentiment de la persona objecte. Els intents de crear vídeos de personatges públics com Taylor Swift es van negar, subratllant les seves proteccions més estrictes. Cameos, una característica estrella de Sora 2, permet als usuaris acceptar o rebutjar que s’utilitzi la seva semblança i pot donar accés a contactes, usuaris específics o al públic. Aquesta funció ha generat una allau de vídeos amb la semblança del CEO d’OpenAI, Sam Altman.
Jo mateix vaig provar de fer-me un vídeo, que curiosament va capturar bé la meva aparença, però no la veu—això de veure com tu mateix dius o fas coses fabricades és inquietant, però cada cop més normal en aquesta era d’IA. Sora 2 i Veo 3 continuen sent en una categoria pròpia, capaços de produir vídeos realistes amb diàleg i àudio acoblats. Sora pot generar contingut en diversos estils—des de enregistraments falsos de càmeres de policia fins a anuncis dels anys 90 i retransmissions esportives—that no semblen immediatament generats per IA. Es prepararà una comparació detallada entre Sora 2 i Veo 3, però Sora 2 compleix millor les expectatives que GPT-5. Pel que fa a la propietat intel·lectual, Sora 2 sembla jugar amb les normes, o més aviat sense gaire restriccions. Tot i les batalles legals en curs sobre l’ús d’artistes i materials amb drets d’autor en l’IA (com la demanda de Disney contra Midjourney per “plagi sense límit”), actualment el govern dels EUA aposta per permetre l’ús d’IP per part de la indústria de la IA, considerant que les restriccions serien poc pràctiques en aquesta cursa tecnològica. Així, els personatges amb drets d’autor com SpongeBob, Star Wars i Rick & Morty apareixen lliurement en vídeos virals d’IA. Quan se li preguntà, OpenAI va evitar confirmar si té acords de llicència amb titulars de drets com Warner Bros. El contingut de l’app sovint recicla discursos públics o referències culturals estimades en memes virals—com el discurs "I have a dream" de Martin Luther King Jr. , humorísticament modificat per parlar del preu de Xbox Game Pass. Els memes de SpongeBob dominen, probablement per la nostàlgia que els usuaris mil·lennials senten cap a aquest personatge. Mentre que figures públiques i personatges fa temps que són objecte de memes, la facilitat de crear vídeos d’IA realistes augmenta molt les possibilitats de fer desinformació o provocar indignació, especialment en un context de guerres culturals constants. OpenAI manté que els usuaris gaudeixen de llibertat creativa, però permet a les empreses de drets d’autor presentar demandes de retirada; no hi ha una opció generalitzada de no participar en l’ús d’IP. Els primers usuaris han d’esperar errors freqüents amb el missatge “Estem sota càrrega pesada, torna-ho a provar més tard” a causa de la gran demanda, com passa amb els inicis del desplegament de generació d’imatges amb ChatGPT, que fa difícil gastar els crèdits de creació de vídeos. Una de les funcions que més m’ha agradat de Sora 2 és l’àlbum de vídeos, que permet als usuaris veure versions alternatives d’un mateix vídeo desplazant-se de lateral a lateral, descobrint petits ajustaments en el prompt. És una manera divertida i engrescadora d’explorar possibilitats creatives. En definitiva, Sora 2 és tan addictiu com altres apps de vídeos curts—fa fàcil perdre’s en un cercle interminable de navegar i veure contingut. Tot i que la tecnologia és impressionant, els “bocins” generats per IA encara són “bocins”, independentment dels comptes de likes. Revelació: La companyia matriu de Mashable, Ziff Davis, va presentar una demanda contra OpenAI l’abril passat, acusant-la d’ús no autoritzat de materials amb drets d’autor en l’entrenament de les seves IA.
OpenAI llança Sora 2: models de vídeo AI de nova generació amb característiques avançades i reaccions mixtes
La intel·ligència artificial (IA) està jugant un paper cada vegada més important en la revolució de l'optimització per a motors de cerca locals (SEO), oferint als negocis maneres innovadores de millorar la seva presència en línia dins de zones geogràfiques específiques.
Aquest assaig narrat en primera persona es basa en una conversa amb l'Aurora Bryant, de 40 anys, cap de l’equip d’intel·ligència de dades jurídiques a Relativity a Nova York.
Les ciutats de tot el món adopten cada vegada més sistemes de vigilància per vídeo impulsats per IA per millorar la seguretat pública i monitoritzar millor els entorns urbans.
A l'SMM 2024, la fira internacional líder del comerç marítim que es celebra a Hamburg, es va destacar de manera prominent el paper crucial de la Intel·ligència Artificial (IA) en accelerar la transformació digital de la indústria marítima.
Els democrates al Congrés expressen una preocupaçó seriosa davant la possibilitat que els Estats Units puguin aviat començar a vendre xips avançats a una de les seves rivals geopolítiques més importants.
Google DeepMind ha introduït recentment un sistema d’intel·ligència artificial innovador anomenat AlphaCode, que suposa un avançament significatiu en el desenvolupament de programari assistit per IA.
OpenAI s’està preparant, segons sembla, per rebre fins a 100 mil milions de dòlars en nova inversió, cosa que podria impulsar la seva valoració fins a uns sorprenents 830 mil milions de dòlars.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today