Bytedance, morselskapet til Tiktok, har avduket OmniHuman-prosjektet. Det er en video-KI som kan lage videoer med realistisk tale, sang og bevegelser ved hjelp av bare et stillbilde.
Prosjektsiden viser en rekke eksempler, alt fra mennesker som synger og spiller instrumenter eller holder taler, til tegneserier. KI-verktøyet ser ut til å kunne bruke bilder i alle slags størrelsesforhold, og hvis lyd brukes som kilde, kan den være av lav kvalitet.
Bytedance er langt fra alene om video-KI. Sora fra OpenAI har fått mye skryt, men det finnes også Pika, Runway, Pollo og Dream Machine. Det som ser ut til å skille dem fra de andre, er den enorme mengden videoer den har blitt trent på. Ifølge Bytedance er modellen trent på mer enn 18 700 timer med video.
Man skulle kanskje tro at selskapet rett og slett brukte alle de millioner av videoene som brukerne har lagt ut på Tiktok. Men selskapet sier at dette ikke er tilfelle. Uansett er det høyst sannsynlig at Omnihuman snart vil være tilgjengelig som et verktøy på Tiktok for å lage dine egne videoer. Hvem har energi til å filme seg selv?
Risikoen er selvfølgelig at vi vil bli oversvømt av enda flere falske videoer som det er ekstremt vanskelig å skille fra ekte video. Bytedance sier imidlertid at de vil være transparente og tydelig merke KI-skapte videoer.