Nvidias KI Fugatto skaper helt nye lyder

KI-modellen kan forestille seg hvordan abstrakte konsepter vil høres ut.

Jonas Ekelund

27.11.24 - 15:29

Nvidias KI Fugatto skaper helt nye lyder 1

Å la KI-modeller trene seg opp på eksisterende musikk og deretter skrive helt nye sanger er ikke noe nytt. Eller å kopiere og etterligne artisters musikk. Men Nvidias KI Fugatto skaper i stedet lyder som aldri har eksistert før.

Selv om den ikke er offentlig tilgjengelig ennå, har de lagt ut en nettside full av eksempler. Hva med for eksempel å høre lyden av saksofoner som bjeffer som hunder, folk som faktisk snakker under vann, eller ambulansesirener som synger i kor?

Les også Gemini-appen på norsk En mobilvennlig app gjør det enklere å få hjelp når du er på farten.

Fugatto ble skapt for å prøve å skape «et meningsfullt forhold mellom språk og lyd». Å snakke med en chatbot er én ting, men hvordan beskriver man egentlig lyder med ord?

Forskerne har latt en stor språkmodell lage Python-skript som beskriver ulike lydkilders natur, for eksempel «en ung arbeidende mann» eller «generer en glad stemme». Og så har du mulighet til å påvirke resultatet ved å «gjøre stemmen gladere».

Ved å skape en stor database med nøyaktig beskrevne lyder kan de nå la Fugatto bruke den til å finne opp helt nye, fiktive lyder. Kanskje er dette veien videre for KI til å skape noe helt nytt i stedet for å etterligne noe eksisterende.

Les mer på Nvidias blogg

Les videre ⇩