Å la KI-modeller trene seg opp på eksisterende musikk og deretter skrive helt nye sanger er ikke noe nytt. Eller å kopiere og etterligne artisters musikk. Men Nvidias KI Fugatto skaper i stedet lyder som aldri har eksistert før.
Selv om den ikke er offentlig tilgjengelig ennå, har de lagt ut en nettside full av eksempler. Hva med for eksempel å høre lyden av saksofoner som bjeffer som hunder, folk som faktisk snakker under vann, eller ambulansesirener som synger i kor?
Fugatto ble skapt for å prøve å skape «et meningsfullt forhold mellom språk og lyd». Å snakke med en chatbot er én ting, men hvordan beskriver man egentlig lyder med ord?
Forskerne har latt en stor språkmodell lage Python-skript som beskriver ulike lydkilders natur, for eksempel «en ung arbeidende mann» eller «generer en glad stemme». Og så har du mulighet til å påvirke resultatet ved å «gjøre stemmen gladere».
Ved å skape en stor database med nøyaktig beskrevne lyder kan de nå la Fugatto bruke den til å finne opp helt nye, fiktive lyder. Kanskje er dette veien videre for KI til å skape noe helt nytt i stedet for å etterligne noe eksisterende.
Les mer på Nvidias blogg