"Podslop" tar över ljudvågorna – nästan 40 procent av alla nya poddar är AI
Artificiell intelligens spottar ur sig tusentals nya podcasts varje dag. Men vad händer med kvaliteten när maskinerna tar över mikrofonen, och hur påverkar det oss som lyssnar?
"Podslop" tar över ljudvågorna – när AI blir din nya programledare
Artificiell intelligens har redan ritat om kartan för text och bild. Nu står ljudmediet på tur. Enligt nya siffror är en alarmerande stor andel av nysläppta podcasts helt och hållet genererade av AI. Fenomenet har redan fått ett öknamn i branschen: podslop.
För oss som bygger egna datorer och ständigt jagar den senaste hårdvaran på Prishunden är AI-boomen ingen nyhet. De senaste åren har vi sett hur tillverkare som Nvidia, AMD och Intel trycker in dedikerade AI-kärnor (NPU:er) i sina processorer och grafikkort för att accelerera maskininlärning lokalt. Men vad används all denna enorma datorkraft till i praktiken? Ett av svaren verkar vara massproduktion av dussinpoddar.
Enligt data från Podcast Index bedöms otroliga 39 procent av alla nya podcasts numera vara skapade med hjälp av AI. Det är en siffra som får många ljudentusiaster att sätta kaffet i vrångstrupen.
Från PDF till podcast på fem minuter
Att skapa en AI-podd kräver inte längre ett serverrum fullt av dyra RTX 4090-kort. Med molnbaserade verktyg som Googles NotebookLM kan i princip vem som helst ladda upp ett par källdokument och med ett knapptryck få ut en färdig ljudfil. Resultatet? Två syntetiska, men skrämmande mänskliga, röster som diskuterar materialet – komplett med inandningar, skratt och tveksamma "hmm"-ljud.
Vissa företag har tagit detta till en rent industriell nivå. Aktörer inom AI-genererad media hanterar idag tiotusentals unika shower och spottar ur sig hundratals nya avsnitt dagligen. Det är billigt, blixtsnabbt och extremt skalbart. Ett tydligt exempel är en nyligen släppt AI-genererad dokumentärpodd baserad på offentliga dokument som snabbt passerade två miljoner nedladdningar. Bevisligen finns det en publik, oavsett vem – eller vad – som sitter bakom mikrofonen.
Själlöst innehåll eller framtidens underhållning?
Problemet med denna lavin av syntetiskt ljud är avsaknaden av genuin mänsklighet. När AI tränas på miljontals timmar av mänskligt tal skapar den ett matematiskt genomsnitt av hur vi pratar. Resultatet blir ofta tekniskt imponerande men innehållsmässigt slätstruket. Det saknas äkta passion, spontana sidospår, personliga anekdoter och den oförutsägbarhet som gör en riktigt bra podcast värd att lyssna på.
För oss konsumenter innebär detta att vi i allt högre grad måste filtrera bort massproducerat skräp för att hitta guldkornen. Tekniken i sig är fascinerande och visar på den enorma utvecklingen inom mjukvara och processorkraft, men när det kommer till kritan föredrar nog de flesta av oss fortfarande att lyssna på riktiga människor.
Kommentarer
Laddar kommentarer…