MERU GOKHALE
Els audiollibres amb intel·ligència artificial no són per a tothom, però el seu impacte només creixerà.
L’octubre passat, Ray Dalio va llançar una versió d’ell mateix basada en IA. No un chatbot que vengués els seus llibres, sinó un clon conversacional entrenat en dècades dels seus escrits, discursos i filosofia d’inversió. Fes-li una pregunta sobre la gestió de la teva carrera o la comprensió dels mercats i et respondrà amb la seva veu, basant-se en els seus principis. Dalio afirma que és un 95% tan bo com parlar amb ell directament.
Estan sorgint nous formats a partir de la IA. Crec que els editors haurien de tenir en compte l’audiollibre interactiu, on els oients poden fer pauses, fer preguntes i conversar amb el contingut.
Per què? Perquè la gent se sent cada cop més atreta per parlar amb el contingut en lloc de consumir-lo passivament. NotebookLM de Google es va fer viral l’any passat amb una funció que converteix qualsevol document en una conversa d’estil podcast entre dos presentadors d’IA. Milions de persones van descobrir que preferien parlar de contingut a simplement absorbir-lo. Els presentadors d’IA bromegen entre ells i resumeixen qualsevol tema. El més important és que semblen prou humans com per oblidar que els usuaris obliden que són sintètics.
Quan les editorials parlen d’IA, solen centrar-se en les demandes per drets d’autor i la narració sintètica. Totes dues són importants. Però cap de les dues aborda una altra pregunta interessant: què passaria si els llibres deixessin de ser emissions unidireccionals?
Sahil Lavingia, fundador de Gumroad, va construir alguna cosa similar per al seu llibre The Minimalist Entrepreneur el 2022. Els lectors poden fer preguntes sobre el contingut i rebre respostes amb la seva veu. És rudimentari en comparació amb el que és possible ara, però va demostrar el concepte: alguns lectors volen respondre.
La tecnologia ha recuperat el ritme. La latència de la IA de veu ha baixat a aproximadament mig segon, no exactament els 200 mil·lisegons d’una conversa humana natural, però prou propera com per deixar de semblar parlar amb un centre d’atenció telefònica. La clonació de veu requereix 30 minuts d’àudio net per produir una rèplica de qualitat professional. Els sistemes de recuperació poden basar les respostes de la IA en contingut específic del llibre, reduint el problema d’al·lucinacions que fa que els chatbots no siguin fiables.
On deixa això les editorials?
Article publicat a The Bookseller, clica aquí per llegir l’article sencer








