Las nuevas tecnologías como la ya famosa Inteligencia Artificial (IA) ya comenzó a transformar el mundo de los audiolibros con la capacidad de generar locuciones fluidas sin utilizar un narrador humano, una novedad que preocupa a los profesionales de la voz.

 

Tanya Eby lleva 20 años en la narración de audiolibros. En los últimos seis meses, sus pedidos se han reducido a la mitad y la actividad de muchos de sus colegas también ha mermado.

“Parece lógico que la inteligencia artificial nos esté afectando”, dice. “Creo que es el plan para el futuro, reemplazar trabajadores y reducir costos”.

No hay un sello para identificar la IA, pero según varios profesionales del sector, ya circulan en el mercado miles de audiolibros concebidos a partir de bancos de datos vocales.

Entre los programas más avanzados, DeepZen ofrece un precio básico que puede reducir a la cuarta parte el costo de creación de un audiolibro en comparación con un proyecto clásico.

Esta pequeña empresa con sede en Londres trabaja con una base de datos que ella misma creó grabando las voces de varios actores a los que se les pidió que expresaran una variedad de emociones diferentes.

“Hemos firmado un acuerdo de licencia con todas las voces que utilizamos”, dice Kamis Taylan, gerente general de DeepZen. “Pagamos por las grabaciones y pagamos regalías cada vez que usamos la voz para un proyecto”.

“Las cosas evolucionan tan rápido que hay muchos recién llegados que no tienen la misma ética” y usan voces sin remunerar a sus dueños, advierte Tanya Eby.

“Hay una zona gris” que aprovechan muchas plataformas, explica Kamis Taylan. “Toman tu voz, la mía y cinco más, crean una nueva voz y no pagan nada, dicen que no es de nadie”.

“La narración profesional siempre ha sido esencial para escuchar en Audible y seguirá siéndolo”, dijo una portavoz del gigante estadounidense de los audiolibros, filial de Amazon.

Según varios nombres del sector editorial tradicional ya utilizan la llamada IA generativa, es decir capaz de crear, sin intervención humana, textos, imágenes, videos o voces, a partir de contenidos existentes.