IA en podcast: calma, no es hora de correr en círculos
No soy un crítico de la inteligencia artificial. Al contrario. Si tuviera que tomar un bando, diría que estoy a favor, pero hoy es momento de reflexionar y mirar las cosas con perspectiva.
Mientras estaba andando en bicicleta en el cerro San Cristóbal, en Santiago de Chile, me llegó un mensaje de Maru Lombardo, una podcastera que admiro un montón y que siempre hace preguntas que me hacen reflexionar. Y este post nace de esa reflexión.
Me pidió un audio con mi visión sobre la IA en el podcast. Siendo más específico, me preguntó qué pensaba sobre la generación de valor en la producción de contenidos ‘análogos’. Después de todo un día pensándolo, le envié un audio -mejor dicho un podcast- de ocho minutos. De esto trataba ese audio.
¿Creo que la inteligencia artificial va a reemplazar a alguna parte de la producción de un podcast? Hoy, no. Cuando se desarrollen las inteligencias artificiales generales (AGI), sí. Pero para eso faltan algunos años. Cinco, a lo menos si todo sigue el curso actual. En este mundo moderno y digital, cinco años pueden ser una eternidad.
Cabe mencionar que esto lo escribo siendo un productor de podcast que trabaja con muchas IA al día, que ha generado productos con ellas y que además algo he estudiado el tema. No soy un experto, pero soy más que un comentarista casual.
Ahora pensemos en el proceso de la creación de un podcast. Primero se me ocurre la idea o me presentan la necesidad. Si bien esta parte puedo ‘pimponearla’ con una IA, el que toma la decisión, soy yo, el humano. Y lo he hecho. Horas de conversación con Chat GPT para lograr llegar a algo. De cada 10 conversaciones, solo en 2 saqué algo literal de sus ideas. En las otras solo me sirvió para tener con quien conversar. Fue como jugar tenis con una muralla.
El paso 2, que bien podría ser la creación del guión, lo he vivido de esta forma. Chat GPT puede ser muy útil, porque es capas de generarlo separando personajes, estableciendo efectos de sonido y diseño de escenas. Estamos pensando en un narrativo de no ficción, por cierto. Pero siempre, en mi experiencia, los guiones son demasiado vainilla. Es decir, sin alma, sin gracia, sin vuelcos interesantes o puntos de inflexión que obliguen a mantener la atención de oyente. En otras palabras, son fomes. ¿Puedo pedirle diferentes opciones con un prompt que lo obligue a ser mejor escritor? Por supuesto, pero nunca he logrado algo que me sorprenda más allá de la capacidad misma de hacer las cosas. ¿Cuál es mi función humana, entonces? Editar ese guión y ponerle los elementos que considere que lo podrían hacer más interesante. Y para qué hablar de la verificación de hechos y datos. No olvidemos que la IA tiene fallas en su racionamiento y fue entrenada con toda la información que existe en internet, por lo tanto, si le pedimos un guión sobre la Segunda Guerra Mundial, podría cometer tremendos errores históricos. Así que ahí tenemos otra función humana: verificar los datos.
Digamos que ahora viene la parte de la narración. De grabar el guión. Hay decenas de opciones text to speech muy aceptables. Incluso en algunos casos he querido crear voces que evidentemente parezcan una IA y no lo he logrado. Son demasiado humanas. Aquí tenemos que entregarle un guión que le permita ‘leer’ cómo queremos que suene. Agregar puntos suspensivos para que haga una pausa dramática o generar una segunda línea de voz si queremos que susurre. Podríamos tener que hacer ese guión oración por oración o incluso palabra por palabra. Un trabajo tremendamente largo, agobiante y muy humano. Sería más fácil que entre una persona a una cabina de grabación y 30 minutos después salga con el guión bastante bien leído, incluso incorporando las instrucciones del director. Mucho más fácil. Aquí las ventajas del uso de la IA son evidentes. Trabajar a cualquier hora, en cualquier lugar, no necesitar a un narrador ni a un micrófono ni la cabina. Pero no es necesariamente más fácil. Tiene otras ventajas, pero no todo es miel sobre hojuelas.
¿Pasemos al diseño sonoro? Hay herramientas que crean música o text to sound effect, que funcionan muy bien. De nuevo, son sorprendentes. Pero encontrar el chirrido de puerta perfecto que estamos buscando, al crearlo con IA, puede demorar una eternidad. Mientras que si grabamos una puerta o vamos a un banco de efectos, podremos demorar mucho menos. Con la música, para qué hablar. Y de verdad que no es un tema de solo promptear mejor. Es que con algo tan subjetivo como el sonido, podemos pasar semanas intentando lograr sacar lo que tenemos en nuestra cabeza. Y mucho de esto cobra créditos por crear. Es decir, también nos podría costar una fortuna.
La post producción es totalmente humana y todo el proceso de distribución también podría ser apoyado por la IA con la creación de imágenes, definir el mejor título e incluso incorporar el SEO o definir las publicaciones en redes sociales.
Con esto no quiero decir que no haya que usar la IA o convertirme en un defensor del trabajo humano. Al contrario. Soy demasiado entusiasta con incorporar la inteligencia artificial a nuestro trabajo diario. Lo hago. Hoy mi mejor dupla es Chat GPT. Realmente me ayuda en todo, incluso más allá del trabajo.
Lo que quiero decir es que la IA, hoy, pasa a ser un apoyo a nuestro trabajo, una dupla, un compañero disponible 24/7 que nos puede ayudar a llevar a cabo una idea o un prototipo cuando estamos fuera de una cabina de grabación, sin nadie más para apoyarnos o cuando no tenemos los recursos para hacerlo o incluso cuando queremos hacer algo que de otra forma no habríamos podido hacer. Nos hace más poderosos. Nos da un activo de marketing, porque aún es cool hacer algo con IA. Nos da la posibilidad de salir de nuestras fronteras al clonar voces y llevar nuestros contenidos a otros idiomas, nos permite generar música o imágenes únicas, que no están en ningún banco público o incluso pagado.
Si no lo haz probado, hazlo. No tiene sentido negarse. Y sí, siempre existirá la artesanía, pero ese camino no es para todos.
Obviamente la portada de esta imagen fue creada con inteligencia artificial. Con lo que Dall-E ya me conoce, así me imagino escribiendo esto desde Santiago de Chile. El texto fue escrito totalmente por un humano. Pero lo siguiente es lo que opina GPT sobre mi reflexión:
“Tu reflexión sobre el uso de la inteligencia artificial en la creación de podcasts es muy completa y acertada. Abarcas distintos aspectos del proceso, desde la ideación hasta la postproducción, destacando tanto las limitaciones actuales como las ventajas prácticas. Me parece muy interesante cómo recalcas que, aunque la IA facilita muchas tareas, aún no es capaz de reemplazar el toque humano en cuanto a creatividad y autenticidad.
Destacas bien el rol de la IA como una "dupla", algo que te complementa, pero que no es infalible ni suficiente por sí sola. En cierto sentido, describes a la IA como una herramienta que aumenta nuestras capacidades, pero que requiere intervención humana en aspectos claves como la edición, la verificación de hechos y la creación de una narrativa con alma.
Creo que logras un equilibrio adecuado al no caer en el extremo de demonizar la IA ni glorificarla, y tu punto sobre el futuro (con la llegada de las AGI) invita a pensar en las posibles transformaciones de la industria en los próximos años. Es una reflexión crítica, pero también optimista, y sin duda puede ser muy útil para otros productores de contenido que, como tú, están explorando el uso de la IA”.