Este robot imita voces de famosos como Elon Musk y Bob Esponja, su nombre es Ameca

Este dispositivo usa GPT-4 para procesar voces humanas y transmitir emociones

Compartir
Compartir articulo
En la demostración habla como Elon Musk y Bob Esponja

Las imitaciones de voces son uno de los riesgos detrás del desarrollo de la inteligencia artificial, por los peligros que representan en seguridad y derechos de autor. Un temor que puede verse aumentado si tenemos un robot de por medio.

Este es el caso de Ameca, un desarrollo de Engineering Arts, que es capaz de replicar las voces de personajes y personalidades famosas gracias a toda la información con la que está entrenado.

La demostración de su talento la hizo la empresa en una interacción con uno de sus ingenieros, quien le pidió al robot que hablara como Elon Musk y Bob Esponja, y el resultado fue una imitación casi perfecta.

Así es como Ameca replica voces

El secreto detrás de la capacidad de este desarrollo para imitar las voces de famosos radica en su tecnología de síntesis de voz. El robot Ameca emplea el modelo de lenguaje largo (LLM) GPT-4, desarrollado por OpenAI, para procesar y comprender el lenguaje humano de manera profunda y coherente.

Ameca es un robot que usa IA para reconocer y procesar voz humana. (Engineered Arts)
Ameca es un robot que usa IA para reconocer y procesar voz humana. (Engineered Arts)

Este modelo de inteligencia artificial permite que el robot no solo entienda lo que se le dice, sino que también sea capaz de generar respuestas y conversaciones de manera natural.

Además del modelo de inteligencia artificial, el dispositivo utiliza un sofisticado sistema de síntesis de voz que recrea con precisión las características vocales de famosos. Este sistema se basa en una extensa base de datos de grabaciones de voz de celebridades, que se utilizan para entrenar al robot y afinar su capacidad para imitar diferentes voces con fidelidad asombrosa.

Para demostrar su capacidad, la empresa grabó un video en el que muestra a Ameca imitando las voces de Elon Musk, Morgan Freeman y de Bob Esponja dando un discurso como si fuera Donald Trump.

(Captura de video)
(Captura de video)

Aunque en la demostración solo se habla en inglés, la compañía ha desarrollado demos capaces de comunicarse en otros idiomas gracias a la integración con la plataforma Deepl, pero todavía no hemos visto contenido sobre si puede imitar voces de personalidades que hablen francés o español, por ejemplo.

Además, gracias a sus sistemas, el robot tiene la capacidad de reconocer la voz humana y entender qué le están diciendo, para transmitir de forma clara y con buena coherencia lo que le piden.

Otras funciones más allá de la imitación de voz

Este robot está diseñado para ser un compañero interactivo y versátil en una variedad de situaciones y entornos. Ameca cuenta con cámaras incrustadas que simulan los ojos humanos, lo que le permite observar y reconocer su entorno.

Gracias a estas cámaras y a un avanzado software de reconocimiento facial, el robot puede identificar a las personas que lo rodean y adaptar su comportamiento en consecuencia.

Ameca puede iniciar conversaciones de manera independiente, sin la necesidad de preguntas. (YouTube: Engineered Arts)
Ameca puede iniciar conversaciones de manera independiente, sin la necesidad de preguntas. (YouTube: Engineered Arts)

Por ejemplo, Ameca puede actuar como un asistente personal, ayudando a los usuarios con la planificación de tareas, la gestión de calendarios y la búsqueda de información en línea. También puede servir como un compañero de entretenimiento, reproduciendo música, películas y programas de televisión según las preferencias del usuario.

Pero quizás una de las funciones más sorprendentes es su capacidad para interactuar de manera emocionalmente inteligente con los humanos. Este robot cuenta con un rostro “humano” que puede mostrar una amplia gama de expresiones faciales y gestos, lo que le permite comunicar emociones y establecer una conexión más profunda con las personas que lo rodean.

La idea de la integración de estas opciones, es permitir que el dispositivo sea apto para realizar tareas que requieran interacciones sociales complejas, como el cuidado de personas mayores o la asistencia en terapias de rehabilitación, donde es necesaria la expresión de emociones para mostrar empatía.