Madrid, 8 de junio de 2026. «Mamá, por favor, ayúdame, tuve un accidente y me tienen retenido». Esa fue la desgarradora frase que escuchó María del Carmen López a través de su teléfono móvil. La voz, el tono, la respiración agitada y el llanto eran, sin lugar a dudas, los de su hijo de 24 años. Desesperada, la mujer estuvo a punto de transferir 5.000 euros para un supuesto rescate express, hasta que un mensaje de texto fortuito de su verdadero hijo reveló la escalofriante verdad: todo era una simulación hiperrealista generada por Inteligencia Artificial (IA).

Este caso, que ya investigan las autoridades de ciberdelincuencia, enciende las alarmas globales sobre la evolución de las estafas telefónicas con clonación de voz, una modalidad delictiva que utiliza la tecnología para manipular los sentimientos más profundos de las víctimas.


¿Cómo funciona la estafa de la clonación de voz con IA?

A diferencia de los antiguos timos del «pariente en apuros», donde los delincuentes fingían la voz o se hacían pasar por policías, los cibercriminales de hoy utilizan software de conversión de texto a voz (TTS) de última generación y redes neuronales avanzadas.

El modus operandi se divide en tres fases altamente calculadas:

1. La captura del audio (Cosecha de datos)

Para clonar una voz de forma idéntica, los estafadores ya no necesitan grabaciones de horas. Con los algoritmos actuales de 2026, bastan menos de 3 segundos de audio nítido. Los delincuentes extraen estos fragmentos de:

  • Videos públicos en redes sociales (Instagram, TikTok, YouTube).
  • Notas de voz enviadas en grupos abiertos de mensajería.
  • Llamadas previas de «spam» o falsas encuestas donde la víctima responde y habla brevemente.

2. El entrenamiento de la IA en tiempo real

Una vez obtenido el archivo de audio, se introduce en plataformas de IA comerciales (muchas de ellas diseñadas originalmente para doblaje de películas o accesibilidad). El software analiza el timbre, la entonación, los patrones de respiración y el acento de la persona, creando un avatar de voz digital idéntico al original.

3. La llamada y la ingeniería social

Los atacantes escriben un texto en la plataforma (por ejemplo, peticiones de dinero por secuestros falsos, accidentes o detenciones policiales) y el programa lo reproduce en tiempo real con la voz clonada. Para darle mayor credibilidad, añaden efectos de sonido ambientales como sirenas, llanto o interferencia estática.


¿Cómo protegerse de este tipo de ciberestafas?

La sofisticación de la Inteligencia Artificial hace que sea casi imposible distinguir un audio real de uno sintético a simple vista. Por ello, la Policía Nacional y los expertos en ciberseguridad recomiendan adoptar las siguientes medidas de prevención:

  • Establecer una «palabra clave» familiar: Acuerda con tus hijos, padres o pareja una palabra o frase secreta e inusual que solo ustedes conozcan. Si recibes una llamada de emergencia, pídeles esa palabra.
  • Desconfiar del sentido de urgencia: Los estafadores exigen transferencias inmediatas mediante métodos difíciles de rastrear (criptomonedas, plataformas de pago rápido o tarjetas de regalo) para no dar tiempo a la reflexión.
  • Colgar y verificar por otra vía: Ante una llamada de este tipo, cuelga inmediatamente y comunícate directamente con el familiar en apuros a través de su número habitual, o llama a un amigo o compañero que esté con él.
  • Privacidad en redes sociales: Evita mantener perfiles públicos donde tú o tus hijos suban videos hablando frecuentemente, ya que es el principal banco de datos para los delincuentes.

El vacío legal de la IA y la voz

El auge de los deepfakes de audio ha puesto en jaque a las legislaciones internacionales. Aunque la Ley de Inteligencia Artificial de la Unión Europea ya exige el etiquetado de contenidos generados por IA, los ciberdelincuentes operan en la clandestinidad y fuera de las fronteras tecnológicas convencionales.

Consejo de seguridad: Si eres víctima de una llamada sospechosa donde reconozcas la voz de un familiar exigiendo dinero, mantén la calma, no reveles datos personales adicionales («¿Eres tú, Juan?») y denuncia el número de inmediato a las autoridades locales.