Crimen por una IA

eXtreM3

Bueno, era de esperar que sucediese algo así con las voces.

La Inteligencia Artificial permite que las máquinas hagan verdaderas maravillas si tienen el entrenamiento adecuado. Hemos visto como podemos diagnosticar enfermedades, reconocer rostros o incluso generar voz humana, y estas habilidades pueden usarse tanto para el bien como para el mal.

Según un informe de The Wall Street Journal, el último gran crimen cometido usando la Inteligencia Artificial tiene precisamente como protagonista la generación de voz. Los criminales consiguieron imitar la voz del director ejecutivo de una compañía de energía para pedir una transferencia de 243.000 euros, y todo fue exactamente como lo planearon.

En la conversación telefónica la máquina consiguió convencer a la víctima de que la transferencia tenía que ser realizada con urgencia, y como la voz, generada con IA, era igual a la del director ejecutivo, no se dudó y se hizo la operación. La víctima en cuestión no sospechó porque la voz tenía incluso el ligero acento alemán de su jefe, todos los rasgos característicos de tono, velocidad y naturalidad, por lo que nunca podría imaginar que al otro lado había un ordenador entrenado.


Aunque no se han informado los nombres de los afectados, o de las empresas timadas, sí se sabe que es el primer caso conocido de timo usando este sistema, y se cree que podrían aumentar, ya que no hay ningún sistema de seguridad de ninguna empresa que sea capaz de bloquear una llamada así.

De momento no se ha recuperado el dinero ni se sabe quiénes han sido los criminales.

Moraleja: si recibimos una llamada de este tipo, es mejor comenzar a crear sistemas de contraseñas habladas para verificar que la otra persona es quien dice ser.


Sauce: https://wwwhatsnew.com/2019/09/02/crimen-simulando-la-voz-de-un-ceo-con-inteligencia-artificial/

Dentro de nada (2-5 años) no nos vamos a poder creer absolutamente nada de lo que veamos ni escuchemos sin que haya alguna forma de demostrar o probar que estés comunicándote con el interlocutor correcto.

¿Qué opina MV de tanto avance? Las IA están cojonudas, pero las IAs del mal nos pueden llevar al desastre en cuestión de años.

BadHistorian

Habrá que acabar en el pueblo plantando lechugas y criando cerdos. Ni tan mal.

Kb

Pero a ver, es facil de solucionar, mandando email encriptados con firmas digitales por ejemplo

1 1 respuesta
B

La vindicación de Ted Kaczynski.

Kenderr

No veo que ninguna ia hay cometido crimen alguno en la notícia.

34
B

.

Kimura

Habría que ver el resultado real y actual de la voz eh? Y cuanto de la noticia es real tal cual, por mucho WSJ.

Por que cuando leías noticias del deepfakes, aquello era el fin del mundo, por que era perfecto y el porno con caras de famosos era una realidad imparable y tal y cual... Y luego veías los vídeos y en fin... La hipérbole periodística y eso.

1 3 respuestas
B

Pues tampoco hace falta mucha IA para engañar a alguien por teléfono, le dices soy fulanito COF COF, perdón, pero estoy con un resfriado tremendo ...

E

El avance tecnologico, si no va acompañado de evolucion como humanos, va a ser 100% detrimental para la vida.

Nucklear

#7 Los resultados actuales son bastante buenos, pero no existen modelos públicos ni implementaciones fuera de Facebook, OpenAi, etc que lleguen a resultados como estos:

https://medium.com/dessa-news/realtalk-how-it-works-94c1afda62f0

Así que yo en la noticia me quedo con puro sensacionalismo, pero que veremos algo así pronto no me cabe duda.

1 respuesta
Kimura

#10 la verdad que me ha impresionado medianamente lo conseguido que está, ya que conozco muy bien la voz de JR, oýendole de manera asidua por +20 años.

Pero claro, con JR tienes literalmente INFINITOS samples de su voz. Cada semana, entre podcast, UFC, shows cómicos, etc... tienes literalmente decenas de horas disponibles semanales. Literalmente, cada palabra del diccionario repetida por lo menos 1000 veces, de 1000 maneras distintas con mil tonos.

Pero con este CEO semi-anónimo? Suerte si tienen un par de horas de speeches? No se.

1 respuesta
eXtreM3
#7Kimura:

Y luego veías los vídeos y en fin... La hipérbole periodística y eso.

Esto está naciendo. Dale unos años y me cuentas. Hipérbole dice xD

Ninja-Killer

Vivíh en Matrih

5
TripyLSD

#7 spoiler: Era la voz standard de loquendo.

2
Nucklear

#11 MelNet de facebook puede replicar voces con samples de 5 segundos haciendo transferencia de estilo. No llega al nivel de este de JR pero puedes ver los ejemplo aqui.

https://audio-samples.github.io/

No obstante, una campaña de vishing dirigido a la compañía es mas efectivo que delegar la operación a un par de clips generados con la IA. Por eso me parece que es mas sensacionalismo que otra cosa y añadir "buzzwords" a una noticia irrelevante de otro modo.

1 1 respuesta
TripyLSD

#14 Por cierto, cambiando de tema, os dejo un mensaje de voz autentiquísimo que he recibido

https://www.soundcloud.com/tripylsd/mensaje-del-admin-jefe-de-media-vida/s-z3AQf

2
Kimura

#15 tienes fuente de lo de los samples de 5 segundos como training? Por que un vistazo por encima al paper original, expone que usan cientos de horas de audiolibros y charlas TED para el training.

De todas maneras es alucinante y estoy flipando con lo que hacen con transformadas de Fourier y aplicando Gaussiano y modelos probabilisticos como si no costase. He visto papers de física avanzada menos espesos y complejos.

2 respuestas
TripyLSD

A mi los modelos de desarrollo de IA y machine learning me parecen magia

Eustakiooo

Por mucho que tenga la misma voz, forma de hablar y acento a saber, hay que ser retard para ingresar tal cantidad a bocajarro, con carácter de urgencia, sin motivo y desde un número desconocido supongo

Nucklear

#17 Si claro, el modelo se entrena sobre cientas de horas de audio, luego utilizan un sample corto para hacer transferencia de estilo.

De todas formas creo que mezclé dos, Melnet es ese que te pasé y lo de los 5 segundos de audio de muestra es este:

Que no consigue tanta fidelidad pero llegará a ese punto facilmente mejorando el dataset y los algoritmos que usan. Uno es de facebook y otro es de una tesis de una persona.

1 1 respuesta
Kimura

#20 muy interesante. Se me hace la boca agua de pensar lo que podrían conseguir artistas como Young Scrolls con esta tecnología.

1 respuesta
Nucklear

#21 Yo estoy esperando a que publiquen una primera implenetacion de MelNet ( https://github.com/Joovvhan/MelNet ) para darle caña al asunto porque me interesa para un proyecto que tengo en mente y actualmente las IAs que generan voces usando TTS son bastante pobres.

n3krO

#17 En los entrenamientos de estilo usas un dataset grande para entrenar la IA a reconocer estilos partiendo de pocos segundos, despues solo tienes que pasarle un sample con el estilo que quieras y la IA transforma lo que quieras a ese estilo.

1
MoonKai

Es una buena noticia, van a poder seguir sacando canciones con la voz de Freddie Mercury

2
n40k1

#3 Cada vez que alguien dice encriptado Dios mata un gatito.

3 respuestas
AS7UR

Me esperaba leer una noticia de una robot con el aspecto de Scarlett Johansson matando a cuchilladas a un millonario mientras se lo follaba, y leo esta mierda.

NO DAS LO QUE PRO-ME-TES

cruten

Skynet al poder xD

Fyn4r

Pero si esto ya se hacía sin imitar la voz del jefe wtf xD

HeXaN

#25 "Cifrado" es demasiado español.

NigthWolf

Al leer "crimen" habia pensado automaticamente en un asesinato, lo que me llevo al siguiente pensamiento, Terminator y La tostadora valiente. Me ha faltado nada para correr por la casa desenchufando la nevera, la lavadora y el microondas.

Usuarios habituales

  • StkR
  • eXtreM3
  • n40k1
  • Kb
  • Nucklear
  • Kimura
  • TripyLSD