Privacy Policy Banner

We use cookies to improve your experience. By continuing, you agree to our Privacy Policy.

Cómo la melodía en el discurso puede enseñar emociones a la IA -.

-
Los investigadores han identificado entre 200 y 350 patrones prosódicos básicos que son esenciales para comprender la estructura y el significado en el lenguaje hablado. (Imagen ilustrativa de Infobae)

*Este contenido fue producido por expertos del Instituto de Ciencias de Weizmann, uno de los centros más importantes del mundo de la investigación básica multidisciplinaria en el campo de las ciencias naturales y exactas, ubicada en la ciudad de Rejovot, Israel.

La revolución del inteligencia artificialque ha comenzado a transformar nuestras vidas en los últimos tres años, se basa en un principio lingüístico fundamental que está en la base de modelos de lenguaje a gran escala como ChatGPT. Las palabras en un lenguaje natural no se combinan al azar; Más bien, hay un estructura estadística que permite que el modelo adivine la siguiente palabra basada en lo que vino antes.

Sin embargo, estos modelos pasan por alto una dimensión crucial del comunicación humana: El contenido que no se transmite a través de las palabras. En un nuevo estudio que se publica hoy en Actas de la Academia Nacional de Ciencias, EE. UU. (PNAS), Investigadores del laboratorio del Prof. Elisha Moisés en el Instituto de Ciencias Weizmann Revelan que el melodía del habla En conversaciones espontáneas en inglés, funciona como un lenguaje diferentecon un “vocabulario” de cientos de melodías básicas e incluso Reglas de sintaxis Eso puede predecir la siguiente melodía en la secuencia. El estudio siente la base de la inteligencia artificial que comprenderá el lenguaje más allá de las palabras.

El melodía El habla, conocida en la lingüística como “prosodia”, cubre las variaciones en el tono (entonación), el volumen (por ejemplo, para enfatizar), ritmo y calidad de sonido (como un susurro o una voz agrietada). Esta forma de expresión precede a las palabras en la evolución: los estudios recientes revelan que ambos Chimpancés A medida que las ballenas incorporan estructuras prosódicas complejas en su comunicación.

La prosodia del habla, que
La prosodia del habla, que incluye ritmo, tono e intensidad, juega un papel crucial en la comunicación humana, que funciona como un lenguaje diferente y esencial en las conversaciones cotidianas. (Imagen ilustrativa de Infobae)

En comunicación humana, Prosody agrega una capa matizada de significado más allá de las palabras. Una breve pausa, como una coma, puede el significado de una oración (“Comer, abuela”) y el ritmo del texto hablado puede generar suspenso. Los lingüistas especializados en prosodia han estudiado tradicionalmente textos literarios y las formas en que la prosodia refleja Cambios históricos.

Esto significaba que, a pesar de la importancia crítica de la prosodia para la comprensión del lenguaje humano, su estudio permaneció en un campo marginal, sin aplicaciones y llena de ideas contradictorias sobre la estructura y el significado de la prosodia.

Sin embargo, la prosodia es una parte inherente de cada conversación. Asignar uno Función lingüística A las palabras, por ejemplo, si están formulando una pregunta o afirmando un hecho, y revela la actitud del hablante hacia lo que está diciendo.

En el nuevo estudio, dirigido por el lingüista Dr. Nadav Matalon y el neurocientífico Dr. Eyal Weinreb, ambos del Laboratorio de Moses en el Departamento de Física de los Sistemas Complejos de Weizmann, los investigadores analizaron la prosodia como un lenguaje desconocido, con el de ofrecer una explicación basada en datos del misterio lingüístico del del estructura y significado de la prosodia.

Un equipo de científicos de
Un equipo de científicos del Instituto Weizmann utiliza inteligencia artificial para analizar conversaciones y descubrir patrones melódicos que podrían revolucionar la comunicación humana. (Imagen ilustrativa de Infobae)

En lugar de basarse en la literatura, utilizaron dos grandes colecciones de grabaciones de conversaciones espontáneas: una de las conversaciones telefónicas entre dos participantes y otra de cara a cara en varios lugares, como una cocina o un aula.

La primera tarea para el equipo de investigación fue compilar un Diccionario de melodías Esa función de “palabras” en la prosodia del inglés y les asigna una función y significado. “Para entender por qué todavía no hay un diccionario prosódico, la pena recordar que ni siquiera había un diccionario completo de inglés hasta el siglo XIX”, dice Moisés.

“Cuando la Universidad de Oxford estaba a cargo de compilar uno, le pidió a las personas que ayudaran con la carga de trabajo enviando citas que mostraron los cambios históricos en el significado de las palabras. Uno de los principales colaboradores era un prisionero Eso pasó más de 20 años leyendo libros y enviando citas. En nuestro estudio, en lugar de recopilar información para nosotros durante décadas, analizamos grandes colecciones de grabaciones de audio, utilizando Iowa“.

-

La melodía del discurso de cada persona es únicoPero el modelo AI encontró varios cientos de patrones básicos que se repiten, con ligeras variaciones, en todas las conversaciones espontáneas en inglés. Si bien las palabras escritas son letras de letras, una “palabra” prosódica es una Melodía cortaEs decir, una breve secuencia de sonidos con variación en el tono, que dura aproximadamente un promedio.

(Izq.) Dr. Dominik Freche, Prof.
(Izq.) Dr. Dominic Freck, Prof. Moses Eliseo, Dr. Nav Pharmacy, Dr. Blumner Blue y Ophira CreditO

Para descubrir el significado de estas “palabras”, Matalon tomó una muestra de 20 patrones melódicos básicos y luego volvió a escuchar las grabaciones. “Descubrimos que cada patrón tiene varios funciones lingüísticas“, Explica.” Por ejemplo, dependiendo del contexto, un patrón puede definir si alguien está haciendo una pregunta o haciendo una declaración.

Sin embargo, cada patrón generalmente transmite una actitud específica del hablante, como curiosidad, sorpresa o confusión, hacia lo que se dice. Una palabra prosódica común es una Aumento pronunciado del tono seguido de una caída rápida. Este patrón indica entusiasmo y, dependiendo del contexto, puede expresar un fuerte acuerdo o el reconocimiento de recibir información nueva importante. “

“El primer diccionario completo del inglés de Oxford apareció en el siglo XIX, con la ayuda del público para administrar la carga de trabajo, incluido un prisionero que contribuyó durante 20 años”. A continuación, los investigadores intentaron identificar el Reglas sintácticas que rige el orden de estos patrones prosódicos, que podrían permitir que los modelos de aprendizaje de idiomas futuros comprendan y usen la prosodia. “Notamos que hay patrones que tienden a aparecer juntos, en paresen discurso espontáneo ”, explica Weinreb.

El estudio también encontró que
El estudio también encontró que la prosodia varía según el estado social y la edad, que muestra cómo las diferentes poblaciones tienen sus propios patrones melódicos. (Imagen ilustrativa de Infobae)

“Es un sistema estadístico simple, en el que la elección correcta de la siguiente unidad en una secuencia depende únicamente del anterior. Este sistema funciona bien para una conversación espontánea porque solo requiere planificar unos pocos segundos de anticipación, que es el momento en que dura la memoria a corto plazo”. Estos pares de patrones, descubrieron los investigadores, funcionan como Oraciones simplesExpresando “una nueva idea”, de modo que cada par esté relacionado con un tema específico, agregando una sola información al respecto, por ejemplo, refiriéndose a un hecho mencionado en la conversación y proporcionando comentarios positivos.

“Este estudio siente los cimientos para el desarrollo de un sistema automatizado que compila un ‘diccionario’ de prosodia e identifica su Reglas sintácticas Para cada idioma humano y para diferentes poblaciones de hablantes “, dice Moisés.

“La prosodia puede variar según patrimonio socialEventos históricos y la edad de los oradores, y estas variaciones pueden incluso manifestarse en obras literarias que reflejan cuidadosamente el habla espontánea “, agrega Matalon.” Analizamos audiolibros como parte del estudio y descubrimos que los patrones prosódicos son más largos en el discurso escrito y que la simple sintaxis coincidente de la conversación espontánea ha desaparecido.

Inteligencia artificial, como
La inteligencia artificial, como los asistentes virtuales, podría mejorar su interacción emocional y empática si incorpora la comprensión de la prosodia, según el estudio. (Imagen ilustrativa de Infobae)

También hay otras diferencias. Es asumir que el proceso de envejecimiento y la adquisición del lenguaje en la infancia también se acompaña de cambios prosódicos cuantificables. Además, hay evidencia de que la prosodia es importante en el Discurso internoEl lenguaje del pensamiento, y que podemos profundizar nuestra comprensión de la prosodia existente en las voces robóticas producidas por los dispositivos generadores del habla. El modelo que creamos promete cerrar las brechas que han surgido a lo de los siglos en la investigación de la expresión más allá de las palabras. “

Una aplicación futura importante de un Diccionario de prosodia automatizado Podría ser el desarrollo de una IA capaz de comprender y transmitir mensajes a través de la melodía del habla en lugar de solo con palabras. “Imagínese si Siri pudiera entender por la melodía de su voz cómo se siente acerca de un tema determinado, lo que es importante para usted o si cree que sabe más que ella”, agrega Weinreb, “y que podría adaptar su respuesta para que suene entusiasta o triste. expresión humana que los sistemas robóticos actualmente carecen. “

El Dr. Dominik Freche, del Departamento de Sistemas Complejos de Weizmann, también participó en el estudio; Dr. Erez Volk de Neuralight Inc., Tel Aviv; Dra. Tirza Biron del Departamento de Ciencias de la Computación y Matemáticas solicitó a Weizmann; y el profesor David Biron de la Universidad de Chicago. *Profe. Elisha Moisés ocupa la silla Maurice e Ilse Katz.

-

-

-
PREV Esta es la mayor amenaza para su PC, según un desarrollador de Windows, Fayerwayer,.
NEXT Nintendo Switch continúa confirmando más juegos para 2026 -.