• Mi Re-Unir
    Búsqueda Avanzada
    JavaScript is disabled for your browser. Some features of this site may not work without it.
    Ver ítem 
    •   Inicio
    • UNIR REVISTAS
    • Revista IJIMAI
    • 2021
    • vol. 7, nº 2, december 2021
    • Ver ítem
    •   Inicio
    • UNIR REVISTAS
    • Revista IJIMAI
    • 2021
    • vol. 7, nº 2, december 2021
    • Ver ítem

    Cross-Lingual Neural Network Speech Synthesis Based on Multiple Embeddings

    Autor: 
    Nosek, Tijana V.
    ;
    Suzić, Siniša B.
    ;
    Pekar, Darko J.
    ;
    Obradović, Radovan J.
    ;
    Sečujski, Milan S.
    ;
    Delić, Vlado D.
    Fecha: 
    12/2021
    Palabra clave: 
    cross-lingual; artificial neural networks; speech synthesis; vocoder; IJIMAI
    Revista / editorial: 
    International Journal of Interactive Multimedia and Artificial Intelligence (IJIMAI)
    Tipo de Ítem: 
    article
    URI: 
    https://reunir.unir.net/handle/123456789/13070
    DOI: 
    https://doi.org/10.9781/ijimai.2021.11.005
    Dirección web: 
    https://www.ijimai.org/journal/bibcite/reference/3049
    Open Access
    Resumen:
    The paper presents a novel architecture and method for speech synthesis in multiple languages, in voices of multiple speakers and in multiple speaking styles, even in cases when speech from a particular speaker in the target language was not present in the training data. The method is based on the application of neural network embedding to combinations of speaker and style IDs, but also to phones in particular phonetic contexts, without any prior linguistic knowledge on their phonetic properties. This enables the network not only to efficiently capture similarities and differences between speakers and speaking styles, but to establish appropriate relationships between phones belonging to different languages, and ultimately to produce synthetic speech in the voice of a certain speaker in a language that he/she has never spoken. The validity of the proposed approach has been confirmed through experiments with models trained on speech corpora of American English and Mexican Spanish. It has also been shown that the proposed approach supports the use of neural vocoders, i.e. that they are able to produce synthesized speech of good quality even in languages that they were not trained on.
    Mostrar el registro completo del ítem
    Ficheros en el ítem
    icon
    Nombre: ijimai7_2_10_0.pdf
    Tamaño: 507.0Kb
    Formato: application/pdf
    Ver/Abrir
    Este ítem aparece en la(s) siguiente(s) colección(es)
    • vol. 7, nº 2, december 2021

    Estadísticas de uso

    Año
    2012
    2013
    2014
    2015
    2016
    2017
    2018
    2019
    2020
    2021
    2022
    2023
    2024
    2025
    Vistas
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    34
    64
    85
    134
    Descargas
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    18
    17
    35
    73

    Ítems relacionados

    Mostrando ítems relacionados por Título, autor o materia.

    • Estudio de la lateralidad y su relación con los procesos 

      Milanes, Ana Belén (2012)
      En este trabajo se ha aplicado un test de lateralidad a 55 niños de una escuela rural. El propósito del presente TFM es analizar la relación existente entre la lateralidad y el aprendizaje de la lectoescritura desde Infantil ...
    • Cinco cuestiones esenciales para acompañar en el sufrimiento 

      Coca Pereira, Cristina; Denizon Arranz, Sophia; Moreno Milán, Beatriz; Pérez Viejo, Jesús Manuel ; Arranz Carrillo de Albornoz, Pilar; García Llana, Helena (Psicooncologia, 2020)
      El sufrimiento aparece de manera natural y espontánea cuando no tenemos recursos para hacer frente a una situación que se convierte en una amenaza. Acompañar el sufrimiento no es tarea fácil y requiere destrezas, ...
    • Evaluating the Emotional State of a User Using a Webcam 

      Magdin, Martin; Turcani, Milan; Hudec, Lukas (International Journal of Interactive Multimedia and Artificial Intelligence (IJIMAI), 09/2016)
      In online learning is more difficult for teachers identify to see how individual students behave. Student’s emotions like self-esteem, motivation, commitment, and others that are believed to be determinant in student’s ...

    Mi cuenta

    AccederRegistrar

    ¿necesitas ayuda?

    Manual de UsuarioContacto: reunir@unir.net

    Listar

    todo Re-UnirComunidades y coleccionesPor fecha de publicaciónAutoresTítulosPalabras claveTipo documentoTipo de accesoEsta colecciónPor fecha de publicaciónAutoresTítulosPalabras claveTipo documentoTipo de acceso






    Aviso Legal Política de Privacidad Política de Cookies Cláusulas legales RGPD
    © UNIR - Universidad Internacional de La Rioja
     
    Aviso Legal Política de Privacidad Política de Cookies Cláusulas legales RGPD
    © UNIR - Universidad Internacional de La Rioja