This paper aims at evaluating the transcription accuracy of the Google-IT’s ASR service available in the OH Portal. Data on its performance are limited to good quality recordings. Thus, we focus on suboptimal authentic materials, encompassing non-standard conversational speech recorded in noisy environments. We carry out a quanti-qualitative analysis of the linguistics and extra-linguistic parameters affecting accuracy and error distribution. The preliminary results show higher Word Error Rates for non-standard speech and low-quality recordings. Moreover, we seek the error patterns that could ease the transcription correction process for the users.
Del Rosso, G.A., & Brambilla, S. (In corso di stampa). L’accuratezza della trascrizione ASR sul parlato non-standard. L’italiano nell’OH Portal. In L. Spreafico (a cura di), Studi AItLA 12: Fare linguistica applicata con le "digital humanities". Milano : Officina Ventuno.
Titolo: | L’accuratezza della trascrizione ASR sul parlato non-standard. L’italiano nell’OH Portal | |
Autori: | ||
Data di pubblicazione: | Being printed | |
Citazione: | Del Rosso, G.A., & Brambilla, S. (In corso di stampa). L’accuratezza della trascrizione ASR sul parlato non-standard. L’italiano nell’OH Portal. In L. Spreafico (a cura di), Studi AItLA 12: Fare linguistica applicata con le "digital humanities". Milano : Officina Ventuno. | |
Handle: | http://hdl.handle.net/11590/394463 | |
Appare nelle tipologie: | 2.1 Contributo in volume (Capitolo o Saggio) |