The contribution introduces IMPAQTS, a corpus of Italian political speeches aligned to the audio/video version and annotated for debatable linguistic implicit content (presuppositions, implicatures, vagueness and topicalizations). It presents the balancing criteria, the main ones being the type of political speech and the diachronic variable, which covers with increasing quantitative representativeness over time the entire history of the Republic. Particular emphasis is given to the method adopted for transcribing spoken language, which led to the production of two versions of the corpus: one with orthographic punctuation and one with terminal and non-terminal breaks. The annotation scheme for linguistic strategies and their communicative functions is also presented in detail. Il contributo introduce IMPAQTS, un corpus di discorsi politici italiani allineati alla versione audio/video, annotato per impliciti linguistici che veicolano contenuti discutibili (presupposizioni, implicature, vaghezza e topicalizzazioni). Si presentano i criteri di bilanciamento, tra cui i principali sono il tipo di discorso politico e la variabile diacronica, che copre con rappresentatività quantitativa crescente nel tempo l'intera storia della Repubblica. Particolare rilievo è dedicato al metodo adottato per la trascrizione del parlato, che ha condotto alla produzione di due versioni del corpus, una con punteggiatura ortografica e una con break terminali e non terminali. Lo schema di annotazione pragmatica per impliciti linguistici e loro funzioni comunicative è inoltre presentato nel dettaglio.
Lombardi Vallauri, E., Cominetti, F., Giunta, G. (2025). IMPAQTS: un grande corpus multimodale di discorsi politici italiani annotato per gli impliciti linguistici. In Maria Roccaforta (a cura di), La comunicazione parlata - Spoken communication (pp. 89-106).
IMPAQTS: un grande corpus multimodale di discorsi politici italiani annotato per gli impliciti linguistici
Lombardi Vallauri, Edoardo;Cominetti, Federica;Giunta, Giulia
2025-01-01
Abstract
The contribution introduces IMPAQTS, a corpus of Italian political speeches aligned to the audio/video version and annotated for debatable linguistic implicit content (presuppositions, implicatures, vagueness and topicalizations). It presents the balancing criteria, the main ones being the type of political speech and the diachronic variable, which covers with increasing quantitative representativeness over time the entire history of the Republic. Particular emphasis is given to the method adopted for transcribing spoken language, which led to the production of two versions of the corpus: one with orthographic punctuation and one with terminal and non-terminal breaks. The annotation scheme for linguistic strategies and their communicative functions is also presented in detail. Il contributo introduce IMPAQTS, un corpus di discorsi politici italiani allineati alla versione audio/video, annotato per impliciti linguistici che veicolano contenuti discutibili (presupposizioni, implicature, vaghezza e topicalizzazioni). Si presentano i criteri di bilanciamento, tra cui i principali sono il tipo di discorso politico e la variabile diacronica, che copre con rappresentatività quantitativa crescente nel tempo l'intera storia della Repubblica. Particolare rilievo è dedicato al metodo adottato per la trascrizione del parlato, che ha condotto alla produzione di due versioni del corpus, una con punteggiatura ortografica e una con break terminali e non terminali. Lo schema di annotazione pragmatica per impliciti linguistici e loro funzioni comunicative è inoltre presentato nel dettaglio.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


