Gramática & Recursos

Este grupo centra-se na modelação do conhecimento linguístico integrando conhecimento sobre interfaces entre diferentes áreas da gramática e conhecimento sobre o uso da língua. O grupo tem como característica distintiva o trabalho conjunto nas áreas da fonologia, do léxico, da sintaxe e da semântica, com o objetivo de construir um modelo integrado de gramática, considerando a forma como o conhecimento linguístico é representado na mente humana, bem como a forma como esse conhecimento poderá ser modelado computacionalmente; o trabalho sobre a aquisição de L1 e L2 está naturalmente no centro deste programa de investigação. A integração de modelos de representação do conhecimento linguístico e de modelos de uso da língua é conseguida através do estudo de corpora.

A produção de corpora e recursos em geral serve ainda o objetivo do grupo de produzir documentação e descrições do português europeu contemporâneo, bem como de línguas menos estudadas que resultam de contacto linguístico (crioulos de base lexical portuguesa, variedades nacionais do português em África e na Ásia). O grupo produz ainda recursos para o estudo da aquisição do português como L1 e como L2 em diferentes situações de aquisição. O grupo integra o CLARIN LP.

A investigação desenvolvida por vários membros do grupo na área da aquisição de L1 e L2 contribui diretamente para o objetivo geral do CLUL de articulação entre investigação fundamental e aplicada, nomeadamente nas áreas da Linguística Educacional e da Linguística Clínica.

São, atualmente, grandes objetivos do grupo:

- Produzir novos recursos para o estudo do português e de crioulos de base lexical portuguesa;

- Continuar investigação fundamental que visa a modelação do conhecimento linguístico, integrando conhecimento sobre interfaces internas à gramática;

- Continuar a documentação e descrição de crioulos e novas variedades do português que emergiram em situação de contacto de línguas;

- Desenvolver o estudo da aquisição do português, dando especial atenção a situações de contacto linguístico (no âmbito do recente Heritage Language Consortium) e à comparação entre desenvolvimento típico e atípico;

- Explorar a potencialidade da linguística comparada para a produção de recursos para a tradução e promover, na mesma área, ligações à indústria.

Recursos Tipo
A Lexicon of Child European Portuguese - CEPLEXicon Léxico
Acquisition of European Portuguese Databank - AcEP Base de dados
Banco do Discurso para o português - CRPC-DB Corpus
Base de dados de citações - CRPC-quotations Base de dados
Base de Dados para a Identificação do Português Língua Nativa - NLI-PT Base de dados
Biografias de personalidades portuguesas - Bio-PT Base de dados
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Base de dados
CoKri: a corpus of Guinea-Bissau Kriol / um corpus do Kriol da Guiné-Bissau - CoKri Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus de Português de Cabo Verde Corpus
Corpus de Português do Sri Lanka Corpus
Corpus de Referência do Português Contemporâneo - CRPC Corpus
Corpus de Textos Literários - LT Corpus Corpus
Corpus do Parlamento Português anotado com POS - PTPARL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus Online de Escrita e Fala de Crianças nos Primeiros Anos de Escolaridade - EFFE-On Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - Português Europeu Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Ferramenta
Dados Orais de Cabo Verde - CV Words Base de dados
Demo de Subespecificação e Desambiguação de Escopo Ferramenta
Dicionário de Hindi-Português-Hindi Base de dados
Discurso Informal de Lisboa e Braga - DILeB Corpus
Diu Indo-Portuguese Data Set Base de dados
Interacção Pessoa-Máquina em Linguagem Natural - INQUER Base de dados
Learner Corpus of Portuguese L2 - COPLE2 Corpus
Léxico de modalidade - MODAL-LEX-PT Léxico
Léxico Multifuncional Computorizado do Português Contemporâneo Léxico
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Base de dados
Pereira&Freitas - EP Corpus
PhonoDis Corpus
Português Controlado - CLG Base de dados
Português Falado - Variedades Geográficas e Sociais Corpus
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Léxico
Portuguese Technical Lexica - LEXTEC Léxico
Ramalho – EP Corpus
Recolha de dados de PLE Corpus
Reconhecedor de Entidades Nomeadas - CRPC-NER Ferramenta
Santome Structure Dataset Base de dados
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Tarefas de Consciência Fonológica para Crianças do 1.º Ciclo do Ensino Básico - TCFC Ferramenta
Tarefas de produção orais e escritas de sequências consonânticas - PORESC Ferramenta
Unidades Lexicais Multipalavra Nominais em Português Europeu Léxico
Vocativos em Português Europeu Corpus
Word Combination in European Portuguese - LEX-MWE-PT Léxico
WordNet.PT Léxico
Artigo em Atas
Matos, G. (1995). Estruturas Binárias e Monocêntricas em Sintaxe — algumas observações sobre a coordenação de projecções máximas. In Actas do X Encontro Nacional da Associação Portuguesa de Linguística, 1994 (pp. 301-315). Évora: Edições Colibri, APL. Retrieved from https://apl.pt/wp-content/uploads/2017/12/1994-23.pdf
Costa, A., Faria, I. H., & Matos, G. (1998). Ambiguidade referencial na identificação do sujeito em estruturas coordenadas. In Actas do XIII Encontro Nacional da Associação Portuguesa de Linguística, 1997 (Mota, M.A,; Marquilhas, R. , pp. 173-188). Lisboa: Edições Colibri / APL . Retrieved from https://apl.pt/wp-content/uploads/2017/12/1997-16.pdf
Matos, G., Miguel, M., & Freitas, J. (1997). Functional Categories in Early Acquisition of European Portuguese. In Proceedings of Gala' 97 Conference on Language Acquisition (Sorace, A.; Heycock, C.; Shillcock, R., pp. 115-120).
Matos, G. (1996). A Sintaxe e a Morfo-Sintaxe nas Gramáticas Descritivas do Século XX. In Actas do XI Encontro Nacional da Associação Portuguesa de Linguística, 1995 (Duarte, I.; Miguel, M. , pp. 105-121). Lisboa: Edições Colibri / APL. Retrieved from https://apl.pt/wp-content/uploads/2017/12/1995-10-2.pdf
Matos, G. (1989). Elipse do SV em estruturas predicativas com ser e estar. In Actas do IV Encontro Nacional da Associação Portuguesa de Linguística (pp. 41-67). Lisboa: Reprografia da Associação de Estudantes da Faculdade de Letras de Lisboa . Retrieved from https://apl.pt/wp-content/uploads/2017/12/1988-5.pdf
Kurfalı, M., Sibel, O., Zeyrek, D., & Mendes, A. (2020). TED-MDB Lexicons: Tr-EnConnLex, Pt-EnConnLex. In Proceedings of the First Workshop on Computational Approaches to Discourse (Chloé Braud et al., Eds., pp. 148-153). Association for Computational Linguistics.
Crible, L., & Mendes, A. (2018). Designing a corpus-based lexicon for spoken DRDs: semantic considerations. In Proceedings of the Cross-Linguistic Discourse Annotation: Applications and Perspectives, Final Action Conference TextLink (L.M. Ho-Dac & Phillip Mueller, Eds., pp. 29-33). University of Toulouse.
Freitas, M. J., Vigário, M., & Frota, S. (2004). The acquisition of the Prosodic Word in European Portuguese. In Second Lisbon Meeting on Language Acquisition. Lisboa.
Hagemeijer, T., Mendes, A., Gonçalves, R., Cornejo, C., Madureira, R., & Généreux, M. (2022). The PALMA Corpora of African Varieties of Portuguese. In N. Calzolari, Béchet, F., Blache, P., Choukri, K., Declerck, T., Goggi, S., et al. (Eds.), Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022) (Marseille, 20-25 June 2022. Paris: European Language Resources Association (ELRA), pp. 5047-5053).
Segura, L. (1996). Aspectos fonéticos do Barlavento do Algarve: as vogais finais acentuadas. In I. Duarte & Leiria, I. (Eds.), Actas do Congresso Internacional sobre o Português Vol. II (1994) (pp. 345-358). Lisboa: APL e Eds Colibri.
Rodrigues, C., & Gomes, J. (2023). "Otraves" o mesmo "faitico": a proficiência ortográfica nos dígrafos e de crianças alentejanas e transmontanas do 2.º ano de escolaridade. In C. Amorim & Zhou, C. (Eds.), Atas do II Phonoshuttle OPO-LIS: Ponte aérea de fonologia (pp. 53-62). Retrieved from https://ler.letras.up.pt/uploads/ficheiros/19671.pdf
Edição de Atas
Mendonca, V., Sardinha, A., Coheur, L., & Santos, A. L. (2020). Query Strategies, Assemble! Active Learning with Expert Advice for Low-resource Natural Language Processing. 2020 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE). IEEE. http://doi.org/10.1109/fuzz48607.2020.9177707
Dataset
Gonçalves, R., Hagemeijer, T., Cornejo, C., Alcantâra, C., Madureira, R., Généreux, M., & Mendes, A. (2021). PALMA Corpus São Tomé e Príncipe . Lisboa: Centro de Linguística da Universidade de Lisboa.
Hagemeijer, T., Madureira, R., Cornejo, C., Justino, V., Campos, M., Gonçalves, R., et al. (2021). PALMA Corpus Moçambique. Lisboa: Centro de Linguística da Universidade de Lisboa.
Miguel, A., Cornejo, C., Madureira, R., Silva, D., Hagemeijer, T., Gonçalves, R., et al. (2021). PALMA Corpus Angola. Lisboa: Centro de Linguística da Universidade de Lisboa.
Edição Eletrónica
Colaço, M., Gonçalves, A., Freitas, M. J., & Gomes, J. (2022). A casa na quinta: das palavras às frases. Lisboa: Direção Geral de Educação. Retrieved from https://redge.dge.mec.pt/ilha/por4/
Artigo em Revista
Flores, C., Santos, A. L., Jesus, A., & Marques, R. (2017). Age and input effects in the acquisition of mood in Heritage Portuguese. Journal Of Child Language, 44(4), 795-828. http://doi.org/10.1017/s0305000916000222
Santos, A. L., Gonçalves, A., & Hyams, N. (2014). Complementos de verbos percetivos. Causativos E De Controlo De Objeto Em Português Europeu: Dados Da Aquisição. In Xxix Encontro Nacional Da Apl, 2013.
Almeida, M. C. (2006). Blend-Bildungen - und was dahinter steckt. Portugiesisch Kontrastiv Gesehen Und Anglizismen Weltweit, 10., 241-259.
Duarte, I. (2013). Construções de Topicalização, in Gramática do Português. Vol. I, I, 401-426.
Hagemeijer, T., & Holm, J. (2008). On the Creole Portuguese of São Tomé (West Africa). Annotated translation from the German of “Ueber das Negerportugiesische von S. Thomé (Westafrika. ). ” Sitzungsberichte der kaiserlichen Akademie der Wissenschaften zu Wien 101(2): 889-917. [1882]. Contact Languages: Critical Concepts In Linguistics, I, 131-156.
Marques, R. (2013). Construções de grau, in Gramática do Português. Eduardo Paiva Raposo Et Al. Lisboa: Fundação Calouste Gulbenkian, Cap, 40, 2139-2163.
Marques, R. (2012). Covert Modals and (Non-) Implicative Readings of too/enough Constructions, Covert Patterns of Modality. W. Abraham & E. Leiss. Cambridge: Cambridge Scholars Publishing, Pp. 238-266. Isbn, 238-266.
Marques, R. (2003). Semantic and Pragmatic Constraints on Mood Selection, in Meaning Through Language Contrast. Vol. 1, 1, 129-146.
Matos, G., & Brito, A. M. (2013). The alternation between improper indirect questions and restrictive relatives. Linguistik Aktuell/Linguistics Today, 197, 83-116. http://doi.org/https://doi.org/10.1075/la
Matos, G., & Brito, A. (2008). Comparative clauses and cross linguistic variation: a syntactic approach. Empirical Issues In Syntax And Semantics. Bonamy, O; Hofherr, P. (Eds), 7, 307–329. Retrieved from http://www.cssp.cnrs.fr/eiss7/
Mota, M. A., Rodrigues, C., & Soalheiro, E. (2003). Padrões flexionais nos pretéritos fortes. Pe Falado Setentrional, In Razão E Emoções , II - Volume de Homenagem a Maria Helena Mira Mateus, 129-155.
Vigário, M., Frota, S., & Freitas, M. J. (2009). Phonetics and Phonology. Interactions And Interrelations. Current Issues In Linguistic Theory, 306.
Costa, J., Fiéis, A., Freitas, M. J., Lobo, M., & Santos, A. L. (2014). New Directions in the Acquisition of Romance Languages. Selected Proceedings Of The Romance Turn V. Cambridge Scholars Publishing. Isbn.
Freitas, M. J. (2003). Journal of Portuguese Linguistics. ., On.