Gramática & Recursos

Este grupo centra-se na modelação do conhecimento linguístico integrando conhecimento sobre interfaces entre diferentes áreas da gramática e conhecimento sobre o uso da língua. O grupo tem como característica distintiva o trabalho conjunto nas áreas da fonologia, do léxico, da sintaxe e da semântica, com o objetivo de construir um modelo integrado de gramática, considerando a forma como o conhecimento linguístico é representado na mente humana, bem como a forma como esse conhecimento poderá ser modelado computacionalmente; o trabalho sobre a aquisição de L1 e L2 está naturalmente no centro deste programa de investigação. A integração de modelos de representação do conhecimento linguístico e de modelos de uso da língua é conseguida através do estudo de corpora.

A produção de corpora e recursos em geral serve ainda o objetivo do grupo de produzir documentação e descrições do português europeu contemporâneo, bem como de línguas menos estudadas que resultam de contacto linguístico (crioulos de base lexical portuguesa, variedades nacionais do português em África e na Ásia). O grupo produz ainda recursos para o estudo da aquisição do português como L1 e como L2 em diferentes situações de aquisição. O grupo integra o CLARIN LP.

A investigação desenvolvida por vários membros do grupo na área da aquisição de L1 e L2 contribui diretamente para o objetivo geral do CLUL de articulação entre investigação fundamental e aplicada, nomeadamente nas áreas da Linguística Educacional e da Linguística Clínica.

São, atualmente, grandes objetivos do grupo:

- Produzir novos recursos para o estudo do português e de crioulos de base lexical portuguesa;

- Continuar investigação fundamental que visa a modelação do conhecimento linguístico, integrando conhecimento sobre interfaces internas à gramática;

- Continuar a documentação e descrição de crioulos e novas variedades do português que emergiram em situação de contacto de línguas;

- Desenvolver o estudo da aquisição do português, dando especial atenção a situações de contacto linguístico (no âmbito do recente Heritage Language Consortium) e à comparação entre desenvolvimento típico e atípico;

- Explorar a potencialidade da linguística comparada para a produção de recursos para a tradução e promover, na mesma área, ligações à indústria.

Recursos Tipo
A Lexicon of Child European Portuguese - CEPLEXicon Léxico
Acquisition of European Portuguese Databank - AcEP Base de dados
Banco do Discurso para o português - CRPC-DB Corpus
Base de dados de citações - CRPC-quotations Base de dados
Base de Dados para a Identificação do Português Língua Nativa - NLI-PT Base de dados
Biografias de personalidades portuguesas - Bio-PT Base de dados
Child-Adult Interaction Corpus - CAI Corpus
Child-Adult interaction European Portuguese Base de dados
CoKri: a corpus of Guinea-Bissau Kriol / um corpus do Kriol da Guiné-Bissau - CoKri Corpus
Corpus Almeida - European Portuguese / French Corpus
Corpus Angolar Corpus
Corpus C-ORAL-ROM Corpus
Corpus CCF Corpus
Corpus CINTIL Corpus
Corpus de Português de Cabo Verde Corpus
Corpus de Português do Sri Lanka Corpus
Corpus de Referência do Português Contemporâneo - CRPC Corpus
Corpus de Textos Literários - LT Corpus Corpus
Corpus do Parlamento Português anotado com POS - PTPARL Corpus
Corpus Fadambo Corpus
Corpus Leiria (1991) Corpus
Corpus Online de Escrita e Fala de Crianças nos Primeiros Anos de Escolaridade - EFFE-On Corpus
Corpus PESTRA Corpus
Corpus Português Fundamental - Corpus PF Corpus
Corpus Principense Corpus
Corpus REDIP Corpus
Corpus Santome Corpus
Corpus SANTOS - Português Europeu Corpus
Crosslinguistic Child Phonology Project - Português Europeu - CLCP-PE Ferramenta
Dados Orais de Cabo Verde - CV Words Base de dados
Demo de Subespecificação e Desambiguação de Escopo Ferramenta
Dicionário de Hindi-Português-Hindi Base de dados
Discurso Informal de Lisboa e Braga - DILeB Corpus
Diu Indo-Portuguese Data Set Base de dados
Interacção Pessoa-Máquina em Linguagem Natural - INQUER Base de dados
Learner Corpus of Portuguese L2 - COPLE2 Corpus
Léxico de modalidade - MODAL-LEX-PT Léxico
Léxico Multifuncional Computorizado do Português Contemporâneo Léxico
NPChunks: Corpus of 1000 sentences annotated with PoS and nominal chunks - NPChunks Corpus
Online Dictionary Portuguese-Slovak/Slovak-Portuguese Base de dados
Pereira&Freitas - EP Corpus
PhonoDis Corpus
Português Controlado - CLG Base de dados
Português Falado - Variedades Geográficas e Sociais Corpus
Portuguese Corpus Annotated for Modality - MODAL Corpus
Portuguese Lexicon of Discourse Markers - LDM-PT Léxico
Portuguese Technical Lexica - LEXTEC Léxico
Ramalho – EP Corpus
Recolha de dados de PLE Corpus
Reconhecedor de Entidades Nomeadas - CRPC-NER Ferramenta
Santome Structure Dataset Base de dados
Spoken Corpus Mozambique 1986-87 - SCM Corpus
Tarefas de Consciência Fonológica para Crianças do 1.º Ciclo do Ensino Básico - TCFC Ferramenta
Tarefas de produção orais e escritas de sequências consonânticas - PORESC Ferramenta
Unidades Lexicais Multipalavra Nominais em Português Europeu Léxico
Vocativos em Português Europeu Corpus
Word Combination in European Portuguese - LEX-MWE-PT Léxico
WordNet.PT Léxico
Livro
Freitas, M. J., Rodrigues, C., Costa, T., & Castelo, A. (2012). Os Sons que estão dentro das Palavras. Descrição e Implicações para o Ensino do Português como Língua Materna. Lisboa: Colibri/APP.
Gonçalves, F., Guerreiro, P., & Freitas, M. J. (2011). O Conhecimento da Língua: Percursos de Desenvolvimento. Lisboa: Ministério da Educação/Direcção-Geral da Inovação e Desenvolvimento Curricular.
Pereira, I., Mata, A. I., & Freitas, M. J. (1992). Estudos em Prosódia (Lisboa). Colibri.
(2010). Avaliação da Consciência Linguística. (M. J. Freitas, Gonçalves, A., & Duarte, I., Eds.) (Aspectos Fonológicos e Sintácticos do Português. Lisboa). Colibri.
(2008). Language Acquisition and Development. (A. Gavarró & Freitas, M. J., Eds.). Newcastle: Cambridge Scholars Publishing.
(2005). Prosodies with Special Reference to Iberian Languages. (S. Frota, Vigário, M., & Freitas, M. J., Eds.). Berlin, New York: Mouton de Gruyter.
(2002). Proceedings of the GALA’2001 Conference on Language Acquisition. (J. Costa & Freitas, M. J., Eds.). Lisboa: APL.
(1995). Studies on the Aquisition of Portuguese. (I. Faria & Freitas, M. J., Eds.) (Lisboa). Colibri.
Araújo, G. A., & Hagemeijer, T. (2013). Dicionário Santome-Português / Português-Santome. São Paulo: Hedra.
Hagemeijer, T., & Ogie, O. (2011). Edo influence on Santome: evidence from verb serialization and beyond. Creoles, their substrates, and language typology (pp. 37-60). C. Lefebvre. Amsterdam/Philadelphia: John Benjamins.
Ladhams, J., Hagemeijer, T., Maurer, P., & Post, M. (2002). Reduplication in the Gulf of Guinea Creoles. Twice as meaningful (pp. 165-176). S. Kouwenberg. London: Westminster Creolistics Series.
Lejeune, P. (2004). Discours d experts en économie. Limoges: Lambert-Lucas.
Mata, A. I., Horta, M. J., & Freitas, J. C. (2001). NetLíngu@: uma Iniciativa no Âmbito da Formação Inicial de Professores de Língua Portuguesa. Catálogo da Feira de Projectos “As Línguas Abrem Caminhos”. Ano Europeu das Línguas 2001. Lisbon: ME/GAERI.
Rodrigues, C. (2003). Lisboa e Braga: Fonologia e Variação. Lisboa: Lisboa: FCG / FCT.
Lamas, E., Pinto, J., & Silva, L. (2007). Técnicas de Expressão Oral e Escrita. Porto: Instituto Piaget.
Peres, J. A., & Móia, T. (1995). Áreas Críticas da Língua Portuguesa. Lisboa: Editorial Caminho (2.ª edição / 2nd edition, 2003, 539 pp.).
(2001). Actas do XVI Encontro da Associação Portuguesa de Linguística. (N. Correia & Gonçalves, A., Eds.). Lisboa: APL.
Gonçalves, A. (1994). Translation of Chomsky. Origem e Uso. Lisboa: Caminho.
Almeida, M. C., Cavaco-Cruz, L., & Ramos, I. (2016). Tradução-TranscriaçãoTransculturalidade. Independence: Arkonte Publishing.
Barbosa, P., de Paiva, M. C., & Rodrigues, C. (2017). Studies on Variation in Portuguese . Issues in Hispanic and Lusophone Linguistics (Vol. 14, p. 345). Amsterdam/Philadelphia: John Benjamins Publishing. http://doi.org/10. 1075/ihll.14
Freitas, M. J., & Santos, A. L. (2017). Aquisição de língua materna e não materna: Questões gerais e dados do Português. (Textbooks in Language Sciences 3). Berlim: Language Science Press.
Viana, F. L., Cadime, I., Silva, C. M., Santos, A. L., Ribeiro, I., de Lima, C., et al. (2017). MacArthur-Bates Inventários de Desenvolvimento Comunicativo – Manual Técnico. Maia: Lusoinfo Multimédia SA.
(2013). Gramática do Português. (E. B. P. Raposo, Bacelar do Nascimento, M. F., Mota, M. A., Segura, L., & Mendes, A., Eds.) (Vol. I e II). Lisboa: Fundação Calouste Gulbenkian.
Branco, A., Mendes, A., Pereira, S., Henriques, P., Pellegrini, T., Meinedo, H., et al. (2012). The Portuguese Language in the Digital Age - A Língua Portuguesa na Era Digital, White Paper Series. (G. Rehm & Uszkoreit, R. & H., Eds.). Berlin: Springer-Verlag.
Mendes, A. (2004). Predicados Verbais Psicológicos do Português. Contributo para o estudo da polissemia verbal. Colecção Textos Universitários de Ciências Sociais e Humanas. Fundação Calouste Gulbenkian, Fundação para a Ciência e a Tecnologia.
(2004). Actas do XIX Encontro da Associação Portuguesa de Linguística. (T. Freitas & Mendes, A., Eds.). Lisboa: Associação Portuguesa de Linguística.
(2004). Language Technology for Portuguese: Shallow processing tools and resources. (A. Branco, Mendes, A., & Ribeiro, R., Eds.). Lisboa: Colibri.
(2003). Actas do XVIII Encontro da Associação Portuguesa de Linguística. (A. Mendes & Freitas, T., Eds.). Lisboa: Associação Portuguesa de Linguística / Colibri.
(2003). Tagging and Shallow Processing of Portuguese: workshop notes of TASHA 2003. (A. Branco, Mendes, A., & Ribeiro, R., Eds.). Lisboa: Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa.
Alexandre, N. (2012). The Defective Copy Theory of Movement: Evidence from Wh-Constructions in Cape Verdean Creole. Amsterdam / Philadelphia: John Benjamins.