2018, July 25th - Anja Weingart (Georg-August-Universität Göttingen)

"Binding in four agreement steps: A syntactic derivation of anaphoric dependencies in Spanish and European Portuguese"

"In this talk I will present a minimalist, agreement-based analysis that aims to account for the interpretation of reflexive and non-reflexive pronouns in Peninsular Spanish (PSp) and European Portuguese (EP), languages with clitic doubling of reflexive and non-reflexive pronouns. Structural (c-command, locality and complementary distribution) and interpretative diagnostics (VP-ellipsis, only-contexts), clearly show that the interpretation of the clitic and its double is determined syn­tactically: it is de­termined locally, dependent on c-command, and unambiguously bound for reflexives and free for non-reflexive clitics.  The analysis in the second part of the talk aims to derive the syntax and interpretation of the clitic and its double by means of the following four agreement steps: Step I: agreement between the clitic and its double. This is motivated by the fact that the clitic determines the interpretation of the reflexive and the non-reflexive double. Step II: clitization as agreement and incorporation (cf. Roberts 2009), which follows from a unified analysis of object clitics and reflexive clitics. I will take reflexive predicates in EP and PSp to be syntactically transitive (against Kayne 1988, Sportiche 1990/1998, Alboiu et al. 2004, Reinhart and Siloni 2004, 2005 and in favor of Rizzi 1986 and Marelj & Reuland 2016) for the following rea­sons: Reflexive predicates do not pattern with unaccusative verbs wrt. (i) auxiliary selection, (ii) past participle agreement, (iii) availability of postverbal bare subjects and with unergative verbs wrt. clitic placement in faire-causatives. Furthermore, the double is not an adjunct, as assumed e.g. by Alboiu et al. (2004), but an argument, due to (i) the availability of clitic doubling in ECM constructions and (ii) ellipsis tests. Finally the clitic is not a pure case absorber, because reflexive predicates are distinct from antipassive predicates. Step III: agreement between the subject/external argument and the clitic-verb complex in the line of Kratzer (2009), following from the fact that the binding domain of clitics is essentially the domain in which the clitic meets the subject/external argument. Step IV: agreement between the double and the intensifier, i.e. próprio (EP) and mismo (PSp), respectively."


Alboiu et al. (2004): SE and the unaccusative-unergative paradox. In: Ciene et al. (eds.), Antwerp Papers in Linguistics 107. Antwerp: University of Antwerp, 109-141.

Kayne, R. (1988): "Romance SE/si". In:  GLOW Newsletter 20.

Kratzer, A. (2009): Making a pronoun: Fake indexicals as windows into the properties of pronouns. In: Linguistic Inquiry 40:187–237.

Marelj, M. and Reuland E. (2016): “Clitics and Reflexives: Reducing the Lexicon-SyntaxParameter”. In: Martin Everaert, Marlj Marijana and Reuland Eric (eds.): Concepts, syntax andtheir interfaces. Cambridge, Mass.: MIT Press, 175-252.

Reinhart, T. and T. Siloni (2004): Against the Unaccusative Analysis of Reflexives. In: A. Alexiadou et al. (eds.),The Unaccusativity Puzzle. Oxford: OUP, 288-331.

Reinhart, T. and T. Siloni (2005): The lexicon-syntax parameter: Reflexivization and other arity operations. In: Linguistic Inquiry 36:439-492.

Roberts, I. (2009):Agreement and head movement: clitics, incorporation and defective goals. Cambridge, Mass.: MIT Press.

Rizzi, L. (1986): On Chain Formation. In H. Borer (ed.),The syntax of pronominal clitics.New York: Academic Press, 399-437.

Sportiche, D. (1990):Movement, Case and Agreement.Manuscript, UCLA;

Sportiche, D. (1998):Partitions and Atoms of Clause Structure: Subjects, agreement, case and clitics. London: Routledge. 


2018, June 11th - María Sampedro (CLUL)

"Sociolinguística das formas de tratamento do Português Europeu"

"As formas de tratamento têm sido amplamente abordadas nas distintas línguas, devido às diferenças no seu uso. No caso do Português, são numerosas as investigações dos últimos cinquenta anos (Cintra, 1972; Carreira, 1997, 2004; Duarte, 2010, 2011; Marques, 2010, 2014; Raposo et al., no prelo; etc.) que mostram a grande variabilidade destas formas no discurso. Neste seminário apresentaremos os resultados de um  estudo sociolinguístico que inclui duas tarefas experimentais sobre as formas de tratamento do Português Europeu (tu, você, o senhor/a) realizadas por estudantes portugueses das Universidades de Coimbra, Porto e Lisboa. A primeira parte do estudo está focada no uso das formas de tratamento tendo em conta diferentes variáveis sociais e contextuais, enquanto a segunda trata das percepções conscientes dos falantes na utilização destas formas: possíveis dúvidas, situações que provocam maiores dificuldades na escolha, variáveis que consideram mais importantes, etc.."


Carreira, M. H. (1997). Modalisation Linguistique en Situation d’Interlocution: Proxémique Verbale et Modalités en Portugais. Louvain-Paris: Peeters.

Carreira, M. H. (2004). Les formes d’allocution du portugais européen : valeurs et fonctionnements discursifs, Franco-British Studies 1, pp. 35-45.

Cintra, L. (1972). Sobre Formas de Tratamento na Língua Portuguesa. Lisboa: Livros Horizonte.

Duarte, I. M. (2010). Formas de tratamento: item gramatical no ensino do Português Língua Materna. Em A. M. Brito (org.), Gramática: história, teorias, aplicações (136-146). Porto: Universidade do Porto.

Duarte, I. M. (2011). Formas de tratamento em português: entre léxico e discurso. Matraga 18, pp. 84-101

Marques, M. A. (2010). Formas de tratamento e construção da relação interpessoal em Contos da Montanha de Miguel Torga. Revista Galega de Filoloxía 11, pp. 61-78.

Marques, M. A. (2014). Cortesia, formas de tratamento e géneros discursivos - condições de ocorrência e de uso. Em I. Seara (org.), Cortesia: Olhares e reinvenções (145-172). Lisboa: Chiado Editora.

Raposo, E. P. R., F. Bacelar do Nascimento, A. C. Mota, L. Segura e A. Mendes (coord.) (no prelo): Gramática do Português, vol. III. Lisboa: Fundação Calouste Gulbenkian. 


2018, May 24thMarisa Filipe (CLUL),Selene Vicente, Sónia Frota (CLUL)

"Executive Functions and Prosodic Abilities in Children with High-Functioning Autism"

"Little is known about the relationship between prosodic abilities and executive function skills. As deficits in executive functions (EFs) and prosodic impairments are characteristics of autism, we examined how EFs are related to prosodic performance in children with high-functioning autism (HFA). Fifteen children with HFA (M = 7.4 years; SD = 1.12) matched to 15 typically developing peers on age, gender, and non-verbal intelligence participated in the study. The Profiling Elements of Prosody in Speech-Communication (PEPS-C; Peppé & McCann, 2003) adapted to European Portuguese (Filipe et al., 2017) was used to assess prosodic performance. The PEPS-C includes tasks at two levels: formal and functional. The formal level assesses auditory discrimination and production abilities (related to perceptual and motor skills) required to perform the tasks. The functional level takes into account four prosodic functions (related to cognitive understanding and expression): affect, modality, chunking, and focus. The European Portuguese version of the PEPS-C provides typical data for ages between 5 and 20 (N = 131) that are useful for comparison with the performance of atypical populations. The Children’s Color Trails Test (CCTT-1, CCTT-2, and CCTT Interference Index; Llorente et al., 2003) was used as an indicator of executive control abilities. Our findings suggest no relation between prosodic abilities and visual search and processing speed (assessed by CCTT-1), but a significant link between prosodic skills and divided attention, working memory/sequencing, set-switching, and inhibition (assessed by CCTT-2 and CCTT Interference Index). These findings may be of clinical relevance since difficulties in EFs and prosodic deficits are characteristic of many neurodevelopmental disorders. Future studies are needed to further investigate the nature of the relationship between impaired prosody and executive (dys)function."

Presentation slides are available: slides 1slides 2slides 3, and slides 4.


2018, April 23rd - Paula Luegi (CLUL) and Eunice Fernandes

"Adaptation in Pronoun Resolution: Evidence from Brazilian and European Portuguese" 

"Previous research accounting for pronoun resolution as a problem of probabilistic inference has not explored the phenomenon of adaptation, whereby the processor constantly tracks and adapts, rationally, to changes in a statistical environment. We investigate whether Brazilian (BP) and European Portuguese (EP) speakers adapt to variations in the probability of occurrence of ambiguous overt and null pronouns, in two experiments assessing resolution towards subject and object referents. For each variety (BP, EP), participants were faced with either the same number of null and overt pronouns (equal distribution), or with an environment with fewer overt (than null) pronouns (unequal distribution). We find that the preference for interpreting overt pronouns as referring back to an object referent (object-biased interpretation) is higher when there are fewer overt pronouns (i.e., in the unequal, relative to the equal distribution condition). This is especially the case for BP, a variety with higher prior frequency and smaller object-biased interpretation of overt pronouns, suggesting that participants adapted incrementally and integrated prior statistical knowledge with the knowledge obtained in the experiment. We hypothesize that comprehenders adapted rationally, with the goal of maintaining, across variations in pronoun probability, the likelihood of subject and object referents. Our findings unify insights from research in pronoun resolution and in adaptation, and add to previous studies in both topics: They provide evidence for the influence of pronoun probability in pronoun resolution, and for an adaptation process whereby the language processor not only tracks statistical information, but uses it to make interpretational inferences."


2018, March 14th - Hugo Cardoso (CLUL) and Maesh Radhakrishnan (CLUL)

"Documenting Sri Lanka Portuguese in speech and song"

"Sri Lanka Portuguese is a Portuguese-based creole language currently spoken mostly in the Eastern Province of Sri Lanka, by the community identified as Portuguese Burghers. This talk reports on an ongoing documentation project, which is building a large annotated corpus of this vulnerable language as well as of Burgher music, song and dance. In this talk, we will introduce the project, its objectives and results, exploring in particular the diverse settings in which linguistic samples have been and will be collected - including interviews, conversations, demonstrations, as well as songs. Some musicolinguistic analyses of song performances will also be presented."


2018, February 23rd - James Pustejovsky (Brandeis University)

"Verb Meaning and Co-compositionality: Means, Manner, and Result"

"How do we define the meaning of a verb? Current linguistic theories use terms such as manner, means, and result, to help assign verbs to immutable classes with distinct behaviors. In this talk, I discuss those factors involved in identifying the semantics classes of verbs. I argue that there is no strict manner/result complementarity in the sense of Levin and Rappaport Hovav (2005, 2010). Nor are there verb classes in the sense of Levin (1993).  Rather, there are two factors involved in constructing the meaning of a predicate: the underlying dynamics of event structure, as developed recently within Generative Lexicon; and the interaction between event participants, as facilitated through co-composition. The resulting model is closer to Croft's (2012) notion of a causal analysis of verb meaning than that proposed by Levin and Rappaport Hovav, while also providing a formal interpretation of verbal polysemy in terms of co-compositionality."

Presentation slides are available: slides 1, slides 2, slides 3, slides 4, and slides 5.


2018, January 9th - Iria del Río (CLUL)

"COPLE2: anotação e pesquisa"

"Os corpora de aprendentes têm-se revelado nos últimos anos recursos muito úteis para diversas áreas relacionadas com a aprendizagem de segundas línguas, desde a área da aquisição de L2 à aprendizagem de línguas assistida por computador (I-CALL). 

Neste contexto, apresentamos o corpus COPLE2, que continua a ser desenvolvido no ANAGRAMA. A nossa apresentação focar-se-á em dois aspetos:

(i) Situação atual do corpus: composição e anotação. Discutiremos especialmente os desafios que apresenta a anotação linguística de um corpus com estas características, analisando as decisões tomadas até agora.

(ii) Possibilidades de pesquisa que oferece o corpus: mostraremos as potencialidades que apresenta o recurso através de diversos exemplos de pesquisa, discutindo as suas vantagens e problemas."


2017, December 13h  - Ana Margarida Ramalho (CLUL), Maria João Freitas (CLUL), Letícia Almeida, and Dina Alves

"CLCP-PE: validação de um instrumento de avaliação fonológica infantil"

"O CLCP - PE é um instrumento de avaliação fonológica infantil para crianças portuguesas, desenvolvido no âmbito do projeto Crosslinguistic Chil Phonology Project (CLCP), com sede na University of British Columbia (UBC) e coordenado por May Berhardt e Joe Stemberger. Esta parceria conduziu à criação de um protocolo entre a UBC e o CLUL.  O CLCP - PE consiste na adaptação ao PE do instrumento inicialmente criado para o inglês com base em pressupostos da fonologia generativa não-linear e já adaptado a mais de uma dezena de línguas (14, até ao momento). O projeto tem como objetivo central criar as condições para o desenvolvimento de análises comparadas de dados sobre a aquisição fonológica de várias línguas naturais, recolhidos com base em procedimentos metodológicos similares. Nesta apresentação, descreveremos sumariamente o CLCP - PE, enquadrando-o nos objetivos definidos pelo projeto CLCP, e apresentaremos resultados sobre as várias etapas da sua validação." 


2017, Novembro 30th  - Chiara Barbero (CLUL)

"Ligação entre léxico de especialidade e léxico comum: estado da arte e questões em aberto"

"Com esta comunicação queremos apresentar, brevemente, o estado de arte dos trabalhos realizados nos últimos anos relativos à ligação de léxico de especialidade e de léxico comum, num modelo de organização do léxico mental como a WordNet, e refletir sobre os limites que estas propostas apresentam e as questões que ficam em aberto. Tendo em conta a relevância das wordnets em tarefas de Processamento das Línguas Naturais (Huang, 2016), de Tradução, automática e não só (Marrafa & Mendes, 2007), e de Didática das Línguas (Miller & Fellbaum, 1992), acreditamos na importância de implementar este tipo de recurso com o objetivo de agilizar a comunicação entre públicos diferentes, em contextos interdisciplinares (Motos, 2011), de aprendizagem (Fuentes, 2001), entre outros. Em particular, procuraremos analisar que tipo de relações as sub-redes de especialidade estabelecem com as redes de léxico comum (Magnini & Speranza, 2001), nomeadamente nos casos de nós que pertencem a ambas as redes mas que raramente expressam os mesmos conceitos (Amaro & Mendes, 2012)." 


2017, Novembro 2nd - Ângela Correia (CLUL)

"A edição crítica de cantigas medievais"

"O cancioneiro do trovador português medieval Joam Soares Coelho é constituído por 21 cantigas de amor, 15 cantigas de amigo e 16 sátiras. Todos estes textos foram transmitidos por um ou vários dos três cancioneiros galego-portugueses (Cancioneiro da Ajuda, Cancioneiro da Biblioteca Nacional e Cancioneiro da Vaticana) e todos dialogam, de formas diversas, com outros textos medievais. Neste seminário pretende-se apresentar alguns casos em que o estudo linguístico, a análise dos testemunhos  e / ou a interpretação dos textos permitiu melhorar a fixação e o entendimento das cantigas deste cancioneiro. Pretende-se igualmente apresentar algumas reflexões teóricas decorrentes da prática de edição crítica do cancioneiro de Joam Soares Coelho." 


2017, June 9th - Marina Vigário (CLUL), Carla Pires (iMed.ULisboa), and Afonso Cavaco (iMed.ULisboa)

"Phonological measures for assessing linguistic complexity"

"Measuring linguistic complexity is useful for multiple purposes (e.g. assessing L1 and L2 development; evaluating or building written and oral material targeting specific audiences). While the topic has long attracted the attention of scholars, most languages still lack tools for calculating linguistic complexity, and in general phonological units and patterns are little explored. In this talk, we report on recent work proposing and motivating a number of phonologically- and statistically-based measures for linguistic complexity assessment, and apply these measures to samples of oral and written material with expected differences in complexity/cost, in order to determine the potential of these indicators to distinguish texts in terms of degree of complexity/cost. Besides directly reflecting phonological complexity/cost, some of the proposed measures also reflect complexity in other areas of grammar (morphology, syntax and semantics). The method is applied to European Portuguese (EP), but is extendable to other languages as well. The measures investigated take into consideration inherent properties of phonological units or patterns and/or their frequency in the language. It is assumed that less common units or patterns contribute to higher levels of difficulty/cost. Almost all measures proposed showed statistical differences among three groups of texts. The results indicate that simple and automatically obtained measures coming from the distribution of phonological units and patterns are able to distinguish texts of variable complexity in the expected direction."


2017, May 26th  - Anna Paradís (Universitat Autònoma de Barcelona)

"A subida dos clíticos: auxiliaridade e reestruturação"

A subida dos clíticos tem sido considerado um teste válido para determinar quais são os verbos que podem desencadear o fenómeno da reestruturação. De acordo com muitas das análises desta estrutura (Aissen & Perlmutter 1976; Rizzi 1982; Cinque 2006), os verbos modais, aspetuais e alguns verbos de movimento formam a classe dos verbos de reestruturação. Todavia, além destes verbos, há um conjunto de verbos de controlo de sujeito (Luján 1980; Gonçalves 1999), e, no caso do catalão, de controlo de objeto, que também permitem a subida do clítico. Estes casos levam-nos a questionar se este fenómeno constitui um teste válido para a reestruturação. Os objetivos deste trabalho são i) analisar o escopo do fenómeno da subida dos clíticos em catalão e estabelecer uma comparação com outras línguas românicas, principalmente, com o português europeu e o espanhol; ii) propor uma análise formal para os verbos desencadeantes deste fenómeno que dê conta das diferentes posições disponíveis para os clíticos e da diferente natureza que apresentam os verbos auxiliares e os verbos plenos.


2017, April 6th  - Peter Nahon (Sorbonne, Paris)

"Les langues des Juifs portugais au Portugal et en exil"

L’étude des particularismes enrichit souvent la compréhension des phénomènes généraux. Aussi l’analyse des états de langue propres aux populations juives est-elle fertile d’enseignements non seulement pour le champ et les méthodes de la linguistique historique mais aussi pour la connaissance culturelle et sociale des groupes concernés et des majorités les entourant. Ce fait se vérifie particulièrement dans l’espace lusophone, qui a la particularité d’offrir au regard du chercheur une variété de paradigmes illustrant toute la diversité des comportements langagiers juifs, comme nous le montrerons à travers une approche synthétique ponctuée d’études de cas. La situation linguistique des juifs dans le Portugal médiéval, autant qu’elle peut être connue par les rares documents, présente le caractère des sociétés juives traditionnelles : diglossie du vernaculaire local, le portugais, avec l’hébreu ; emploi à l’écrit d’une variété standardisée différente et moins stabilisée que le standard chrétien, et notée à l’aide de l’alphabet hébreu ; usage, à l’oral, de marqueurs lexicaux et peut-être phonétiques (par ex. chez Luis Anrriquez), produits de cette diglossie signalant l’altérité juive, mais modulables (d’où leur absence dans la littérature « non juive » d’auteurs juifs tels que Vidal o judeu de Elvas) et de manière générale à peu près absents à l’écrit. Le décret de 1496 marque un tournant : le judaïsme disparaît officiellement du royaume et la contexture langagière médiévale disparaît sans laisser de trace, tandis que se constitue simultanément la nouvelle classe sociale des Cristãos novos, moins issue de l’ancienne minorité, que, plutôt, de l’immigration des fugitifs juifs d’Espagne et de leur fusion avec une classe marchande portugaise naissante. Si, dans un premier temps, l’instabilité linguistique de ces groupes (illustrée notamment dans les pièces de Gil Vicente) est sensible, les générations suivantes, nées au Portugal, n’ont pas conservé de particularisme, lequel aurait été contraire aux contraintes sociales pesant sur les Nouveaux chrétiens. C’est dans l’exil des Cristãos novos et avec la constitution à partir de la fin du XVI siècle de colonies de cette nouvelle « Nation portugaise » gagnée au judaïsme qu’apparaît à nouveau une situation de différenciation, mais où cette fois, la langue portugaise occupe presque les fonctions autrefois dévolues à l’hébreu. Installées en France, en Hollande, en Italie ou ailleurs, les Nouveaux chrétiens abandonnent presque aussi vite le portugais comme langue orale qu’ils adoptent le judaïsme normatif ; mais cet abandon ne touche pas la pratique écrite. Jusqu’au début du XIX siècle, le portugais, dans une variété tantôt innovante tantôt archaïsante, un peu hispanisée mais néanmoins proche de la norme, demeure langue écrite, administrative et religieuse des groupements juifs portugais, et ne manque pas de s’infiltrer, par voie de diglossie, dans les divers vernaculaires locaux désormais en usage. Aujourd’hui, on peut encore relever, chez les descendants de ces juifs s’identifiant comme « Portugais », un ensemble de mots survivant à l’état d’emprunts portugais cognats dans des variétés de langue aussi diverses que le français des juifs de Gascogne, le néerlandais des juifs d’Amsterdam, le patois toscan des juifs de Livourne ou le créole papiamento des juifs de Curaçao. Ce vocabulaire identitaire commun, relevant essentiellement des lexiques religieux, commercial ou culinaire, constitue le dernier reflet de la singularité linguistique des juifs portugais, singularité où l’être-portugais se substitue, en une confusion significative, à l’être-juif.


2017, February 22nd - Anabela Gonçalves (CLUL)

"Categorias funcionais e variação linguística: o caso da reestruturação"

O objetivo central desta comunicação é o de analisar, numa perspetiva comparada, dados do PE e do PB que forneçam evidência para o papel das categorias funcionais na variação linguística (Borer 1984; Pollock 1989; Chomsky 1995, 2001; Baker 2008). Centrar-nos-emos na estrutura de reestruturação, cuja presença (PE) ou ausência (PB) se tem atribuído, no quadro da gramática generativa, à arquitetura funcional do domínio infinitivo. Como tem sido mostrado na literatura, contrariamente ao PE (Gonçalves 1999) e ao italiano (Rizzi 1982), o PB (Cyrino 2010) bloqueia a subida de clítico (cl-cl; 1) e o movimento longo de objeto (LOM; 2) em contextos de infinitivo.

     (1) *O João não te quer ver.  (OKPE / *PB)

     (2) Não se podem antecipar resultados. (OKPE / *??PB)

Esta diferença entre PE e PB tem sido atribuída às propriedades de T encaixado (e.g., Cyrino 2010), que seria fi-defetivo em PE, mas apenas fi-incompleto em BP. Assim, em PB não se verificariam efeitos de reestruturação (T fi-incompleto é especificado quanto a [número], podendo sondar os clíticos e o DP objeto), ao contrário do que acontece em PE (sendo defetivo, T não se qualifica como sonda, o que obriga a cl-cl e LOM). Porém, tal análise não consegue explicar, entre outros aspetos, por que razão sujeitos nominativos em domínios de infinitivo não flexionado são ilegítimos em ambas as variedades, o que torna a diferença entre T defetivo e T incompleto pouco clara. Mostrar-se-á que a diferença entre PE e PB no que diz respeito à reestruturação, não residindo nas propriedades de T, decorre dos traços de Asp e v encaixados, núcleos funcionais que são sempre ativos em PB, podendo ser fi-defetivos em contextos não finitos do PE.

Referências. Ambar, M. et al. 2009. Tense domains in BP and EP – vP, CP and phases. In Aboh, van der Linden, Quer & Sleeman (eds.) Romance Languages and Linguistic Theory 2007. Amsterdam/Philadelphia: John Benjamins, 1‑24. Baker, M. 2008. The macroparameter in a microparametric world. In Biberauer (ed.) The Limits of Variation. Amsterdam/Philadelphia: John Benjamins, 351‑373. Borer, H. 1984. Parametric Syntax. Dordrecht: Foris. Chomsky, N. 1995. The Minimalist Program. Cambridge, MA: The MIT Press. Chomsky, N. 2001. Derivation by phase. In Kenstowicz (org.) Ken Hale: a Life in Language. Cambridge, MA: The MIT Press, 1-52. Cyrino, S. 2010. On Romance syntactic complex predicates: Why Brazilian Portuguese is different. In Estudos da Língua(gem) 8: 187-222. Gonçalves, A. 1999. Predicados Complexos Verbais em Contextos de Infinitivo não Preposicionado do Português Europeu. PhD dissertation, Univ. Lisboa. Pollock, J.-Y. 1989. Verb Movement, UG and the structure of IP. In Linguistic Inquiry 20: 365‑424. Rizzi, L. 1982. Issues in Italian Syntax. Dordrecht: Foris.


2017, January 30th - Pablo Faria (UNICAPM)

"Propriedades da anotação sintática e seu impacto na análise automática e na detecção de inconsistências"

As últimas décadas da linguística de corpus viu a construção de grandes corpora sintaticamente anotados, chamados também de "treebanks", alguns consistindo de milhões de palavras. Num tipo particular de treebank, baseado em Marcus et al. (1993), as sentenças são anotadas quanto a sua estrutura sintagmática e funções sintáticas de seus elementos. A construção de tais corpora é um processo custoso e consome muito tempo, razão pela qual tem sido utilizadas ferramentas automáticas em conjunto com procedimentos manuais, de modo a dar mais agilidade ao processo. Por ser um processo longo e complexo, é inevitável que ocorram inconsistências na anotação, causadas por diversos fatores, tais como discordância quanto à interpretação, orientações incompletas ou pouco claras, falta de experiência, entre outras (ver Blaheta, 2002). Tais inconsistências podem afetar negativamente a extração de informação do corpus e o treinamento de analisadores automáticos. Neste cenário, métodos automáticos de detecção (p.e., Dickinson & Meurers, 2003; Kulick et al., 2012; Faria, 2014, 2015) tem um importante papel, na medida em que permitem detectar parte das inconsistências de um corpus para que possam ser corrigidas. Além disso, o estudo de tais métodos lança luz sobre aspectos da anotação e seu impacto sobre tarefas automáticas, em particular, a análise sintática automática e a detecção de inconsistências. Certas escolhas quanto ao sistema de anotação podem dificultar o processamento automático, bem como outras podem facilitá-lo. Dois aspectos ressaltam, nesse sentido: a consistência interna do sistema, isto é, o grau de consistência que o sistema apresenta quanto à forma de anotação de construções similares (p.e., coordenações); e, ainda, a precisão com que a anotação distingue as classes de elementos e construções, de modo que o sistema seja o mais conciso possível e ainda apresente as informações desejadas. Nesta palestra, tratarei da tarefa de detecção de inconsistências, apresentando uma visão geral de suas particularidades e discutirei alguns casos ilustrativos, tanto de inconsistências por erro de anotadores, quanto por inconsistências do sistema de anotação. Além disso, apresentarei resultados de um estudo sobre análise automática feita sobre o Corpus Tycho Brahe (Galvez & Faria, 2010), em que foram avaliadas algumas mudanças no sistema de anotação quanto a seu impacto sobre a performance do analisador. Tais resultados contribuem para que sistemas de anotação sejam criados ou revisados para que contenham as informações linguísticas consideradas relevantes, mas ainda de modo a maximizar a eficiência em tarefas de processamento automático.


2016, December 6th  - Gael Vaamonde (CLUL)

"A carta privada como fonte de dados linguísticos"

Nesta presentación partimos do corpus que está a ser compilado no proxecto P. S. Post Scriptum, formado por cartas privadas escritas en español e portugués entre os séculos XVI e XIX. Moitas destas cartas foron escritas por falantes semi-alfabetizados, o que converte este recurso nunha fonte idónea para o estudo de fenómenos dialectais ou pertencentes a rexistros diafásicos baixos, variedades lingüísticas que non adoitan aparecer en corpus de corte diacrónico, nos que xeralmente predominan textos  de  carácter  literario ou notarial. A partir dos datos que ofrece este corpus, presentamos un estudo sobre dous aspectos de variación lingüística de amplo recorrido na gramática española e caracterizados ambos pola súa inestabilidade normativa: a variación pronominal dos clíticos de terceira persoa, que da lugar aos fenómenos coñecidos como "leísmo", "laísmo", e "loísmo"; e a variación nas subordinadas sustantivas encabezadas pola conxunción "que", que produce os chamados usos "queístas" e "dequeístas". Se ben ambos tipos de variación parecen estar xa constatados con anterioridade ao século XVI, o tramo temporal do noso corpus inclúe períodos de claro apoxeo no devenir histórico destas variacións gramaticais, ofrecéndonos a posibilidade de comprobar a súa difusión e alcance en territorio peninsular, observar a súa distribución xeográfica (relevante no caso da variación pronominal) e realizar unha análise estatística das diferentes hipóteses explicativas propostas na bibliografía.


2016, November 15th - João Dionísio (CLUL) and Elsa Pereira (CLUL)

"Edições e meios digitais"

O objectivo desta sessão é reflectir sobre o impacto do meio digital em projectos de edição. Começará por incidir em questões de escala de comunidades académicas e no efeito que o meio digital tem produzido sobre a percepção do valor intrínseco e do impacto destes trabalhos. De seguida, far-se-á uma descrição sumária de projectos portugueses de referência no âmbito da edição em meio digital. Depois, serão apresentados alguns cenários para o possível papel do CLUL, enquanto entidade de acolhimento e promoção de projectos desta natureza, seja no plano do suporte autónomo, seja como parceiro de colaborações estratégicas. A exposição terminará com alguns desafios colocados por um projecto actualmente em curso no grupo de Filologia do CLUL: a edição crítico-genética da poesia de Pedro Homem de Mello. Comparando abordagens pré-electrónicas com soluções digitais, será evidenciada a diferença de paradigma que subjaz a uma edição dinâmica em suporte electrónico, bem como as suas potencialidades e constrangimentos, para tratar os problemas textuais deste autor.


2016, October 26th - Paulo Martínez Lema (ILG)

"Toponímia galego-portuguesa"

O Inventário Toponímico da Galiza Medieval (ITGM) é um projeto de pesquisa que visa colocar ao dispor de investigadores e utentes em geral o imenso material toponímico contido na documentação medieva galego-portuguesa. É com esse intuito que, desde 2008, uma equipa de pessoas sob coordenação de Paulo Martínez Lema e Xavier Varela Barreiro (Universidade de Santiago de Compostela) está a processar os itens toponímicos de diversas coletâneas documentais, identificando quando possível os seus referentes extralinguísticos (quer atuais quer pretéritos), codificando as diferentes vias de evolução observáveis para essas formas e estabelecendo, enfim, as coordenadas geográfico-administrativas que permitem a sua localização (exata ou aproximada nalguns casos) no território galego-português.


2016, July 20th - Nuno Paulino (CLUL) and Sónia Frota (CLUL)

"Variação prosódica no português europeu: análise comparada de fenómenos de sândi vocálico"

In this talk, we examine three different types of hiatus resolution phenomena (Vowel Merger, Semivocalization and Back Vowel deletion) in eight different regions, in the North, Centre, South of Portugal and in Azores and Madeira. All regions discussed present several similarities with the standard variety of European Portuguese. We observed that all phenomena analysed are constrained by lexical stress. For Vowel Merger, when either of the vowels is stressed the phenomenon is blocked, unlike in the case of Semivocalization and Back Vowel deletion, where hiatus resolution applies if the second vowel is stressed. Besides lexical stress, we also observed that all phenomena are constrained by prosodic structure, namely they are bound by the Intonational Phrase. Also, differences across regions were found. In the North and Madeira there is a preference for Semivocalization, whereas in the South and Azores Back Vowel deletion is preferred. Furthermore, all these phenomena are constrained by additional prosodic conditions, such as the level of prominence level, as well as stress clash.


2016, June 15th - Deniz Zeyrek (METU/CLUL)

"Discourse - A challenging domain of research and the case of Turkish Discourse Bank"

In its widest sense, discourse is the level above the sentence in the spoken or the written modality, where somemone identifies himself as the speaker or the writer and has the intention of convincing the hearer or the reader. It has various forms ranging from daily conversations to elaborate oration and it covers all genres (Benveniste 1971). Due to its wide scope, different researchers have tackled discourse from a variety of perspectives. In this talk, I will deal with some of the issues surrounding discourse phenomena relevant to my ongoing work on discourse mechanisms. I will particularly concentrate on discourse relations (alternatively known as rhetorical relations) and how discourse is organized around discourse relations. Looking at the interaction of discourse relations, I will argue that discourse is structured, though in a much simpler way than sentences are. I will limit myself to written discourse and our experiences with Turkish Discourse Bank, which is a balanced resource of texts written in modern Turkish (400.000-words) containing annotations of discourse relations signalled by connectives (equivalents of but, and, however, etc.). Reference: Benveniste, Émile. 1971. Problems in General Linguistics. Coral Gables, Fa: University of Miami Press. (Translated by Mary Elizabeth Meek).


2016, May 3rd - Ian Smith (University of York)

"Dutch Influence in Sri Lanka Portuguese"

After ousting the Portuguese from Sri Lanka in 1658, the Dutch married into the established creole community and adopted Sri Lanka Portuguese as their home language, while Dutch was maintained as the language of administration and of the Dutch Church. In traditional historical linguistics terms, Dutch was both a substrate and adstrate of Sri Lanka Portuguese. Substantial Dutch lexical influence on Sri Lanka Portuguese has been recently documented (Avram 2013). This paper looks at two cases of Dutch morphosyntactic influence: inversion in interrogatives and the passive formation. Both of these structures were found in 16th C Portuguese but probably not used in early Sri Lanka Portuguese given their rarity in other creoles (Michaelis et al 2013). Both structures would have been re-introduced to the language during the course of its development. Evidence will be presented to show that Dutch served as a model for the reconstitution of both structures. Reference: Avram, Andrei A. 2013. The Dutch lexical contribution to three Asian Portuguese Creoles. Papia 23(1): 51-74.


2016, April 15th - Marisa Cruz (CLUL), Marc Swerts (Tilburg University), and Sónia Frota (CLUL)

"Percepção multimodal (auditiva e visual) de tipos frásicos entre variedades do Português"

In this talk, we observe the role of intonation and visual cues in the perception of statements and questions in two varieties of European Portuguese – the standard (SEP) and the insular variety of Azores (PtD) –, previously shown to convey sentence type contrasts by different uses of intonational means and/or facial gestures, namely eyebrow movements. Forty native speakers (twenty from each variety) were exposed to SEP and PtD stimuli in a perception task with three conditions (audio only, video only and audiovisual). The audiovisual condition includes congruent and incongruent (both natural and manipulated) stimuli. We concluded that both SEP and PtD participants rely more on intonation than on eyebrow movement to identify sentence types, even when exposed to incongruent audiovisual stimuli. In the absence of audio information, unexpectedly, participants do not interpret eyebrow raising as a question marker, not even when perceiving stimuli from their native variety. When exposed to non-native audiovisual stimuli, both SEP and PtD participants present longer reaction times (RTs), especially for incongruent stimuli. Finally, although we confirm the strength of intonation over visual cues, RTs in the audiovisual condition are significantly lower than in the audio condition, thus pointing to the relevance of visual cues for structural/linguistic marking.


2016, March 30th - Maciej Rybinski (Universidad de Malaga, visiting PhD student at CLUL)

"Corpus-based measures of lexical semantic relatedness for biomedical domain"

Approximating semantic relatedness is an important part of various text and knowledge processing tasks of crucial importance in the ever growing domain of biomedical informatics. The problem of most state-of-the-art methods for calculating semantic relatedness is their dependence on highly detailed, structured knowledge resources, which makes these methods poorly adaptable for many usage scenarios. Ideally, the problem could be solved by harnessing the knowledge from the scientific literature, which is why the distributional corpus-based measures seem to be an appealing option. In this presentation we will try to review some of the corpus-based approaches which provide the most promising results.


2016, March 1st - Paula Fikkert (Radboud University Nijmegen)

"Universal constraints on speech perception and production? Insights from early phonological acquisition"

Children learn to recognize words fast and reliably despite noise and variation in the input. They do this by extracting relevant phonetic features from the input and matching these onto phonological representations of words stored in the mind. How they learn to do this? Over the last four decades we have learned that infants are amazingly good at phonetic learning. However, our understanding of what happens when children construct their mental lexicon, which requires phonological learning, is as yet poor. Phonological learning involves the construction of invariant phonological representations of words that are both abstract enough to allow fast recognition and handle phonetic, phonological and morphological variation automatically, and detailed enough to keep lexical items distinct. Moreover, these same phonological representations are used to initiate articulation for production. In this talk I will argue that a comprehensive theory of phonological acquisition should take both perception and production into account, as well as learning and development. I will present a large set of production and perception data addressing the nature of place and manner of articulation as well as laryngeal features. For each set of features asymmetries in children's perception and production are attested. However, the asymmetries do not allow for one straightforward explanation, and are motivated differently for each set. I will discuss the consequences for a model of phonological acquisition. Most data will come from Dutch, but data from other languages, including German, English and Japanese, will be presented as well.


2016, February 19th - Paula Luegi (CLUL) and Márcio Leitão (UFPB/CLUL)

"Processamento de correferência intra-frásica em português"

Nesta apresentação relataremos resultados de estudos experimentais que analisam o processamento correferencial intra-frásico em Português. A discussão centra-se na comparação de propostas contraditórias no que diz respeito à intervenção dos Princípios A e B da TL (Teoria da Ligação, Chomsky, 1981) no processamento e resolução de cadeias referenciais. Por um lado têm sido apresentadas propostas que preveem o bloqueio de qualquer antecedente sintaticamente indisponível (Nicol e Swinney, 1989; Jaeger et al., 2015), por outro propostas que assumem uma violação dos princípios propostos pela TL, ainda que em fases distintas do processamento (Badecker e Straub, 2002; Sturt, 2003). Considerando que os efeitos relatados se podem ficar a dever à interferência de outras fontes de informação tais como a informação de género (usadas para forçar a ligação da forma referencial ao seu possível antecedente), apresentaremos, para além de uma síntese dos trabalhos já desenvolvidos em PB (Leitão e colaboradores), um estudo em curso em que contrastamos o processamento de condições com formas anafóricas com e sem marcação de género em PE (O Eduardo explicou que a Sandra no dia da aula se riscou (a si mesma) com o marcador do quadro.). Pretendemos com estes trabalhos avaliar o impacto e o momento da interferência das diferentes fontes de informação linguística no processamento de cadeias correferenciais e, por outro, confirmar se os princípios propostos pela TL têm uma realidade psicológica, operando como bloqueadores de possíveis agramaticalidades, e, consequentemente, de custos cognitivos acrescidos.


2016, January 25th - Cristiane Lazzarotto-Volcão (FLUL/Universidade Federal de Santa Catarina - Florianópolis)

"Aspectos da aquisição fonológica com desvios em crianças brasileiras e portuguesas"

Este trabalho pretende dar continuidade a estudos anteriores relativamente à análise de gramáticas de sons, em crianças com Desvio Fonológico (DF). Toma-se como modelo de análise o PAC – Modelo Padrão de Aquisição de Contraste (Lazzarotto-Volcão, 2009), construído a partir dos Princípios Fonológicos Baseados em Traços propostos por Clements (2009). Pretende-se analisar dados de crianças brasileiras e portuguesas, com diferentes níveis de gravidade DF, a fim de verificar se análises realizadas por meio do PAC revelam mais informações acerca do funcionamento da fonologia do aprendiz. De modo particular, como suas gramáticas organizam-se em função dos princípios fonológicos de Clements. 


2015, December 17th

Ares Llop (UAB / investigadora visitante CLUL)

"A expressão da polaridade (enfática) no contínuo linguístico transpirenaico"

Os trabalhos da dialetologia tradicional (atlas linguísticos, monografias dialetais, etc.) dos dialetos do catalão e de outras línguas pouco exploradas do contínuo linguístico Pirenaico próximo (Aragonês, Benasquês, Occitano Gascon e Occitano do Languedoc) mostram a riqueza do repertório de itens de polaridade (enfática) negativa procedentes de minimizadores nominais no contínuo transpirenaico (pascapgot(a),micamollapont, etc.). Nesta apresentação, irei mostrar que os dados e materiais da dialetologia tradicional e dos atlas linguísticos, além dos estudos de variação lexical, podem ser uma estratégia adequada para desenvolver uma abordagem teórica que explique a microssintaxe dessas marcas. Comentarei, especificamente, aspetos relativos às posições sintáticas de uma marca nos diferentes dialetos (em formas verbais simples e em complexos verbais) e aspetos relativos aos traços formais (e semânticos) que explicam o comportamento dos elementos negativos. 

Rosabel San Segundo Cachero (CLUL)

"'Non, nun sé ná ninguna cosa'. Marcadores negativos em asturiano"

As unidades que expressam negação em asturiano não têm recebido muita atenção, embora seja interessante o seu funcionamento, as diferenças entre as distintas unidades e a comparação com os marcadores portugueses, com os quais partilham muitas características. Os principais marcadores negativos do asturiano são non enun. Ainda que tradicionalmente tenham sido considerados variantes de uma mesma unidade, o seu comportamento sintático e pragmático prova que na realidade são dois marcadores distintos. Assim, enquanto nun expressa negação de tipo oracional, ou regular, e é sempre pré-verbal (equivalente a não pré-verbal),non indica sempre refutação do dito por outra pessoa, pelo que é um marcador de negação metalinguística, tal como, por exemplo, uma ova em português. É o marcador nun (em contraste com non) que pode aparecer com unidades pós-verbais que reforçam o conteúdo negativo, tais como os nomes minimizadores (plizcu, gota, chispu) e a forma reduzida do indefinido nada, na. Em alguns contextos (conforme o tipo de predicado verbal), na gera interpretações ambíguas entre uma leitura quantitativa ou negativa enfática (como o nada enfático do português), mas a possibilidade de ser interpolada em algumas perífrases verbais e a compatibilidade com objetos diretos negativos provam que tem perdido, ou está a perder, o seu conteúdo quantitativo, passando a funcionar como uma partícula negativa enfática, provavelmente devido a um processo de gramaticalização em parte semelhante ao que apresentam os minimizadores.