Equipa:

Elena Lombardo

Filipe Alves Moreira

 

Descrição:

O projecto Sebástica manuscrita: catálogo e edições digitais dos textos historiográficos portugueses dos sécs. XVI e XVII tem como objectivo final a construção de um website no qual se reúnam e sistematizem dados sobre as tradições manuscritas dos textos historiográficos sobre D. Sebastião, escritos em português por contemporâneos do rei, acompanhados por edições digitais linguisticamente anotadas dos testemunhos.

O levantamento de dados dará origem a um catálogo digital, em formato gráfico. As edições servirão como fonte para estudos de história da língua, sendo igualmente úteis para historiadores e outros investigadores da cultura portuguesa. Considerar-se-ão os manuscritos incluídos na mencionada tipologia quer eles se encontrem em bibliotecas nacionais ou estrangeiras.

Com este projecto pretende-se preencher uma lacuna relativa ao estudo dos textos historiográficos dos sécs. XVI e XVII dedicados a D. Sebastião. Estes textos têm sido considerados apenas como fontes para o estudo de outros objectos e não como um objecto em si mesmos, passível de análise literária, historiográfica ou linguística. Assim, ferramentas basilares como uma lista de textos e das suas respectivas edições e/ou testemunhos continua em falta, vários textos nunca foram publicados e quase todos os publicados não o foram segundo critérios modernos de Crítica Textual.

Presentemente, disponibiliza-se o primeiro catálogo de manuscritos identificados em fundos portugueses: em Lisboa, na Biblioteca Nacional, na Biblioteca da Ajuda, na Biblioteca da Academia das Ciências de Lisboa e no Arquivo Nacionaol da Torre do Tombo; no Porto, na Biblioteca Municipal; em Évora, na Biblioteca Pública; em COimbra, na Biblioteca da Universidade e, em Viseu, na Biblioteca Municipal. Este catálogo será actualizado periodicamente, de acordo com o progresso da investigação.

 

Apresentação

Catálogo

NLI-PT é o primeiro conjunto de dados português compilado para a NLI (Native Language Identification), a tarefa de identificar a língua nativa do autor de um texto escrito numa segunda língua.

O conjunto de dados inclui 1.868 ensaios escritos por alunos de Português Europeu, falantes nativos das seguintes L1s: Chinês, Inglês, Espanhol, Alemão, Russo, Francês, Japonês, Italiano, Holandês, Tétum, Árabe, Polaco, Coreano, Romeno e Sueco . Coletamos dados de três fontes diferentes: dois corpora de aprendizagem, COPLE2 e PEAPL2 e o conjunto de dados do projeto "Recolha de dados de aprendizagem de língua inglesa estrangeira". Com o objetivo de unificar os dados dos alunos reunidos a partir dessas várias fontes, aplicamos uma metodologia que foi usada anteriormente para a compilação de corpora com diferentes idiomas (Tan et al., 2014).

NLI-PT inclui o texto original do aluno e quatro tipos diferentes de anotação: POS, POS detalhado, análise de constituintes e análise de dependências. Utilizamos o LX Parser para o POS simples e o módulo morfológico Português de Freeling para POS detalhado. No que diz respeito às anotações sintáticas, usamos o LX Parser para análise de constituentes e o kit de ferramentas DepPattern para dependências.

NLI-PT pode ser usado não apenas na NLI, mas também em pesquisas sobre vários tópicos no campo de Aquisição de Segunda Língua e PLN educacional.

O recurso é descrito na seguinte publicação:

del Río, I., Zampieri, M. & Malmasi, S. 2018. A Portuguese Native Language Identification Dataset. The 13th Workshop on Innovative Use of NLP for Building Educational Applications, NAACL 2018. 05th June. New Orleans, USA. [pdf]

E pode ser descarregado aqui.

Se tiver alguma dúvida, consulte com a Dra. Iria del Río.

 

 

O instrumento com o título Tarefas de Consciência Fonológica para crianças Portuguesas do 1º Ciclo do Ensino Básico foi construído com o objetivo de testar todos os níveis de consciência fonológica (segmental (ou fonémica), intrassilábica, silábica e de palavra) em crianças portuguesas monolingues a frequentarem o 1º Ciclo do Ensino Básico, em 3 tarefas de avaliação da consciência linguística: segmentação, identificação e omissão.
As folhas de registo, as respetivas imagens e ficheiros de som aqui apresentados foram construídos no âmbito da tese de doutoramento de Afonso (2016), intitulada “Complexidade Prosódica – Tarefas de Consciência Fonológica em Crianças do 1º Ciclo do Ensino Básico”, submetida à Universidade de Lisboa, Faculdade de Letras, sob orientação de Maria João Freitas (Universidade de Lisboa, Faculdade de Letras, Centro de Linguística).
As provas foram aplicadas a um grupo de crianças portuguesas monolingues do 1º e do 3º ano de escolaridade, sem historial de perturbação de linguagem, cognitiva ou motora que prejudicasse a realização das tarefas, em três momentos diferentes. Para a avaliação das unidades sílabas, constituintes silábicos e segmentos as crianças ouviram cada estímulo e simultaneamente visualizaram a imagem correspondente a esse estímulo auditivo, realizando a tarefa de seguida. Para a avaliação da unidade palavra, apenas foi utilizado estímulo auditivo, sendo que cada criança ouviu cada frase duas vezes antes de realizar a tarefa. Foram realizados itens de treino para todas as tarefas e foram registadas todas as respostas dadas.

Para descrição dos resultados obtidos e detalhe metodológico sobre a aplicação do instrumento, consulte-se Afonso (2016), tese de doutoramento acima referida. Os estímulos visuais foram realizados especificamente para o trabalho em questão pela designer gráfica Ana Afonso.

Para a utilização do instrumento que aqui se disponibiliza devem ser solicitadas as imagens e os ficheiros áudio a Catarina Afonso (Este endereço de email está protegido contra piratas. Necessita ativar o JavaScript para o visualizar.).

 

Documentos:

Folha de registo

Imagens (Parte 1)

Imagens (Parte 2)

 

Registo das TCFC:

Este trabalho está licenciado com uma Licença https://creativecommons.org/licenses/by-nc-nd/4.0/.

Foi desenvolvido no Centro de Linguística da Universidade de Lisboa, no âmbito do projeto PEst-OE/LIN/UI0214/2011, financiado pela Fundação para a Ciência e a Tecnologia.

 

 

O instrumento que aqui se apresenta foi construído no âmbito da tese de mestrado de Santos (2013), intitulada Aquisição de grupos consonânticos e seu impacto nos desempenhos escritos no 1.º Ciclo do Ensino Básico, apresentada à Faculdade de Letras da Universidade de Lisboa, sob orientação da Professora Doutora Maria João Freitas (Universidade de Lisboa, Faculdade de Letras, Centro de Linguística) e do Professor Doutor João Veloso (Universidade do Porto, Faculdade de Letras, Centro de Linguística).

Os principais objetivos desse trabalho foram a análise e a descrição das diferenças entre a aquisição de Ataques ramificados e a aquisição de sequências consonânticas problemáticas, no Português Europeu, bem como o impacto que este processo tem nos desempenhos escritos, no 1.º Ciclo do Ensino Básico. Para o efeito, recorreu-se à observação de produções orais e escritas de palavras isoladas que continham sequências consonânticas de ambos os tipos, de crianças dos 1.º e 4.º anos de escolaridade através de duas tarefas: uma de nomeação (produção oral) e uma de escrita (produção escrita).

A tarefa de nomeação foi construída com o objetivo de a criança verbalizar o que via sob a forma de imagem para que se apurasse o modo como produzia as estruturas estudadas; por sua vez, a tarefa de escrita foi construída com o intuito de registar a forma como a criança grafava essas mesmas estruturas. A ordem de apresentação das tarefas foi a seguinte: tarefa de nomeação e tarefa de produção escrita. Ambas as respostas às tarefas foram anotadas em folhas de registo. Foi, ainda, elaborado um protocolo de aplicação da prova para que as tarefas pudessem ser aplicadas de igual modo a todas as crianças. Nesse constava a definição básica de cada estímulo, a usar aquando da tarefa de nomeação, com o objetivo de auxiliar as crianças caso estas não conseguissem nomear o estímulo corretamente.

O instrumento inclui, então, 46 itens lexicais, representados por 46 imagens, protocolo de aplicação das duas tarefas (de nomeação e de escrita) e folhas de registo para cada ano escolar. Dos 46 estímulos visuais, 24 foram extraídos de Afonso (2008) e utilizados com a autorização da autora e os restantes 22 foram realizados especialmente para esta investigação por um designer gráfico da DL – Publicidade, Lda ou adaptados de imagens disponíveis em manuais escolares das diferentes áreas de conhecimento de cada ano escolar. Uma vez que se utilizaram várias figuras já empregadas noutra investigação, houve a necessidade de controlar a semelhança entre os traços visuais dos vários exemplares, bem como de adotar os mesmos critérios, de forma a conferir homogeneidade aos estímulos.

Para uma descrição mais detalhada da metodologia utilizada neste estudo, bem como uma descrição e discussão dos dados mais amplas, veja-se Santos (2013).

 

Documentos:

Protocolo de Aplicação das Tarefas de Nomeação

Folha de Registo das Tarefas de Nomeação e de Escrita

Tarefa de Escrita do 1º Ano de Escolaridade

Tarefa de Escrita do 4º Ano de Escolaridade

Estímulos Visuais

 

Registo das PORESC:

Este trabalho está licenciado com uma Licença Creative Commons - AtribuiçãoNãoComercial-SemDerivações 4.0 Internacional.

Código da Licença Creative Commons: Licença
Creative Commons

 

 

 

O Crosslinguistic Child Phonology Project-Português Europeu (CLCP-PE) foi desenvolvido no âmbito do projeto internacional Crosslinguistic Child Phonology Project (CLCP), cujo objetivo central é o estudo comparativo do desenvolvimento fonológico em crianças com desenvolvimento típico e atípico em diversas línguas do mundo. O projeto encontra-se sedeado na University of British Columbia, Vancouver, Canadá, sendo coordenado por May Bernhardt e Joe Stemberger. A coordenação da equipa portuguesa está a cargo de Maria João Freitas, tendo sido efetuado um protocolo de colaboração entre a UBC e o CLUL. No âmbito deste projeto, têm sido desenvolvidos instrumentos de avaliação do desenvolvimento fonológico infantil numa perspetiva de análise fonológica não-linear (até ao momento, foram contempladas no projeto 16 línguas; http://phonodevelopment.sites.olt.ubc.ca/, como é o caso do CLCP-PE.

O CLCP-PE foi desenvolvido por Ramalho, Freitas e Almeida (2014) (registo IGAC nº 67/2914) e assume-se como um instrumento de avaliação fonológica não-linear em que foram controladas as variáveis fonológicas: i) inventário segmental (todas as classes naturais); ii) constituência silábica (Ataque simples, Ataque ramificado e Coda); iii) acento de palavra (contraste posição tónica /átona); iv) posição na palavra (inicial, medial, final); v) extensão de palavra (medida em número de sílabas). A sua validação foi realizada no âmbito da tese de doutoramento de uma das autoras (Ramalho, 2017), através da análise dos dados resultantes da aplicação do instrumento a 87 crianças com desenvolvimento típico, falantes monolingues de português europeu, naturais da Zona da Grande Lisboa, e a 3 crianças com alterações fonológicas.

O instrumento resultante do processo de validação (CLCP-PE 1.2), que demonstrou fiabilidade e validade (de conteúdo e de constructo),  inclui 150 estímulos lexicais, distribuídos por 42 imagens, instruções de aplicação e uma folha de registo. As 42 imagens e as instruções de aplicação podem ser usadas em suporte papel ou apresentadas em suporte digital (pc ou tablet) e a folha de registo pode ser usada como folha de cálculo ou como suporte tradicional manual de registo das transcrições fonéticas.

As variáveis fonológicas testadas mostraram-se, globalmente, relevantes e produtivas, tendo sido identificadas como estruturas mais problemáticas: i) as fricativas (estabilização do traço [anterior]); ii) a distribuição prosódica das líquidas; iii) a constituência silábica (Ataque ramificado e Coda); iv) o acento de palavra (posição átona nos grupos etários mais baixos); v) a posição na palavra (Coda medial); vi) a extensão de palavra (palavras polissilábicas).

 

Documentos:

Protocolo da Aplicação

Folha de Registo

Imagens (Parte 1)

Imagens (Parte 2)

 

Como citar o CLCP-PE:

Ramalho, A.M. , Freitas, M.J., Almeida, L., (2017). CLCP-PE: Crosslinguistic Child Phonology Project - Português Europeu. IGAC 67/2014

Ramalho, A.M. (2017). Avaliação Fonológica na Criança: tradução e adaptação de um instrumeno de avaliação fonológica interlinguístico. Tese de Doutoramento. Universidade de Évora.