Artigo Completo - Open Access.

Idioma principal

Planejamento, compilação e organização de corpora

RESENDE, Simone Vieira ; MAVERICK, Rafael ;

Artigo Completo:

É inquestionável o papel insigne da Linguística de Corpus (LC) na investigação da linguagem. São muitas as investigações que fazem uso do ferramental teórico metodológico da LC, como os trabalhos de Berber Sardinha e São Bento Ferreira (2014); Berber Sardinha, Kauffmann e Mayer Acunzo (2014); Biber, Conrad and Reppen (2009); Biber (1993, 2006) que asseguram à LC uma prestabilidade quase infinda. O mesmo acontece quando se trata de investigações sobre corpus design em língua inglesa, com publicações antigas como Biber et al. (1998); Crowdy (1993, 1994); Hunston (2002); McCarthy (1998). Poucos são os trabalhos em língua portuguesa sobre o planejamento e a organização de corpora. Esse artigo busca colaborar para o preenchimento dessa lacuna por meio da descrição da organização de dois corpora: o CCC, Corpus Comparável de Curriculum Vitae e o CARTS, Corpus of American Reality TV Shows. Os dois têm o objetivo de servirem como fontes para pesquisas linguísticas, terminológicas e material para ensino de tradução e língua. Resultados mostram que a pesquisa teórica deve ser anterior ao planejamento e compilação do corpus. A base teórica dá ao pesquisador a possibilidade de selecionar e compilar com mais segurança e propriedade, podendo justificar suas escolhas e posteriormente enriquecer suas análises. Estudos dessa natureza podem contribuir de forma satisfatória no planejamento de futuros corpora.

Artigo Completo:

It is unquestionable the notable role which Corpus Linguistics plays in language investigation. There are many studies that make use of the theoretical and methodological tools of Corpus Linguistics, such as the works of Berber Sardinha and Ferreira (2014); Berber Sardinha, Kauffman and Mayer Acunzo (2014); Biber e Conrad (2009); Biber (2006) which assure to Corpus Linguistics an almost endless helpfulness. The same can be said when dealing with researches about Corpus Design in English; there are old publications such as Biber et al. (1998); Crowdy (1993, 1994); Hunston (2002); McCarthy (1998). There are very few works in Portuguese about corpora planning and the organization. This paper aims to fill this gap through the description of the organization of two corpora: CCC – Comparable Corpus of Curriculum Vitae – and CARTS - Corpus of American Reality TV Shows. Both corpora have the goal of being resources for linguistics and terminological researches, and teaching material to be used in translation and language teaching and learning. Investigations point out that the theoretical study must be before the corpus planning and organization. The theoretical base gives the researcher the possibility to select and compile with more safety and accuracy, being able to justify all choices, and posteriorly improve the analysis. Studies like this can contribute in a satisfactory way to the future corpora planning.

Palavras-chave: Linguística de Corpus, Planejamento de Corpus, Desenho de Corpus, CCC, CARTS,

Palavras-chave: Corpus Linguistics, Corpus Planning, Corpus Design, CCC, CARTS,

DOI: 10.5151/sosci-viiieblc-xiii-elc-06_artigo_03

Referências bibliográficas
  • [1] BERBER SARDINHA, Tony e Telma SÃO BENTO FERREIRA. Working with Portuguese Corpora. London: Bloomsbury Academic, 2014.
  • [2] BERBER SARDINHA, Tony. Linguística de Corpus. Sao Paulo: Manole, 2004.
  • [3] BERBER SARDINHA, Tony, Carlos KAUFFMAN e Cristina MAYER-ACUNZO. “A Multi-dimensional analysis of register variation in Brazilian Portuguese.” Corpora (2014): 239-271.
  • [4] BIBER, Douglas. “Methodological issues regarding corpus-based analyses of linguistic variation.” Literary and Lingusitc Computing. Vol. 5. 1990. 257-269.
  • [5] BIBER, Douglas. “Representativeness in corpus design.” Literacy and Linguistics Computing 8. 1993. 243-257.
  • [6] —. “Representatividade em Planejamento de Corpus.” Cadernos de Tradução JAN-JUN de 2012: 11-4
  • [7] —. Variation Across Speech and Writing. Cambridge: Cambridge University Press, 1988.
  • [8] BIBER, Douglas, Susan CONRAD e Randi REPPEN. Corpus Linguistics: Invstigating Language Structure and Use. 2nd . Cambridge: Cambridge University Press, 2000.
  • [9] BRUM-DE-PAULA, M. R. e G. S. ESPINAR. “Coleta, descrição e análise de produções orais.” Letras, Santa Maria 2002: 69-84.
  • [10] CROWDY, S. “Spoken Corpus Design.” 1993: 259-265.
  • [11] CROWDY, S. “Spoken Corpus Transcription.” Literary and Linguistic Computing 1994: 25-28.
  • [12] HUNSTON, Susan. Corpora in Applied Linguistics. Cambridge: Cambridge University Press, 2002.
  • [13] McCarthy, M.J. Spoken Language and Applied Linguistics. Cambridge: Cambridge University Press, 1998.
  • [14] McENERY, T. e A. W. Corpus Linguistics. Edinburgh: Edinburgh University Press, 2001.
  • [15] MILLER, Donald e Douglas BIBER. “Evaluating reliability in quantitative vocabulary studies: The influence of corpus design and composition.” International Journal of Corpus Linguistics 2015: 30-53.
  • [16] RAJAGOPALAN, Kanavillil. “Repensar o Papel da Lingüística Aplicada.” MOITA LOPES, Luiz Paulo. Por uma Lingüística Aplicada Indisciplinar. São Paulo: Parabola, 2006.
  • [17] RESENDE, Simone Vieira. “Normas tradutórias: o caso dos artigos científicos e suas condicionantes culturais.” Dissertação (Mestrado em Linguística). Rio de Janeiro: Universidade do Estado do Rio de Janeiro - UERJ, 2011.
  • [18] SINCLAIR, John. Corpus, Concordance, Collocation. Oxford: Oxford University Press, 1991.
  • [19] ZUPPARDO, Maria Carolina. “ A linguagem da aviação: um estudo de manuais aeronáuticos baseado na Análise Multidimensional.” Revista Virtual de Estudos da Linguagem ReVEL 11 (21) (2013).
Como citar:

RESENDE, Simone Vieira; MAVERICK, Rafael; "Planejamento, compilação e organização de corpora", p. 27-35 . In: Anais do EBRALC 2015 & ELC 2015 [=Blucher Social Science Proceedings, n.3 v.2]. São Paulo: Blucher, 2016.
ISSN 2359-2990, DOI 10.5151/sosci-viiieblc-xiii-elc-06_artigo_03

últimos 30 dias | último ano | desde a publicação


downloads


visualizações


indexações