Skip to content

Latest commit

 

History

History
184 lines (121 loc) · 16.8 KB

Documentation.md

File metadata and controls

184 lines (121 loc) · 16.8 KB
title output
Documentation
html_document

Prefácio

O Dicionário Histórico de Termos da Biologia é um dicionário eletrônico que visa reunir informações histórico-etimológicas sobre os termos da Biologia em língua portuguesa.

O projeto é coordenado pelo Prof. Dr. Bruno Oliveira Maroneze e conta com a participação de estudantes de graduação e pós-graduação da Universidade Federal da Grande Dourados (UFGD) e da Universidade Federal de Mato Grosso do Sul (UFMS). É um projeto filiado ao Núcleo de Apoio à Pesquisa em Etimologia e História da Língua Portuguesa, coordenado pela Prof.ª Dr.ª Vanessa Martins do Monte.

O desenvolvimento inicial deste dicionário foi possível graças ao estágio de pós-doutoramento desenvolvido pelo coordenador do projeto junto à Universidade de Coimbra (Portugal), sob a supervisão da Profa. Dra. Graça Rio-Torto.

Atualmente, o projeto conta com o financiamento do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq).

Objetivos

O objetivo geral deste projeto é compilar uma obra de referência, para consulta online, que descreva o léxico científico da língua portuguesa, na área das ciências biológicas, através da história.

Seus objetivos específicos são:

  • Compilar um córpus histórico-diacrônico com textos sobre as ciências biológicas (cf. "Córpus");
  • Identificar as ocorrências dos termos em épocas anteriores;
  • Descrever as estruturas morfológicas (sufixos, prefixos, radicais eruditos etc.) empregadas em cada época na formação de termos;
  • Descrever a etimologia dos termos e as mudanças de forma e significado pelas quais passaram ao longo do tempo.

Córpus

O Dicionário Histórico de Termos da Biologia é inteiramente baseado num córpus formado por textos científicos publicados em língua portuguesa. Esse córpus (assim como o próprio dicionário) está em contínua atualização (cf. "Política de disponibilização dos dados") e disponível integralmente (no repositório GitHub), por ser constituído apenas por textos em domínio público.

Optou-se por, inicialmente, incluir no córpus apenas textos do século XVIII (por ser este um momento histórico altamente significativo no desenvolvimento da Ciência, especialmente em língua portuguesa); posteriormente, pretende-se incluir outros períodos históricos (tanto anteriores quanto posteriores).

Os textos que compõem o córpus (cf. "Textos que compõem o córpus", abaixo) estão disponibilizados em formato .xml (cf. "Política de disponibilização dos dados"), com as etiquetas descritas abaixo; o script que extrai as informações dos textos (cf. "Estrutura computacional") também disponível no repositório GitHub.

Textos que compõem o córpus:

Os textos que integram o córpus podem ser encontrados nos links abaixo. O córpus transcrito em formato .xml está disponível no repositório GitHub (cf. "Política de disponibilização dos dados").

Etiquetas XML empregadas no córpus

Os textos que compõem o córpus são etiquetados com o emprego das seguintes etiquetas XML (inspiradas no padrão Text Encoding Initiative):

  • text - É o nó-raiz de cada texto; contém os metadados do texto, indicados pelos atributos "author" (autor), "title" (título) e "date" (data);
  • front - Elemento obrigatório que contém o texto da folha de rosto de cada obra;
  • body - Elemento obrigatório que contém o texto principal de cada obra;
  • back - Elemento obrigatório que contém os textos que eventualmente se encontram ao final de cada obra, após o texto principal, como índices e tabelas;
  • title - Etiqueta que delimita títulos e subtítulos;
  • p - Etiqueta que delimita parágrafos;
  • s - Etiqueta que delimita sentenças ou contextos maiores, entendidos como mínimos para a exemplificação do emprego de algum termo;
  • term - Etiqueta que marca os termos que integram a nomenclatura do dicionário; pode vir acompanhada dos atributos lemma (lema), orth (forma ortográfica atualizada), msd (descrição morfossintática, como "plural" ou "feminino") e senseNumber (número da acepção);
  • w - Etiqueta empregada para o registro de informações (inseridas como atributos) sobre palavras diversas do texto, mas que não são termos e não constam da nomenclatura do dicionário;
  • note - Etiqueta que delimita notas de rodapé ou de margem de página;
  • foreign - Indica que a palavra ou o trecho delimitado está numa língua diferente da do português; o atributo lang indica que língua é essa;
  • pb - Elemento vazio que indica quebra de página da obra; o número da página que se inicia a partir desta marca é indicada no atributo n;
  • obs - Elemento vazio empregado para a inserção de observações diversas no texto, como comentários sobre a transcrição.

Critérios lexicográficos

Descrevem-se aqui os critérios adotados na seleção das entradas e na elaboração dos verbetes.

Nomenclatura

Prevê-se que o Dicionário conterá a totalidade dos termos presentes no córpus analisado, ou seja, todos os substantivos, adjetivos e verbos (inclusive os formados por mais de uma palavra) que designam conceitos científicos relacionados às ciências biológicas e que ocorram nos textos que compõem o córpus. Por ser uma obra de natureza histórica, considera-se como referência a ciência da época dos textos analisados; ou seja, uma unidade lexical é considerada um termo se ela designava um conceito científico no período de circulação da obra, independentemente de esse conceito ser aceito ou não pela ciência do século XXI.

Como a totalidade dos termos é um objetivo ideal, a ser atingido no longo prazo, optou-se por disponibilizar os verbetes à medida que são incluídos (cf. "Política de disponibilização dos dados").

Informações presentes nos verbetes

Cada entrada do dicionário contém:

a) Classe gramatical; b) Definições; c) Contextos de ocorrência; d) Formas variantes gráficas; e) Informações histórico-etimológicas.

No caso dos termos polissêmicos, as definições estão numeradas e os contextos de ocorrência estão agrupados juntamente com a definição correspondente.

O campo das variantes gráficas inclui as formas variantes do termo encontradas no córpus.

O campo das informações histórico-etimológicas traz uma discussão a respeito da etimologia do termo, com hipóteses a respeito de sua origem, as primeiras atestações na língua portuguesa, eventuais mudanças de significado pelas quais o termo passou ao longo da história e outras informações que os autores julguem relevantes para uma maior compreensão do termo.

Bibliografia consultada

Estrutura computacional

O Dicionário apresenta uma interface computacional escrita em linguagem R e que funciona por meio da biblioteca R Shiny, que permite a criação de código HTML a partir da interação com o usuário. Dessa forma, a com a seleção de uma entrada da lista à esquerda por parte do usuário, apresentam-se os dados referentes à entrada na parte direita da tela.

Os dados que "alimentam" essa interface, bem como o código-fonte em linguagem R, estão disponíveis para download no repositório GitHub (cf. "Política de disponibilização dos dados").

Política de disponibilização dos dados

O Dicionário encontra-se em permanente atualização. Para dar mais agilidade à divulgação, optou-se por disponibilizar os verbetes à medida que vão sendo elaborados.

Em cada verbete, registram-se a data da inserção e a data da última atualização. Para facilitar aos pesquisadores que desejam referir-se aos dados, inclui-se também uma proposta de como citar o verbete.

Os dados e o código-fonte encontram-se disponíveis para download no repositório GitHub neste link.

Publicações

Incluem-se aqui as publicações dos membros da equipe relacionadas ao Dicionário Histórico de Termos da Biologia.

Equipe

  • Bruno Oliveira Maroneze (Professor Associado, Universidade Federal da Grande Dourados) - coordenação do projeto - desde 2017
  • Sammara Valim Luz (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus, pesquisa etimológica - desde 2024
  • Marimeire Almeida Barros (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus, pesquisa etimológica - desde 2024
  • Ana Cristina Gouvêa Lopes (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus, pesquisa etimológica - desde 2024
  • Vitória Fernandes Pereira (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus, pesquisa etimológica - desde 2024
  • Sammara Valim Luz (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus, pesquisa etimológica - desde 2024
  • Rodrigo Daniel Castiglioni Aguero (Técnico de Informática, Universidade Federal da Grande Dourados) - desenho do website - desde 2023
  • Guilherme Ferreira Mendes Vieira (estudante de graduação, Universidade Federal da Grande Dourados) - desenho do website, programação do código e automação de tarefas - desde 2024
  • Fabio Gustavo Mercado Urquieta (estudante de graduação, Universidade Federal da Grande Dourados) - programação do código e automação de tarefas - 2023-2024
  • Matheus Stein Casarin (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - desde 2023
  • Ana Carolina Menegassi Rocha (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - desde 2023
  • Luana Silva Borges (estudante de pós-graduação, Universidade Federal de Mato Grosso do Sul) - preparação do córpus, compilação dos verbetes - 2022-2024
  • Kamila da Silva Barbosa (estudante de pós-graduação, Universidade Federal de Mato Grosso do Sul) - preparação do córpus, compilação dos verbetes - desde 2021
  • Fabiani de Amorim Gonçalves (estudante de pós-graduação, Universidade Federal da Grande Dourados) - preparação do córpus, compilação dos verbetes - 2022-2023
  • Dannielly Victória Rodrigues da Silva (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2023-2024
  • Adriane Maria de Oliveira Queiroz (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2022-2023
  • Raíssa Silveira Buss (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2022-2023
  • Rafaela Lima Domingos (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2021-2022
  • Letícia Tranquile da Silva (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus, compilação dos verbetes - 2020-2022
  • Fabiana Ferreira de Melo da Silva Sales (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2020-2021
  • Bruno Leonardo Campanholi Gilbert (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2020
  • Daniela Martim do Nascimento (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2020
  • Cinddy Daniela Lima Tragueta (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2020
  • Amarildo Braga de Oliveira (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2017-2018
  • Florival Dourado dos Reis Neto (estudante de graduação, Universidade Federal da Grande Dourados) - preparação do córpus - 2017

Agradecimentos

A compilação do córpus foi (e ainda é) possível graças à colaboração de estudantes de graduação da Universidade Federal da Grande Dourados, alguns dos quais receberam bolsas de Iniciação Científica da PROPP-UFGD e do CNPq.

O projeto atualmente conta com o valiosíssimo financiamento do CNPq por meio do Edital Pró-Humanidades 2022, sob a forma de bolsas de Iniciação Científica e de Apoio Técnico.

A redação dos primeiros verbetes e a criação da parte computacional do dicionário foram possíveis graças ao estágio de pós-doutoramento desenvolvido pelo coordenador do projeto junto à Universidade de Coimbra (Portugal), sob a supervisão da Profa. Dra. Graça Rio-Torto.

A hospedagem do dicionário no servidor da FFLCH-USP foi possível graças à importante parceria com o NEHiLP e ao valioso auxílio do técnico Thiago Gomes Veríssimo.

Agradecemos a Ligeia Lugli (University of London) pelas valiosas orientações a respeito de como implementar um dicionário eletrônico online.

Agradecemos a Gisele Cristina da Conceição (Universidade do Porto) pelas valiosas sugestões e opiniões.

Contato

Para comentários, perguntas e sugestões, contate [email protected]