1) scielo_scraper: permite definir uma das 8 áreas de conhecimento e raspar os arquivos PDF ou apenas os arquivos XML;
1/4
2) scielo_ISSN: permite definir uma lista de revistas que serão raspadas através do ISSN. Assim como na ferramenta anterior, é possível definir o tipo de raspagem (PDF ou XML);
2/4
3) scielo_xml_to_csv: seleciona, organiza e salva as informações do dataset de arquivos XML das revistas previamente baixadas a partir das ferramentas anteriores. A ferramenta captura todos os metadados disponíveis dos artigos incluindo as referências bibliográficas
3/4
A base de XMLs - e também os CSVs - de todos os artigos das 91 revistas da área de Ciências Humanas está disponível pra download. Somando mais de 72 mil artigos!
Quais ferramentas digitais para pesquisa, escrita e ensino vocês usam?
O LABHDUFBA se interessa pelos impactos teóricos, metodológicos e epistemológicos dessas ferramentas para as humanidades.
No dia das humanidades digitais 2020 #dayofdh2020 listamos algumas: (segue o fio)
[1] Gerenciar referências bibliográficas: O @zotero é um software gerenciador de referências em software livre e de código aberto para gerenciar dados bibliográficos e materiais relacionados a pesquisa.
[2] OCR – reconhecimento óptico de caracteres: Precisa reconhecer os caracteres de pdfs e jornais impressos digitalizados? Use o #gImageReader O gImageReader é um app front-end para o poderoso #tesseract. github.com/manisandro/gIm…