Zeig Dich: Dataset para Reconhecimento de Tipos de Fonte de Jornais Históricos Teuto-Brasileiros

Lucas ulzbach; Thomas Bianchi Todt; Thalita Maria do Nascimento; Eduardo Todt; Pedro Domingos Tricossi dos Santos

doi:10.14210/cotb.v14.p447-449

Pesquisa

Resumo

Zeig Dich: Dataset para Reconhecimento de Tipos de Fonte de Jornais Históricos Teuto-Brasileiros

10.14210/cotb.v14.p447-449

Data de publicação: 03/05/2023

ABSTRACT
This paper addresses the challenge of typeface recognition, within
the broader scope of optical character recognition of historical
German-Brazilian periodicals. A dataset of words containing annotations
of font types and transcriptions for training neural networks
for typeface and text recognition is presented. By enabling wordlevel
typeface and text recognition, the authors plan to later develop
techniques for high-precision OCR of historical prints typeset in
heterogeneous font styles. The value of this dataset is proven by the
excellent results obtained by artificial neural networks trained on it.
The authors also recognize that even better results can be obtained
by exploring new ways of organizing the dataset prior to training,
and that the results can also be improved through modifications in
the architecture of the nets used.

Anais do Computer on the Beach

O Computer on the Beach é um evento técnico-científico que visa reunir profissionais, pesquisadores e acadêmicos da área de Computação, a fim de discutir as tendências de pesquisa e mercado da computação em suas mais diversas áreas.

Access journal

Autor(es)

Lucas ulzbach

Universidade Federal do Paraná Curitiba, Paraná, Brasil
Thomas Bianchi Todt

Universidade Federal do Paraná Curitiba, Paraná, Brasil
Thalita Maria do Nascimento

Universidade Federal do Paraná Curitiba, Paraná, Brasil
Eduardo Todt

Universidade Federal do Paraná Curitiba, Paraná, Brasil
Pedro Domingos Tricossi dos Santos

Universidade Federal do Paraná Curitiba, Paraná, Brasil

PDF

Edição
v. 14 (2023)

Seção
Resumos Estendidos

Plugins

Downloads

Não há dados estatísticos.

Portal de Periódicos

Anais do Computer on the Beach

Portal de Periódicos

Pesquisa

Zeig Dich: Dataset para Reconhecimento de Tipos de Fonte de Jornais Históricos Teuto-Brasileiros

Anais do Computer on the Beach