Ergebnisse für *

Es wurden 4 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 4 von 4.

Sortieren

  1. Narrative des Wandels
    Transformationsprozesse nach 1989 in den mittel- und osteuropäischen Literaturen
    Autor*in:
    Erschienen: 2022
    Verlag:  V&R Unipress, Göttingen

  2. SCyDia – OCR for Serbian Cyrillic with diacritics
    Erschienen: 2022
    Verlag:  Mannheim : IDS-Verlag ; Mannheim : Leibniz-Institut für Deutsche Sprache (IDS)

    In the currently ongoing process of retro-digitization of Serbian dialectal dictionaries, the biggest obstacle is the lack of machine readable versions of paper editions. Therefore, one essential step is needed before venturing into the... mehr

     

    In the currently ongoing process of retro-digitization of Serbian dialectal dictionaries, the biggest obstacle is the lack of machine readable versions of paper editions. Therefore, one essential step is needed before venturing into the dictionary-making process in the digital environment – OCRing the pages with the highest possible accuracy. Successful retro-digitization of Serbian dialectal dictionaries, currently in progress, has shown a dire need for one basic yet necessary step, lacking until now – OCRing the pages with the highest possible accuracy. OCR processing is not a new technology, as many opensource and commercial software solutions can reliably convert scanned images of paper documents into digital documents. Available software solutions are usually efficient enough to process scanned contracts, invoices, financial statements, newspapers, and books. In cases where it is necessary to process documents that contain accented text and precisely extract each character with diacritics, such software solutions are not efficient enough. This paper presents the OCR software called “SCyDia”, developed to overcome this issue. We demonstrate the organizational structure of the OCR software “SCyDia” and the first results. The “SCyDia” is a web-based software solution that relies on the open-source software “Tesseract” in the background. “SCyDia” also contains a module for semi-automatic text correction. We have already processed over 15,000 pages, 13 dialectal dictionaries, and five dialectal monographs. At this point in our project, we have analyzed the accuracy of the “SCyDia” by processing 13 dialectal dictionaries. The results were analyzed manually by an expert who examined a number of randomly selected pages from each dictionary. The preliminary results show great promise, spanning from 97.19% to 99.87%.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: BASE Fachausschnitt Germanistik
    Sprache: Englisch
    Medientyp: Aufsatz aus einem Sammelband
    Format: Online
    DDC Klassifikation: Englisch, Altenglisch (420)
    Schlagworte: Serbisch; Digitalisierung; Dialektologie; Elektronisches Wörterbuch; OCR-Verarbeitung; Kyrillische Schrift <Druckschrift>
    Lizenz:

    creativecommons.org/licenses/by-sa/4.0/deed.de ; info:eu-repo/semantics/openAccess

  3. Zum Wortgut deutscher Herkunft im plurizentrischen Serbokroatischen nach der Auflösung Jugoslawiens
    Erschienen: 2022
    Verlag:  GRIN Verlag, München

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783346700537
    Weitere Identifier:
    9783346700537
    Auflage/Ausgabe: 1. Auflage
    Schlagworte: Kroatisch; Serbisch; Sprachkontakt; Serbokroatisch; Bosnisch; Deutsch
    Weitere Schlagworte: (Produktform)Paperback / softback; (BISAC Subject Heading)LIT004170: LITERARY CRITICISM / European / German; Germanismen;Kontaktlinguistik;Kontrastive Lexikologie;Lehnwortschatz;Serbokroatisch; (VLB-WN)1563: Deutsche Sprachwissenschaft, Deutschsprachige Literaturwissenschaft
    Umfang: Online-Ressource, 64 Seiten
    Bemerkung(en):

    Vom Verlag als Druckwerk on demand und/oder als E-Book angeboten

  4. Zum Wortgut deutscher Herkunft im plurizentrischen Serbokroatischen nach der Auflösung Jugoslawiens
    Erschienen: 2022
    Verlag:  GRIN Verlag, München

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Quelle: DNB Sachgruppe Deutsche Sprache und Literatur
    Sprache: Deutsch
    Medientyp: Ebook
    Format: Online
    ISBN: 9783346700520
    Weitere Identifier:
    9783346700520
    Auflage/Ausgabe: 1. Auflage, digitale Originalausgabe
    Schlagworte: Kroatisch; Serbokroatisch; Sprachkontakt; Deutsch; Serbisch
    Weitere Schlagworte: (Produktform)Electronic book text; (BISAC Subject Heading)LIT004170: LITERARY CRITICISM / European / German; wortgut;herkunft;serbokroatischen;auflösung;jugoslawiens; (VLB-WN)9563: Deutsche Sprachwissenschaft, Deutschsprachige Literaturwissenschaft
    Umfang: Online-Ressource, 61 Seiten
    Bemerkung(en):

    Vom Verlag als Druckwerk on demand und/oder als E-Book angeboten