Filtern nach
Letzte Suchanfragen

Ergebnisse für *

Es wurden 2 Ergebnisse gefunden.

Zeige Ergebnisse 1 bis 2 von 2.

Sortieren

  1. Exploring Newspaper Language
    Using the Web to Create and Investigate a Large Corpus of Modern Norwegian
    Erschienen: 2012; ©2012.
    Verlag:  John Benjamins Publishing Company, Philadelphia

    Retrieving linguistic data from earlier stages of languages is a notoriously difficult task. Using large electronic corpora combined with data on frequency this task can to some extent be solved. In this article I focus on the use of token frequency... mehr

    Zugang:
    Universitäts- und Landesbibliothek Sachsen-Anhalt / Zentrale
    keine Fernleihe
    Duale Hochschule Baden-Württemberg Heidenheim, Bibliothek
    e-Book Academic Complete
    keine Fernleihe
    Bibliothek LIV HN Sontheim
    ProQuest Academic Complete
    keine Fernleihe
    Bibliothek LIV HN Sontheim
    ProQuest Academic Complete
    keine Fernleihe
    Duale Hochschule Baden-Württemberg Stuttgart, Campus Horb, Bibliothek
    eBook ProQuest
    keine Fernleihe
    Universitätsbibliothek Kiel, Zentralbibliothek
    keine Fernleihe
    Duale Hochschule Baden-Württemberg Lörrach, Zentralbibliothek
    eBook ProQuest
    keine Fernleihe
    Leuphana Universität Lüneburg, Medien- und Informationszentrum, Universitätsbibliothek
    keine Fernleihe
    Duale Hochschule Baden-Württemberg Mannheim, Bibliothek
    ProQuest
    keine Fernleihe
    Duale Hochschule Baden-Württemberg Mosbach, Bibliothek
    E-Books ProQuest Academic
    keine Fernleihe
    Hochschulbibliothek Friedensau
    Online-Ressource
    keine Fernleihe
    Duale Hochschule Baden-Württemberg Ravensburg, Bibliothek
    E-Book Proquest
    keine Fernleihe
    Duale Hochschule Baden-Württemberg Stuttgart, Bibliothek
    eBook ProQuest
    keine Fernleihe
    Kommunikations-, Informations- und Medienzentrum der Universität Hohenheim
    keine Ausleihe von Bänden, nur Papierkopien werden versandt
    Duale Hochschule Baden-Württemberg Villingen-Schwenningen, Bibliothek
    EBS ProQuest
    keine Fernleihe

     

    Retrieving linguistic data from earlier stages of languages is a notoriously difficult task. Using large electronic corpora combined with data on frequency this task can to some extent be solved. In this article I focus on the use of token frequency as described in functional Grammaticalization Theory. Deverbal nouns are non-prototypical members of the noun class. As they get older they tend to develop into more prototypical nouns. In Grammaticalization Theory this process is called lexicalization. This was tested on some zero suffix nouns in the Norwegian newspaper corpus in 2004 using modern texts only. In this article I test these findings using older texts from the same corpus. Exploring Newspaper Language -- Editorial page -- Titla page -- LCC data -- Table of contents -- Building a large corpus based on newspapers from the web -- 1. Introduction -- 2. An overview of the Norwegian Newspaper Corpus and its system architecture -- 2.1 Text harvesting -- 2.2 Boilerplate and duplicate removal -- 2.3 Language classification -- 2.4 Text annotation -- 2.4.1 Annotation of source, date and author information -- 2.4.2 Topic classification -- 2.4.3 Part-of-speech tagging -- 2.5 Search system and user interface -- 2.5.1 Corpus WorkBench -- 2.5.2 Corpuscle -- 2.6 Extraction of new words -- 2.7 Classification of new words -- 2.7.1 Anglicism detection -- 2.8 Frequency profiling and lexical database entry -- 2.9 Identification of multiword expressions -- 3. The content of the research contributions to this book -- 4. Concluding remarks -- References -- Part II. Exploiting the web as a corpus - Methods and tools -- Corpuscle - a new corpus management platform for annotated corpora -- 1. Introduction -- 2. Design principles -- 3. Querying the corpus -- 4. API and Web interface -- 4.1 The API -- 4.2 The Web interface -- 5. Editing and manual annotation -- 6. Evaluation and concluding remarks -- References -- OBT+stat -- 1. Introduction -- 2. Background -- 2.1 The history of the Oslo-Bergen Tagger -- 2.2 State of the art for Norwegian POS taggers -- 3. The architecture of the Oslo-Bergen Constraint Grammar Tagger -- 4. Methodology of improvements to the Oslo-Bergen Tagger -- 5. Dealing with left-over ambiguities in the Oslo-Bergen Tagger -- 5.1 Morphological ambiguities -- 5.2 Lemma ambiguities -- 6. Statistical disambiguation -- 7. Modelling challenges and engineering concerns -- 8. Evaluation of the statistical module -- 8.1 How to evaluate -- 8.2 Evaluation results -- 9. Conclusion -- References.

     

    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Quelle: Verbundkataloge
    Sprache: Englisch
    Medientyp: Ebook
    Format: Online
    ISBN: 9789027274991
    Schriftenreihe: Studies in Corpus Linguistics
    Schlagworte: Information technology ; Norway; Mass media ; Norway; Norwegian language (Nynorsk) ; Syntax; Norwegian language (Nynorsk) ; Usage; Norwegian newspapers; Electronic books
    Umfang: 1 online resource (362 pages)
    Bemerkung(en):

    Description based on publisher supplied metadata and other sources

    :

    :

    :

    :

    :

    :

  2. Exploring newspaper language
    using the web to create and investigate a large corpus of modern Norwegian
    Autor*in:
    Erschienen: [2012]
    Verlag:  John Benjamins Publishing Company, Amsterdam ; Philadelphia

    Universitätsbibliothek Würzburg
    uneingeschränkte Fernleihe, Kopie und Ausleihe
    Export in Literaturverwaltung   RIS-Format
      BibTeX-Format
    Hinweise zum Inhalt
    Volltext (URL des Erstveröffentlichers)
    Quelle: Verbundkataloge
    Beteiligt: Andersen, Gisle
    Sprache: Englisch
    Medientyp: Ebook
    Format: Online
    ISBN: 9789027274991
    Weitere Identifier:
    RVK Klassifikation: GW 2288
    Schriftenreihe: Studies in corpus linguistics ; volume 49
    Schlagworte: Massenmedien; Norwegian language (Nynorsk); Norwegian language (Nynorsk); Norwegian newspapers; Mass media; Information technology; Norwegisch; Zeitungssprache; Korpus <Linguistik>
    Umfang: 1 Online-Ressource (vi, 356 Seiten), Illustrationen, Diagramme
    Bemerkung(en):

    Includes bibliographical references and indexes