@inproceedings{broll-schneider-2023-empirische,
title = {Empirische Verortung konzeptioneller N{\"a}he/M{\"u}ndlichkeit inner- und au{\ss}erhalb schriftsprachlicher Korpora},
author = "Broll, Sarah and
Schneider, Roman",
editor = "Schneider, Roman and
Gertrud, Faa{\ss}",
booktitle = "Journal for Language Technology and Computational Linguistics, Vol. 36 No. 1",
month = may,
year = "2023",
address = "unknown",
publisher = "German Society for Computational Lingustics and Language Technology",
url = "https://aclanthology.org/2023.jlcl-1.7/",
doi = "10.21248/jlcl.36.2023.240",
pages = "113--150",
abstract = {Linguistische Studien arbeiten h{\"a}ufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der N{\"a}he und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich f{\"u}r eine Verortung unterschiedlichster {\"A}u{\ss}erungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsb{\"a}ume entsprechende Vorhersagen auf Textebene durchf{\"u}hrt. F{\"u}r die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachph{\"a}nomenen, die als Markierer f{\"u}r N{\"a}he/M{\"u}ndlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische N{\"a}he-/M{\"u}ndlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsg{\"u}te verorten wir anschlie{\ss}end eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als {\quotedblbase}mittige Textsorte{\textquotedblleft}, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle m{\"u}ndlich kommunizierte, aber vorab oder nachtr{\"a}glich verschriftlichte {\"A}u{\ss}erungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gespr{\"a}chsdaten und decken Klassifikationsunterschiede f{\"u}r Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Ann{\"a}herung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale ({\quotedblbase}shallow features{\textquotedblleft}) nachweisbar Einfluss auf die Verortung haben.}
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="broll-schneider-2023-empirische">
<titleInfo>
<title>Empirische Verortung konzeptioneller Nähe/Mündlichkeit inner- und außerhalb schriftsprachlicher Korpora</title>
</titleInfo>
<name type="personal">
<namePart type="given">Sarah</namePart>
<namePart type="family">Broll</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Roman</namePart>
<namePart type="family">Schneider</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-05</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Journal for Language Technology and Computational Linguistics, Vol. 36 No. 1</title>
</titleInfo>
<name type="personal">
<namePart type="given">Roman</namePart>
<namePart type="family">Schneider</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Faaß</namePart>
<namePart type="family">Gertrud</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>German Society for Computational Lingustics and Language Technology</publisher>
<place>
<placeTerm type="text">unknown</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Linguistische Studien arbeiten häufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der Nähe und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich für eine Verortung unterschiedlichster Äußerungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsbäume entsprechende Vorhersagen auf Textebene durchführt. Für die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachphänomenen, die als Markierer für Nähe/Mündlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische Nähe-/Mündlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsgüte verorten wir anschließend eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als \quotedblbasemittige Textsorte“, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle mündlich kommunizierte, aber vorab oder nachträglich verschriftlichte Äußerungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gesprächsdaten und decken Klassifikationsunterschiede für Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Annäherung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale (\quotedblbaseshallow features“) nachweisbar Einfluss auf die Verortung haben.</abstract>
<identifier type="citekey">broll-schneider-2023-empirische</identifier>
<identifier type="doi">10.21248/jlcl.36.2023.240</identifier>
<location>
<url>https://aclanthology.org/2023.jlcl-1.7/</url>
</location>
<part>
<date>2023-05</date>
<extent unit="page">
<start>113</start>
<end>150</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Empirische Verortung konzeptioneller Nähe/Mündlichkeit inner- und außerhalb schriftsprachlicher Korpora
%A Broll, Sarah
%A Schneider, Roman
%Y Schneider, Roman
%Y Gertrud, Faaß
%S Journal for Language Technology and Computational Linguistics, Vol. 36 No. 1
%D 2023
%8 May
%I German Society for Computational Lingustics and Language Technology
%C unknown
%F broll-schneider-2023-empirische
%X Linguistische Studien arbeiten häufig mit einer Differenzierung zwischen gesprochener und geschriebener Sprache bzw. zwischen Kommunikation der Nähe und Distanz. Die Annahme eines Kontinuums zwischen diesen Polen bietet sich für eine Verortung unterschiedlichster Äußerungsformen an, inklusive unkonventioneller Textsorten wie etwa Popsongs. Wir konzipieren, implementieren und evaluieren ein automatisiertes Verfahren, das mithilfe unkorrelierter Entscheidungsbäume entsprechende Vorhersagen auf Textebene durchführt. Für die Identifizierung der Pole definieren wir einen Merkmalskatalog aus Sprachphänomenen, die als Markierer für Nähe/Mündlichkeit bzw. Distanz/Schriftlichkeit diskutiert werden, und wenden diesen auf prototypische Nähe-/Mündlichkeitstexte sowie prototypische Distanz-/Schrifttexte an. Basierend auf der sehr guten Klassifikationsgüte verorten wir anschließend eine Reihe weiterer Textsorten mithilfe der trainierten Klassifikatoren. Dabei erscheinen Popsongs als \quotedblbasemittige Textsorte“, die linguistisch motivierte Merkmale unterschiedlicher Kontinuumsstufen vereint. Weiterhin weisen wir nach, dass unsere Modelle mündlich kommunizierte, aber vorab oder nachträglich verschriftlichte Äußerungen wie Reden oder Interviews vollkommen anders verorten als prototypische Gesprächsdaten und decken Klassifikationsunterschiede für Social-Media-Varianten auf. Ziel ist dabei nicht eine systematisch-verbindliche Einordung im Kontinuum, sondern eine empirische Annäherung an die Frage, welche maschinell vergleichsweise einfach bestimmbaren Merkmale (\quotedblbaseshallow features“) nachweisbar Einfluss auf die Verortung haben.
%R 10.21248/jlcl.36.2023.240
%U https://aclanthology.org/2023.jlcl-1.7/
%U https://doi.org/10.21248/jlcl.36.2023.240
%P 113-150
Markdown (Informal)
[Empirische Verortung konzeptioneller Nähe/Mündlichkeit inner- und außerhalb schriftsprachlicher Korpora](https://aclanthology.org/2023.jlcl-1.7/) (Broll & Schneider, JLCL 2023)
ACL