Zwei Papiere bei der Konferenz "Natural Language Processing for Digital Humanities" (NLP4DH) akzeptiert
BamNLP publiziert zwei Beiträge auf der Konferenz „Natural Language Processing for Digital Humanities (NLP4DH)“, die gemeinsam mit der Jahreskonferenz des Nations of the Americas Chapter der Association for Computational Linguistics stattfindet.
- Lynn Greschner und Roman Klinger. Fearful Falcons and Angry Llamas: Emotion Category Annotations of Arguments by Humans and LLMs. https://arxiv.org/abs/2412.15993
- Dmitry Nikolaev and Sean Papay. Strategies for political-statement segmentation and labelling in unstructured text. https://arxiv.org/abs/2503.07179
In der ersten Arbeit untersuchen die Autorinnen, ob bestimmte Emotionen (Freude, Angst, ...) in Argumentationstexten einen Einfluss darauf haben, wie überzeugend ein Argument ist. Bisher konzentrierten sich die Arbeiten im Bereich Argument Mining hauptsächlich auf das Konzept der Emotionalität – wie emotional ein Argument formuliert ist, und weniger darauf, welche Emotion ausgedrückt wird. Die Autoren erstellen das Emo-Defabel-Korpus mit Emotionsannotationen zu Argumenten und stellen fest, dass positive Emotionen (z.B. Freude, Stolz) mit höherer Überzeugungskraft korrelieren, während negative Emotionen (z.B. Ärger) die Überzeugungskraft von Argumenten verringern. Interessanterweise sind drei große Sprachmodelle nicht in der Lage, Emotionen in Argumenten korrekt vorherzusagen. Sie sind zu stark auf negative Emotionen ausgerichtet, wenn es sich um argumentative Texte handelt.
In der zweiten Arbeit geht es darum, die Forschung von Politikwissenschaftlern zu erleichtern. Diese sind häufig daran interessiert, die Positionen politischer Parteien in verschiedenen Ländern und im Zeitverlauf zu analysieren. Zu diesem Zweck identifizieren und kennzeichnen sie die politischen Aussagen in Parteiprogrammen. In dieser Arbeit untersuchen die Autoren verschiedene Methoden für den Einsatz von maschinellem Lernen, um Aussagen automatisch zu finden und zu kennzeichnen, und wie die Ergebnisse im Hinblick auf sich ändernde Parteipositionen interpretiert werden können. Sie stellen fest, dass mit einem maschinellen Lernmodell, das in der Lage ist, politische Aussagen sowohl zu finden als auch zu klassifizieren, automatische Methoden zuverlässig politische Aussagen aus anderen politischen Texten, einschließlich der Transkripte von Parlamentsreden, extrahieren können. Anhand des Hansard-Korpus, der Aufzeichnung parlamentarischer Debattenprotokolle aus dem Vereinigten Königreich, verfolgen sie die Entwicklung der Parteien im politischen Spektrum auf der Grundlage der politischen Aussagen von Parteimitgliedern in Debatten.