Automatische Faktenüberprüfung für Biomedizinische Informationen in Sozialen Medien und Wissenschaftlicher Literatur (FIBISS)

Die Erforschung von Methoden zur automatischen Überprüfung von Fakten, also Computermodelle, welche korrekte Information von Fehlinformation oder Desinformation unterscheiden können, fokussiert weitestgehend auf die Nachrichtendomäne. So werden Nachrichten, auch solche, welche in sozialen Medien geteilt werden, auf ihren Wahrheitsgehalt überprüft.Solche Methoden sind bisher nicht für die biomedizinische Domäne entwickelt worden. Besondere Herausforderungen sind hier unter anderem die Reichhaltigkeit an existierenden (etablierten) Informationsquellen, die Komplexität der enthaltenen Information und der Unterschied der verwendeten Sprache von Experten und medizinischen Laien.In diesem Projekt entwickeln wir Informationsextraktionsysteme für Laien- und Expertensprache und Methoden um die extrahierten Informationen automatisch aufeinander abzubilden und in diesem gemeinsamen semantischen Raum Informationen automatisch abzugleichen, und schließlich auf ihren Wahrheitsgehalt unter Betrachtung von etablierten Quellen zu überprüfen.Das Projekt kombiniert somit Methoden des Transferlernens, der Informationsextraktion, und der Faktenüberprüfung für die biomedizinische Domäne insbesondere in sozialen Medien.

FIBISS startete in 2021 (an der Universität Stuttgart) und wird in 2024 beendet werden.

Das Projekt wird von der Deutschen Forschungsgemeinschaft (DFG) finanziert.

Publikationen

Velutharambath, Aswathy/Klinger, Roman (2024): Can Factual Statements Be Deceptive?: The DeFaBel Corpus of Belief-based Deception. In: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). ACL. S. 2708–2723.

Wuehrl, Amelie et al. (2024): Understanding Fine-grained Distortions in Reports of Scientific Findings. In: Findings of the Association for Computational Linguistics ACL 2024. Bangkok, Thailand and virtual meeting: Association for Computational Linguistics. S. 6175–6191.

Wührl, Amelie et al. (2024): What Makes Medical Claims (Un)Verifiable?: Analyzing Entity and Relation Properties for Fact Verification. In: Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics. Association for Computational Linguistics. S. 1–13.

Velutharambath, Aswathy/Klinger, Roman (2023): UNIDECOR: A Unified Deception Corpus for Cross-Corpus Deception Detection. In: Proceedings of the 13th Workshop on Computational Approaches to Subjectivity, Sentiment, & Social Media Analysis. Toronto: Association for Computational Linguistics. S. 39–51.

Wührl, Amelie/Grimminger, Lara/Klinger, Roman (2023): An Entity-based Claim Extraction Pipeline for Real-world Biomedical Fact-checking. In: Proceedings of the Sixth Fact Extraction and VERification Workshop (FEVER). Dubrovnik: Association for Computational Linguistics. S. 29–37.

Mohr, Isabelle/Wührl, Amelie/Klinger, Roman (2022): CoVERT: A Corpus of Fact-checked Biomedical COVID-19 Tweets. In: Proceedings of the Thirteenth Language Resources and Evaluation Conference. Marseille: European Language Resources Association. S. 244–257.

Wührl, Amelie/Klinger, Roman (2022a): Recovering Patient Journeys: A Corpus of Biomedical Entities and Relations on Twitter (BEAR). In: Proceedings of the Thirteenth Language Resources and Evaluation Conference. Marseille: European Language Resources Association. S. 4439–4450.

Wührl, Amelie/Klinger, Roman (2022b): Entity-based Claim Representation Improves Fact-Checking of Medical Content in Tweets. In: Proceedings of the 9th Workshop on Argument Mining. Gyeongju: International Conference on Computational Linguistics. S. 187–198.

Grimminger, Lara/Klinger, Roman (2021): Hate Towards the Political Opponent: A Twitter Corpus Study of the 2020 US Elections on the Basis of Offensive Speech and Stance Detection. In: Proceedings of the Eleventh Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis. Association for Computational Linguistics. S. 171–180.

Wührl, Amelie/Klinger, Roman (2021): Claim Detection in Biomedical Twitter Posts. In: Proceedings of the 20th Workshop on Biomedical Language Processing. Association for Computational Linguistics. S. 131–142.

Thorne, Camilo/Klinger, Roman (2018): On the Semantic Similarity of Disease Mentions in MEDLINE and Twitter. In: Natural Language Processing and Information Systems: 23rd International Conference on Applications of Natural Language to Information Systems, NLDB 2018, Paris, France, June 13-15, 2018, Proceedings. Cham: Springer International Publishing. S. 324–332.

Thorne, Camilo/Klinger, Roman (2017): Towards Confidence Estimation for typed Protein-Protein Relation Extraction. In: Proceedings of the Biomedical NLP Workshop associated with RANLP 2017. Association for Computational Linguistics. S. 55–63.