Gender and Dialect Bias in YouTube’s Automatic Captions
Rachael Tatman
Erstpublikation in: Proceedings of the First Workshop on Ethics in Natural Language Processing, pages 53–59, Valencia, Spain, April 4th, 2017.
Publikationsdatum:
Diese Seite wurde seit 1 Jahr inhaltlich nicht mehr aktualisiert.
Unter Umständen ist sie nicht mehr aktuell.
Zusammenfassungen
In einer wissenschaftlichen Untersuchung zeigte Tatman, dass der Dienst der Plattform YouTube, um automatische Untertitel bei hochgeladenen Videos zu erzeugen („automatic caption“), unterschiedliche Genauigkeiten aufweist, mit deutlich geringerer Genauigkeit der Erkennung der Sprache von Frauen und für Videos mit Personen mit schottischem Dialekt. Der Dienst beruht auf einem maschinellen Lernverfahren. Als einen der möglichen Gründe vermutet die Autorin unzureichende Trainingsdaten (Tatman 2017: 57).
This project evaluates the accuracy of
YouTube’s automatically-generated captions across two genders and five dialects
of English. Speakers’ dialect and gender was controlled for by using videos
uploaded as part of the “accent tag challenge”, where speakers explicitly identify their language background. The results show robust differences in accuracy
across both gender and dialect, with lower
accuracy for 1) women and 2) speakers
from Scotland. This finding builds on
earlier research finding that speaker’s sociolinguistic identity may negatively impact their ability to use automatic speech
recognition, and demonstrates the need for
sociolinguistically-stratified validation of
systems.
Beat hat Dieses Konferenz-Paper während seiner Zeit am Institut für Medien und Schule (IMS) ins Biblionetz aufgenommen. Beat besitzt kein physisches, aber ein digitales Exemplar. Eine digitale Version ist auf dem Internet verfügbar (s.o.). Aufgrund der wenigen Einträge im Biblionetz scheint er es nicht wirklich gelesen zu haben. Es gibt bisher auch nur wenige Objekte im Biblionetz, die dieses Werk zitieren.
Biblionetz-History
Webzugriffe Biblionetz-Verweise auf 'Gender and Dialect Bias in YouTube’s Automatic Captions' Biblionetz-Verweise von 'Gender and Dialect Bias in YouTube’s Automatic Captions'