Mitmachmöglichkeit 16.11.2022, 09:41 Uhr

Common Voice: Sätze sammeln, überprüfen und Stimme spenden – so gehts

Hochdeutsch ist mittlerweile verfügbar, doch bei Schweizer Dialekten gibts noch viel Potenzial.
(Quelle: Mozilla)
Seit mehreren Jahren sammelt Mozilla Sprach-Samples von freiwilligen Teilnehmern für sein Open-Source-Projekt «Common Voice» zum Aufbau einer frei verfügbaren Sprachdatenbank. Common Voice ist ein Open-Source-Sprachdatensatz, der durch Stimmen freiwilliger Mitwirkender auf der ganzen Welt geschaffen wird. Mittlerweile haben fast eine halbe Million Menschen Sätze geteilt, sie laut vorgelesen sowie die Stimmaufzeichnungen von anderen Personen validiert. Derzeit besteht Common Voice aus mehr als 80 sogenannten Gemeinschaften.

Der Ablauf

Jemand bittet auf der Webseite darum, eine Sprache hinzuzufügen. Der Webseiten-Text wird in diese Sprache übersetzt. Dann werden Sätze gesammelt, damit Menschen diese anschliessend laut vorlesen können. In einem weiteren Schritt wird die Common-Voice-Webseite in dieser Sprache veröffentlicht. Erst dann können Menschen ihre Stimme spenden. Andere Freiwillige validieren diese Sprachclips. Mozilla veröffentlicht den Datensatz alle drei Monate.

Sprache und Akzent

Beim Open-Source-Projekt gibt es zwei Kategorien: Sprache und Akzent. Communitys können die Webseite lokalisieren und Sprachdaten für einen komplett neuen Sprachdatensatz sammeln. Alternativ kann man via Github Akzente für eine bestehende Sprache vorschlagen.
Wie Sie beim Open-Source-Projekt mitmachen, erfahren Sie auf der nächsten Seite.

So machen Sie mit

Sätze hinzufügen oder überprüfen

Mozilla bietet hierfür den sogenannten Satzsammler. Dies ist ein Werkzeug zum Sammeln und Validieren von Sätzen.
Hinweis: Sätze müssen gemeinfrei und kürzer als 15 Wörter sein.
  1. Zunächst erstellen Sie auf dieser Webseite ein Mozilla-Konto. Alternativ können Sie über ein bestehendes Firefox-, GitHub- oder Google-Konto einloggen.
  2. Ist dies erledigt, fügen Sie Ihrem Profil eine Sprache hinzu. Wählen Sie Ihre Sprache oben sowie unter Einstellungen (Benutzeroberfläche) und klicken Sie oben auf Sprache hinzufügen.
    Fügen Sie Ihrem Common-Voice-Profil Ihre Sprache hinzu
    Quelle: Screenshot/PCtipp.ch
  3. Wie Sie im Screenshot sehen, ist Deutsch bereits verfügbar. Doch wie sieht es mit Schweizerdeutsch aus? Schweizerdeutsch als übergeordnete Kategorie ist in der Liste bisher nicht zu finden (kann über diesen Prozess beantragt werden). Züritüütsch auch nicht. Doch beispielsweise Rätoromanisch Vallader (Unterengadinisch) oder Surselvisch (Kanton Graubünden) wurden gefunden.
  4. Anschliessend klicken Sie oben auf das Hamburgermenü. Wählen Sie aus dem Drop-down-Menü Startseite.
  5. Hier gehts nun direkt entweder zu Sätze sammeln oder Sätze überprüfen.
    Startseite des Common-Voice-Satzsammlers
    Quelle: Screenshot/PCtipp.ch
  6. Um gemeinfreie Sätze zu schreiben oder sammeln, klicken Sie nun auf Sätze sammeln.
  7. Bei Sätze überprüfen haben wir als Anschauungsbeispiel Surselvisch ausgewählt (die Autorin ist dieses Dialekts allerdings nicht mächtig.). Unten sehen Sie jeweils die (gemeinfreie) Quelle eines Satzes. Sie können entweder auf die Schaltflächen Ablehnen, Überspringen oder Genehmigen klicken oder das Feld mit der Maus greifen und nach links oder rechts ziehen. Wenn Sie fertig sind, klicken Sie auf Bewertung abschliessen.
    Gibt es PCtipp-Leserinnen und -Leser, die Surselvisch sprechen?
    Quelle: Screenshot/PCtipp.ch
  8. Ihre eingereichten Sätze finden Sie via Hamburgermenü und dort Meine Sätze.




Das könnte Sie auch interessieren