Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung
Weitere Details
Für die Analyse dieser Klassen wurde die Entropie auf der Häufigkeit der Triphonkontexte berechnet, deren Segmente jeweils zu einer Klasse zusammengefaßt wurden. Die Entropie ist ein informationstheoretisches Maß für den Informationsgehalt und dient hier als Maß für die Heterogenität der linken und rechten Kontexte einer Klasse.
Die Untersuchungen wurden auf einem deutschen spontansprachlichen Korpus (Verbmobil), einem deutschen gelesenen Korpus (Erba) und einem amerikanisch-englischen gelesenen Korpus (Wall Street Journal) durchgeführt. Die Anzahl der Sprecher lag bei 654 (bzw. 85, resp. 84) mit insgesamt 13.900 Äußerungen (bzw. 8.500, resp. 7.100). In allen drei Korpora konnte ein genereller Trend festgestellt werden, demzufolge die rechten Kontexte der zusammengefaßten Segmente eine größere Homogenität aufweisen als die linken. Dieser stärkere Einfluß des rechten Kontextes kann als vorherrschende antizipierende Kontakt-Koartikulation interpretiert werden.
Diese Erkenntnis wurde in einem Spracherkennungssystem auf der Verbmobil-Stichprobe genutzt, um die Folge wortübergreifender Triphone sinnvoll zu restringieren. Dabei wurden die besten Erkennungsergebnisse mit einer Restriktion erzielt, die ausschließlich den rechten Kontext berücksichtigt (Verringerung der Wortfehlerrate um 9,3 prozent vs. Verschlechterung um 1,3 Prozent bei linkem Kontext gegenüber dem Basissystem ohne wortübergreifende Triphone). Diese Restriktion kann als Simulation des antizipatorischen Scan-Prozesses interpretiert werden, bei dem der aktuelle Laut genutzt wird, um den folgenden vorherzusagen. Eine weitere Verwendung der Untersuchungsergebnisse ist bei der Inkorporierung ungesehener Triphone in die bestehende Klassen geplant. Anhand der Untersuchung der Segmentklassen ist es möglich, Vorhersagen über die Ähnlichkeit von Segmenten aufgrund der Kontexte der Triphone zu treffen.
Zitierstile
Wrede B, Fink GA, Kummert F, Sagerer G. Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. In: 34. Linguistisches Kolloquium. Peter Lang; 1999.
Wrede, B., Fink, G. A., Kummert, F., & Sagerer, G. (1999). Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. 34. Linguistisches Kolloquium
Wrede, B., Fink, G. A., Kummert, F., and Sagerer, G. (1999). “Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung” in 34. Linguistisches Kolloquium (Peter Lang).
Wrede, B., et al., 1999. Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. In 34. Linguistisches Kolloquium. Peter Lang.
B. Wrede, et al., “Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung”, 34. Linguistisches Kolloquium, Peter Lang, 1999.
Wrede, B., Fink, G.A., Kummert, F., Sagerer, G.: Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. 34. Linguistisches Kolloquium. Peter Lang (1999).
Wrede, Britta, Fink, Gernot A., Kummert, Franz, and Sagerer, Gerhard. “Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung”. 34. Linguistisches Kolloquium. Peter Lang, 1999.
Download
RDF/XML-Format
JSON-LD-Format
Turtle-Format
N3-Format
Für die Analyse dieser Klassen wurde die Entropie auf der Häufigkeit der Triphonkontexte berechnet, deren Segmente jeweils zu einer Klasse zusammengefaßt wurden. Die Entropie ist ein informationstheoretisches Maß für den Informationsgehalt und dient hier als Maß für die Heterogenität der linken und rechten Kontexte einer Klasse.
Die Untersuchungen wurden auf einem deutschen spontansprachlichen Korpus (Verbmobil), einem deutschen gelesenen Korpus (Erba) und einem amerikanisch-englischen gelesenen Korpus (Wall Street Journal) durchgeführt. Die Anzahl der Sprecher lag bei 654 (bzw. 85, resp. 84) mit insgesamt 13.900 Äußerungen (bzw. 8.500, resp. 7.100). In allen drei Korpora konnte ein genereller Trend festgestellt werden, demzufolge die rechten Kontexte der zusammengefaßten Segmente eine größere Homogenität aufweisen als die linken. Dieser stärkere Einfluß des rechten Kontextes kann als vorherrschende antizipierende Kontakt-Koartikulation interpretiert werden.
Diese Erkenntnis wurde in einem Spracherkennungssystem auf der Verbmobil-Stichprobe genutzt, um die Folge wortübergreifender Triphone sinnvoll zu restringieren. Dabei wurden die besten Erkennungsergebnisse mit einer Restriktion erzielt, die ausschließlich den rechten Kontext berücksichtigt (Verringerung der Wortfehlerrate um 9,3 prozent vs. Verschlechterung um 1,3 Prozent bei linkem Kontext gegenüber dem Basissystem ohne wortübergreifende Triphone). Diese Restriktion kann als Simulation des antizipatorischen Scan-Prozesses interpretiert werden, bei dem der aktuelle Laut genutzt wird, um den folgenden vorherzusagen. Eine weitere Verwendung der Untersuchungsergebnisse ist bei der Inkorporierung ungesehener Triphone in die bestehende Klassen geplant. Anhand der Untersuchung der Segmentklassen ist es möglich, Vorhersagen über die Ähnlichkeit von Segmenten aufgrund der Kontexte der Triphone zu treffen.
Zitierstile
Wrede B, Fink GA, Kummert F, Sagerer G. Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. In: 34. Linguistisches Kolloquium. Peter Lang; 1999.
Wrede, B., Fink, G. A., Kummert, F., & Sagerer, G. (1999). Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. 34. Linguistisches Kolloquium
Wrede, B., Fink, G. A., Kummert, F., and Sagerer, G. (1999). “Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung” in 34. Linguistisches Kolloquium (Peter Lang).
Wrede, B., et al., 1999. Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. In 34. Linguistisches Kolloquium. Peter Lang.
B. Wrede, et al., “Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung”, 34. Linguistisches Kolloquium, Peter Lang, 1999.
Wrede, B., Fink, G.A., Kummert, F., Sagerer, G.: Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung. 34. Linguistisches Kolloquium. Peter Lang (1999).
Wrede, Britta, Fink, Gernot A., Kummert, Franz, and Sagerer, Gerhard. “Quantitative Untersuchungen zu antizipierender Koartikulation mit Methoden der Automatischen Spracherkennung”. 34. Linguistisches Kolloquium. Peter Lang, 1999.
Download
RDF/XML-Format
JSON-LD-Format
Turtle-Format
N3-Format