WikiSort.ru - Лингвистика

ПОИСК ПО САЙТУ | о проекте

Речевой корпус — база данных аудиофайлов и транскрипций текстов, разновидность корпуса текстов. В речевых технологиях[en] речевые корпуса используются, среди прочего, для создания акустических моделей[en] (которые затем могут использоваться в механизмах распознавания речи). В лингвистике речевые корпуса используются для исследований фонетики, диалектологии, конверсационного анализа и в других областях.

Существует два типа речевых корпусов:
1.Базы начитанных текстов, в том числе:

  • тексты книг;
  • тексты трансляций новостей;
  • списки слов;
  • последовательности чисел.

2.Базы аудиозаписей спонтанной речи — в том числе:

  • диалоги — беседы между двумя или более людьми;
  • устные рассказы (например, Buckeye Corpus[1]);
  • картографические пояснения — один человек объясняет маршрут на карте другим;
  • задачи назначения — два человека пытаются найти общее время встречи, основанное на отдельных графиках.

Особый вид речевых корпусов — это базы данных текстов, наговоренных людьми, не являющимися носителями языка[en], которые содержат речь с иностранным акцентом.

Примечания

Литература

  • Edwards, Jane / Lampert, Martin (eds.) (1992): Talking Data — Transcription and Coding in Discourse Research. Hillsdale: Erlbaum.
  • Leech, Geoffrey / Myers, Greg / Thomas, Jenny (eds.) (1995): Spoken English on Computer: Transcription, Markup and Application. Harlow: Longman.

Ссылки

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии