TIMIT(英語:The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus),是由德州仪器、麻省理工学院和SRI International合作构建的声学-音素连续语音语料库。
TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,由来自美国八个主要方言地区的630个人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。70%的说话人是男性;大多数说话者是成年白人。
外部連結
|
|---|
| 英語文字語料庫 |
- 美國國立語料庫
- 英語銀行
- Bergen Corpus of London Teenage Language
- 英國國立語料庫
- 布朗語料庫
- Buckeye Corpus
- 劍橋英語語料庫
- 美国当代英语语料库
- Enron Corpus
- International Corpus of English
- LOB語料庫
- 牛津英語語料庫
- PropBank
- Spoken English Corpus
- TIMIT
- VerbNet
- Wellington Corpus of Spoken New Zealand English
|
|---|
| 非英語文字語料庫 |
- Bijankhan Corpus
- CHILDES
- Croatian Language Corpus
- Croatian National Corpus
- Europarl Corpus
- German Reference Corpus
- Hamshahri Corpus
- 波蘭國立語料庫
- Neo-Assyrian Text Corpus Project
- 古蘭經阿拉伯語語料庫
- 俄羅斯國立語料庫
- Scottish Corpus of Texts and Speech
- Slovenian National Corpus
- TalkBank
- Tatoeba
- Tehran Monolingual Corpus
- Tekstaro de Esperanto
- Thesaurus Linguae Graecae
|
|---|
| 組織 | |
|---|