TIMIT

TIMIT（英語：The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus），是由德州仪器、麻省理工学院和SRI International合作构建的声学－音素连续语音语料库。

TIMIT数据集的语音采样频率为16kHz，一共包含6300个句子，由来自美国八个主要方言地区的630个人每人说出给定的10个句子，所有的句子都在音素级别（phone level）上进行了手动分割，标记。70%的说话人是男性；大多数说话者是成年白人。

外部連結

语料库语言学
英語文字語料庫	美國國立語料庫英語銀行 Bergen Corpus of London Teenage Language 英國國立語料庫布朗語料庫 Buckeye Corpus 劍橋英語語料庫美国当代英语语料库 Enron Corpus International Corpus of English LOB語料庫牛津英語語料庫 PropBank Spoken English Corpus TIMIT VerbNet Wellington Corpus of Spoken New Zealand English
非英語文字語料庫	Bijankhan Corpus CHILDES Croatian Language Corpus Croatian National Corpus Europarl Corpus German Reference Corpus Hamshahri Corpus 波蘭國立語料庫 Neo-Assyrian Text Corpus Project 古蘭經阿拉伯語語料庫俄羅斯國立語料庫 Scottish Corpus of Texts and Speech Slovenian National Corpus TalkBank Tatoeba Tehran Monolingual Corpus Tekstaro de Esperanto Thesaurus Linguae Graecae
組織	英國國立語料庫 COBUILD