1 语言资源
2 搜狗实验室(Sogou Labs)
3 Acollection of Chinese corpora and frequency lists
4 Corpus-basedLanguage Study
TheLancaster Los Angeles Spoken Chinese Corpus
5 lingcorpus.iis.sinica.edu.tw
收费:中央研究院-中文剖析樹檢索系統
6 LivacOnline
7 哈工大信息检索研究中心(HIT CIR)语言技术平台共享资源和程序步骤
8 ToRCH2014语料库 布朗家族中文语料库
9 CCL语料库 模式查询
10 candlewill/Dialog_Corpus
11 MarkWuNLP/MultiTurnResponseSelection
12 Short-TextConversation
13 语料库在线--资源共享
14 BCC语料库
15 LDC语料库 据说有一些中文文本
16 公布一批中文文本分类的新闻语料库 | 我爱自然语言处理
17 THCHS-30 清华大学大学生30小时语音
18 数据下载 - BosonNLP
19 北京宇音天下科技有限公司-下载中心
20 水木社区-源于清华的高知社群
21 语料库 - 自然语言处理与信息检索共享平台 NLPIR.org - Poweredby SupeSite
(参考链接:https://www.zhihu.com/question/21177095)
南京农业大学人文与社会计算研究中心 领域知识关联研究中心 corpus.njau.edu.cn 苏ICP备11055736号-3苏邮箱:corpus@njau.edu.cn 邮编:210095 地址:中国南京卫岗1号