Skip to content

EVASHINJI/Dialog-Datasets

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 

Repository files navigation

对话系统中英文语料

本项目收集目前论文中,已公开的,用于训练中(英)文对话系统的语料以及开源的对话模型。

部分开源模型 待整理…

常用

中文

Douban Conversation Corpus

Noah NRM Data

STC Data

英文

Ubuntu Dialogue Corpus v2

OpenSubtitles

Cornell Movie Dialogs Corpus

Twitter

微博

Noah NRM Data

STC Data

NTCIR14 STC3 CECG

Personality Assignment Dataset

Chinese Dialogue Dataset with Sentence Function

Twitter

Twitter

豆瓣

Douban Conversation Corpus

电商

JD Customer Service Corpus

E-commerce Dialogue Corpus

About

本项目收集目前对话系统论文中,已公开的,用于训练中(英)文的训练集。Datasets for training Dialog.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors