最新发布!查看 MagicData 成品数据集
MDT-NLP-F024 中文TN正则文本语料库

MDT-NLP-F024 中文TN正则文本语料库

语种

中文

数量

100,736

数据内容

TN正则文本

文件格式

TXT

适用领域

自然语言处理

数据敏感项

版权所有者

样例

100001
另一队中国组合由邵奕俊担任舵手。落后冠军组合1.63秒,最终排名第十四。
另一队中国组合由邵奕俊担任舵手。落后冠军组合一点六三秒,最终排名第十四。

100002
第二局比赛中国队攻势不减,侯宇阳在23分33秒时将比分改写为3:0。
第二局比赛中国队攻势不减,侯宇阳在二十三分三十三秒时将比分改写为三比零。

100003
上半场比赛双方打成10-10平,这是超级碗历史上第四次半场分数持平。
半场比赛双方打成十比十平,这是超级碗历史上第四次半场分数持平。

没有找到想要的数据?

联系我们

数据集推荐

MDT-NLP-A023 印地语新闻文本语料库

MDT-NLP-A003 俄语口语化日常聊天语料库

MDT-NLP-F003 中泰双语平行语料库

MDT-NLP-A004 法语口语化日常聊天语料库

MDT-NLP-F013 中文导航语料库

【开源数据】

MDT-NLP-A024 中文儿童读物文本语料库

数据优势有哪些?

合规性

符合ISO/IEC 27001和ISO/IEC 27701:2019标准认证

多维度

音频、文本、图像、音视频多模态数据

覆盖性

涵盖多领域的对话式、朗读式及自发式数据

高精度

人机协同高精度标注

TOP
联系我们