世界最大的多语言语音数据集现已开源:超 40 万小时,共 23 种语言
最近,Facebook 开源了目前世界上最大的多语言语音数据集,VoxPopuli:这一数据集共涵盖了 23 种语言,时长超过 40 万小时。其中,每种语言都有 9000 到 18000 小时的无标签语音数据。此外,还包括了共 1800 小时,16 种语言的转录语音数据,以及 17300 小时,15 种目标语言的口译语音数据。国外网友很快为这一行为点赞:显然,如果数据集已经存在,那么它应该被利用,并以一种道德的方式来改善人类社会。这一数据集庞大的无标签数据量和广泛的语言覆盖率,对改进自监督模型有...