JEST是一种用于大规模预训练的数据筛选方法,通过联合选择数据批次来加速多模态学习。
Snail Radar Dataset 是一个大规模的4D雷达数据集,专为自动驾驶系统中的定位、建图和地点识别而设计。这个数据集通过三种不同的平台(手持设备、电动自行车和SUV)在多种环境条件下收集,包括晴朗天气、夜间和大雨天气。
武汉大学联合中国移动九天人工智能团队和昆山杜克大学基于YouTube数据开源了超过11万小时的音视频说话人识别数据集VoxBlink2,是目前最大的公开可用的音视频说话人识别数据集。该数据集丰富了开源语音语料库,支持训练声纹大模型。
JEST是一种用于大规模预训练的数据筛选方法,通过联合选择数据批次来加速多模态学习。