环球门户网

Meta通过在话语级别对语音进行聚类来训练ASR模型

更新时间:2024-11-02 00:07:17

导读 Meta 开发了一种通过在话语级别对语音进行聚类来训练自动语音识别 (ASR) 模型的新方法。顾名思义,ASR 模型用于旨在将口语转录为文本的...

Meta 开发了一种通过在“话语级别”对语音进行聚类来训练自动语音识别 (ASR) 模型的新方法。

顾名思义,ASR 模型用于旨在将口语转录为文本的系统,该文本可用于执行各种功能。ASR 最流行的例子是智能手机助手,例如 Apple 的 Siri、Amazon Echo 或 Google Assistant。

尽管人工智能技术不断进步,但您可能会发现这些助手有时很难理解您的讲话。Meta 旨在改进这种将来自不同种族的各种说话者聚集在一起的方法,而不是根据年龄组或性别等指标训练 ASR 模型的传统数据集。

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。