「ParaKeet-tdt-0.6b-v2 语音识别」demo 已上线至 HyperAI超神经官网的「教程」板块。 无论是在智能客服中实时理解用户意图,还是在会议记录、访谈整理、字幕生成等场景中识别多语速、多口音的音频,持续升级的使用需求对于语音识别技术提出更加苛刻的要求。
英伟达公司近期公布了一项重大技术突破,一款名为Parakeet TDT 0.6B的先进自动语音识别(ASR)模型已在Hugging Face平台上全面开放源代码。据行业内部消息透露,这款新模型在语音处理速度和转录准确性方面均达到了前所未有的水平。 Parakeet TDT 0.6B的亮点之一在于 ...
据站长之家 1 月 8 日报道,开源对话 AI 工具包 NVIDIA NeMo 宣布推出 Parakeet ASR 模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语。 英伟达宣布推出了四个 Parakeet 模型,这些模型基于 RNN Transducer/Connectionist Temporal ...