欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 教育 > 幼教 > 小程序语音识别报错:No valid data found in input audio

小程序语音识别报错:No valid data found in input audio

2024/10/25 2:23:06 来源:https://blog.csdn.net/weighless/article/details/142109253  浏览:    关键词:小程序语音识别报错:No valid data found in input audio

在开发项目的过程中,需要对小程序收集的语音进行语音识别,但是调用STTAPI接口的时候却返回无效的音频文件,百思不得其解???
这是小程序的语音录音设置

   options: {duration: 60000,           // 最长录制时间 60秒(单位为毫秒)format: 'wav',             // 音频格式使用 WAVsampleRate: 16000,         // 采样率设置为 16kHzencodeBitRate: 96000,      // 编码比特率 (256kbps,可以根据需求调整)numberOfChannels: 1,       // 单声道音频},

虽然小程序给你返回了一个后缀为wav格式的,但是其实里面的数据格式并不是一个标准的wav格式,其实是一个webm的文件,也就是为什么API会报错一个无效的音频文件,因为接口并不支持webm文件的音频识别。

那么我在java中做了如下处理,把webm转为一个标准wav格式
首先需要下载
ffmpeg
仅供参考

 @PostMapping("/voiceGame")public Results<String> Vstart(@RequestParam("file") MultipartFile file) throws IOException, InterruptedException, URISyntaxException, NoSuchAlgorithmException, InvalidKeyException {// FFmpeg 的路径String ffmpegPath = "D:\\ffmpeg\\ffmpeg-master-latest-win64-gpl-shared\\bin\\ffmpeg.exe";// 1. 将上传的文件保存到临时目录File webmFile = File.createTempFile("input", ".webm");try (FileOutputStream fos = new FileOutputStream(webmFile)) {fos.write(file.getBytes());}System.out.println("WebM文件保存完成");// 2. 转换 WebM 文件到 WAV 文件File wavFile = File.createTempFile("output", ".wav");// 使用 ProcessBuilder 构建 FFmpeg 转换命令String[] command = {ffmpegPath,"-y",                         // 自动覆盖输出文件"-i", webmFile.getAbsolutePath(),"-t", "30",                   // 限制转换时长为30秒"-acodec", "pcm_s16le",       // 强制使用 PCM 编码"-ar", "16000",               // 设置采样率 16000 HzwavFile.getAbsolutePath()};ProcessBuilder processBuilder = new ProcessBuilder(command);processBuilder.redirectErrorStream(true); // 合并标准输出和错误输出Process process = processBuilder.start();// 捕获 FFmpeg 输出try (BufferedReader reader = new BufferedReader(new InputStreamReader(process.getInputStream()))) {String line;while ((line = reader.readLine()) != null) {System.out.println("FFmpeg output: " + line);}}// 设置超时等待boolean completed = process.waitFor(60, TimeUnit.SECONDS);if (!completed) {process.destroy();return Results.error("FFmpeg 转换超时!");}// 检查 FFmpeg 是否成功int exitCode = process.waitFor();if (exitCode != 0) {return Results.error("转换 WebM 文件到 WAV 失败!");}System.out.println("转换完成");// 3. 将转换后的 WAV 文件读取为字节数组byte[] wavBytes = Files.readAllBytes(wavFile.toPath());// 4. 将字节数组传递给语音识别String recognitionResult = sttStreamClient.STT(wavBytes);// 5. 删除临时文件webmFile.delete();wavFile.delete();// 返回语音识别结果return Results.success(recognitionResult);}

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com