react-native-baidu-asr

react-native-baidu-asr 是一个 React Native 下的百度语音库，可以进行语音识别，语音唤醒以及语音合成。

English | 简体中文

预览

支持平台

React Native >= 0.47.0
Android

当前并未实现iOS平台，我有空会补上。

安装

对于RN >= 0.60

yarn add react-native-baidu-asr

对于RN < 0.60

yarn add react-native-baidu-asr
react-native link react-native-baidu-asr

使用

详见example

首先是你先要去百度语音控制台创建一个应用，拿到鉴权信息：AppID，API Key，Secret Key。

现在我进行测试发现免费测试次数已经被用完了，需要测试的同学需要自己另外去申请鉴权信息。

语音识别

import {
  BaiduAsr,
  StatusCode,
  IBaseData,
  RecognizerResultError,
  RecognizerResultData,
  VolumeData
} from 'react-native-baidu-asr';

// 初始化百度语音引擎
BaiduAsr.init({
  APP_ID: '你的鉴权信息AppID',
  APP_KEY: '你的鉴权信息API Key',
  SECRET: '你的鉴权信息Secret Key',
});

// 处理识别结果
this.resultListener = BaiduAsr.addResultListener(this.onRecognizerResult);
// 处理错误结果
this.errorListener = BaiduAsr.addErrorListener(this.onRecognizerError);
// 处理音量大小
this.volumeListener = BaiduAsr.addAsrVolumeListener(this.onAsrVolume);

// 开始语音识别
// 更多输入参数请参考百度语音文档
// https://ai.baidu.com/ai-doc/SPEECH/bkh07sd0m#asr_start-%E8%BE%93%E5%85%A5%E4%BA%8B%E4%BB%B6%E5%8F%82%E6%95%B0
BaiduAsr.start({
  // 长语音
  VAD_ENDPOINT_TIMEOUT: 0,
  BDS_ASR_ENABLE_LONG_SPEECH: true,
  // 禁用标点符号
  DISABLE_PUNCTUATION: true,
});

语音唤醒

首先是先导出唤醒词，预定义唤醒词和自定义唤醒词，均需通过唤醒词评估工具进行导出使用。

import { BaiduWakeUp } from 'react-native-baidu-asr';

// 初始化百度语音引擎
BaiduWakeUp.init({
  APP_ID: '你的鉴权信息AppID',
  APP_KEY: '你的鉴权信息API Key',
  SECRET: '你的鉴权信息Secret Key',
});

// 唤醒结果
this.resultListener = BaiduWakeUp.addResultListener(this.onWakeUpResult);
// 处理错误结果
this.errorListener = BaiduWakeUp.addErrorListener(this.onWakeUpError);

// 开始语音唤醒
// 更多输入参数请参考百度语音文档
// https://ai.baidu.com/ai-doc/SPEECH/bkh07sd0m#wakeup_start-%E8%BE%93%E5%85%A5%E4%BA%8B%E4%BB%B6%E5%8F%82%E6%95%B0
BaiduWakeUp.start({
  //表示WakeUp.bin文件定义在assets目录下
  WP_WORDS_FILE: 'assets:///WakeUp.bin',
});

语音合成

语音合成的鉴权信息放在assets 目录中的 auth.properties ，参考example的做法。

然后需要在api level 28 以上编译的话，还需要修改AndroidManifest.xml

<application
        android:name=".MainApplication"
        android:allowBackup="false"
        android:icon="@mipmap/ic_launcher"
        android:label="@string/app_name"
        android:roundIcon="@mipmap/ic_launcher_round"
        android:theme="@style/AppTheme">

    <!-- 加这一句。支持api level 28 以上编译-->
    <uses-library
            android:name="org.apache.http.legacy"
            android:required="false"/>

    // ...

</application>

import {
  BaiduSynthesizer,
  SynthesizerData,
  SynthesizerResultData,
  SynthesizerResultError,
} from 'react-native-baidu-asr';

// 初始化
BaiduSynthesizer.initialTts();

// 监听事件
this.resultListener = BaiduSynthesizer.addResultListener(
    this.onSynthesizerResult,
);
this.errorListener = BaiduSynthesizer.addErrorListener(
    this.onSynthesizerError,
);

// 语音合成
BaiduSynthesizer.speak(
    this.state.text,
    // 更多输入参数请参考百度文档 https://ai.baidu.com/ai-doc/SPEECH/Pk8446an5
    {
      PARAM_SPEAKER: '1',
    },
    status => {
      console.log('speak --> ', status);
    },
);

// 批量播放
BaiduSynthesizer.batchSpeak(
    [
      '开始批量播放',
      '123456',
      '欢迎使用百度语音',
      '重(chong2)量这个是多音字示例',
    ],
    // 更多输入参数请参考百度文档 https://ai.baidu.com/ai-doc/SPEECH/Pk8446an5
    {
      PARAM_SPEAKER: '1',
    },
    status => {
      console.log('batchSpeak --> ', status);
    },
);

API

语音识别

Methods

BaiduAsr.init(options: InitOptions)

初始化百度语音引擎

BaiduAsr.start(options: AsrOptions)

开始语音识别

BaiduAsr.stop()

暂停录音，SDK不会再识别停止后的录音。

BaiduAsr.cancel()

取消录音，SDK会取消本次识别，回到原始状态。

BaiduAsr.release()

释放资源，下次需要再次使用的话必须再调用init方法初始化引擎。

Events

识别结果回调数据有一个统一格式的，类似与api接口返回一样，有code，msg，data。

IBaseData数据类型如下：

interface IBaseData<T = any> {
  /**
   * 状态码
   */
  code: StatusCode,
  /**
   * 消息
   */
  msg: string,
  /**
   * 数据
   */
  data: T
}

addResultListener(callback: (data: IBaseData<RecognizerResultData | undefined>) => void): EmitterSubscription
语音识别结果回调，在语音识别时会不断触发该事件，data 为 IBaseData<RecognizerResultData | undefined> 类型，其值：
- code：状态码
- msg：消息
- data：识别数据

其中data数据类型如下：

interface RecognizerResultData {
  best_result: string,
  // 如无意外 取第一个值就是识别结果
  results_recognition: Array<string>,
  result_type: ResultType,
  origin_result: {
    corpus_no: number,
    err_no: number,
    raf: number,
    result: {
      word: Array<string>
    },
    sn: string
  },
  error: number,
  desc: string
}

addErrorListener(callback: (data: IBaseData<RecognizerResultError>) => void): EmitterSubscription
语音识别出现错误，错误信息与百度语音文档保持一致，其值：
- code：状态码
- msg：消息
- data：错误数据

其中data数据类型如下：

interface RecognizerResultError {
  errorCode: number // 错误码对照百度语音文档 https://ai.baidu.com/ai-doc/SPEECH/qk38lxh1q
  subErrorCode: number
  descMessage: string
}

addAsrVolumeListener(listener: (volume: VolumeData) => void): EmitterSubscription
语音识别的音量大小，当识别的语音改变音量时会触发该事件，volume 为 VolumeData 类型，其值：
- volumePercent: 当前音量百分比
- volume: 当前音量大小

语音唤醒

Methods

BaiduWakeUp.init(options: InitOptions)

初始化百度语音引擎

BaiduWakeUp.start(options: WakeUpOptions)

开始语音唤醒

BaiduWakeUp.stop()

结束语音唤醒。

BaiduWakeUp.release()

释放资源，下次需要再次使用的话必须再调用init方法初始化引擎。

Events

唤醒结果回调数据有一个统一格式的，类似与api接口返回一样，有code，msg，data。

IBaseData数据类型如下：

interface IBaseData<T = any> {
  /**
   * 状态码
   */
  code: StatusCode,
  /**
   * 消息
   */
  msg: string,
  /**
   * 数据
   */
  data: T
}

addResultListener(callback: (data: IBaseData<string | undefined>) => void): EmitterSubscription
语音唤醒结果回调，data 为 IBaseData<string | undefined> 类型，其值：
- code：状态码
- msg：消息
- data：唤醒词
addErrorListener(callback: (data: IBaseData<WakeUpResultError>) => void): EmitterSubscription
语音唤醒出现错误，错误信息与百度语音文档保持一致，其值：
- code：状态码
- msg：消息
- data：错误数据

其中data数据类型如下：

interface WakeUpResultError {
  // 错误码 可以对照百度语音文档查找错误码 https://ai.baidu.com/ai-doc/SPEECH/qk38lxh1q#%E5%94%A4%E9%86%92%E9%94%99%E8%AF%AF%E7%A0%81
  errorCode: number,
  // 错误消息
  errorMessage: string,
  // 百度语音返回的原初错误数据
  result: string
}

语音合成

Methods

BaiduSynthesizer.initialTts(options?: ITtsOptions)

初始化百度语音合成引擎

BaiduSynthesizer.speak(text: string, options?: ITtsOptions, callback?: (status: number) => void)

合成并播放

BaiduSynthesizer.batchSpeak(textArray: string[], options?: ITtsOptions, callback?: (status: number) => void)

批量播放。

BaiduSynthesizer.pause(callback?: (status: number) => void)

暂停播放。仅调用speak后生效

BaiduSynthesizer.resume(callback?: (status: number) => void)

继续播放。仅调用speak后生效，调用pause生效

BaiduSynthesizer.stop(callback?: (status: number) => void)

停止合成引擎。即停止播放，合成，清空内部合成队列。

BaiduSynthesizer.release()

释放资源。下次需要再次使用的话必须再调用initialTts方法初始化引擎

Events

回调数据有一个统一格式的，类似与api接口返回一样，有code，msg，data。

SynthesizerData数据类型如下：

interface SynthesizerData<T = any> {
  /**
   * 状态码
   */
  code: SynthesizerStatusCode,
  /**
   * 消息
   */
  msg: string,
  /**
   * 数据
   */
  data: T
}

addResultListener(callback: (data: SynthesizerData<SynthesizerResultData | string | undefined>) => void): EmitterSubscription
合成结果回调，data 为 SynthesizerData<SynthesizerResultData | string | undefined> 类型，其值：
- code：状态码
- msg：消息
- data：回调数据

其中SynthesizerResultData数据类型如下：

// 合成过程中有很多种状态 从初始化开始 到 合成 到播放结束 所以data其实是不定的
interface RecognizerResultData {
  // 话语id
  utteranceId?: string
  // 合成进度或者播放进度
  progress?: number
}

addErrorListener(callback: (data: SynthesizerData<SynthesizerResultError>) => void): EmitterSubscription
语音合成出现错误，错误信息与百度语音文档保持一致，其值：
- code：状态码
- msg：消息
- data：错误数据

其中data数据类型如下：

interface SynthesizerResultError {
  // 话语id
  utteranceId: string
  // 错误码 详细查看百度文档 https://ai.baidu.com/ai-doc/SPEECH/qk844cpcs
  code: number
  // 错误描述
  description: string
}

减少apk体积

如果直接接入的话，你会发现apk包体积会瞬间暴增了10几兆，这是因为现在有 5个架构目录：armeabi，armeabi-v7a，arm64-v8a，x86，x86_64

而且语音识别与语音唤醒都要有，还有语音合成，所以每个架构都的so文件都要保留，但是没必要每个架构都有的其实，现在国内应用市场是仍然需要上传32位架构的apk，但是Google市场早就要求上传64位了，国内小米，oppo，vivo也说开始联手强制开发者以后必须且只能上传64位结构的apk。安卓APP升级64位架构的相关通知。

所以目前我建议是分开架构打包，32位和64位分开打包，这样可以减少包体积，但是注意如果你接入了其他sdk，那么也要保证有对应架构的so文件。

具体操作可以参考example的build.gradle

如果这样还是有用户对apk体积有比较高的要求的话，后面版本可能会考虑用户自行导入所需so库，例如你只需要语音识别，其他都不需要，那么有一些so文件是不用导入的。

Contribute

期待提出有关建议，欢迎做出贡献，感谢star。

Github

鸣谢

本库使用create-react-native-module创建

create-react-native-module --native-package-id cn.beemango.baidu.asr  --author-name DengWeibin --author-email dengweibin@beemango.cn --github-account gdoudeng --generate-example BaiduAsr

License

MIT License

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README-zh.md

README-zh.md

react-native-baidu-asr

预览

支持平台

安装

使用

API

语音识别

Methods

Events

语音唤醒

Methods

Events

语音合成

Methods

Events

减少apk体积

Contribute

鸣谢

License

Files

README-zh.md

Latest commit

History

README-zh.md

File metadata and controls

react-native-baidu-asr

预览

支持平台

安装

使用

API

语音识别

Methods

Events

语音唤醒

Methods

Events

语音合成

Methods

Events

减少apk体积

Contribute

鸣谢

License