Android 百度语音识别(详细步骤+源码)

avatar
作者
猴君
阅读量:0

改好之后,请注意,每个人都是不一样,你如果发现你创建的应用的配置的值和我创建的是一模一样的,你马上去百度提BUG,他们的程序员要就要下岗了~

OK,现在配置也完成了,接下来就是使用了。

③ 使用


首先是修改

在这里插入图片描述

布局修改的代码如下:

<?xml version="1.0" encoding="utf-8"?>

<LinearLayout xmlns:android=“http://schemas.android.com/apk/res/android”

xmlns:app=“http://schemas.android.com/apk/res-auto”

xmlns:tools=“http://schemas.android.com/tools”

android:orientation=“vertical”

android:gravity=“center”

android:layout_width=“match_parent”

android:layout_height=“match_parent”

tools:context=“.MainActivity”>

<TextView

android:gravity=“center”

android:id=“@+id/tv_txt”

android:padding=“20dp”

android:textColor=“#000”

android:text=“识别到的内容”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”/>

<Button

android:id=“@+id/btn_stop”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”

android:layout_alignParentBottom=“true”

android:text=“停止” />

<Button

android:id=“@+id/btn_start”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”

android:layout_alignParentBottom=“true”

android:text=“开始” />

说道语音识别自然要用到这个麦克风,这个权限是需要动态申请的。

/**

  • android 6.0 以上需要动态申请权限

*/

private void initPermission() {

String permissions[] = {Manifest.permission.RECORD_AUDIO,

Manifest.permission.ACCESS_NETWORK_STATE,

Manifest.permission.INTERNET,

Manifest.permission.WRITE_EXTERNAL_STORAGE

};

ArrayList toApplyList = new ArrayList();

for (String perm : permissions) {

if (PackageManager.PERMISSION_GRANTED != ContextCompat.checkSelfPermission(this, perm)) {

toApplyList.add(perm);

}

}

String tmpList[] = new String[toApplyList.size()];

if (!toApplyList.isEmpty()) {

ActivityCompat.requestPermissions(this, toApplyList.toArray(tmpList), 123);

}

}

/**

  • 权限申请回调,可以作进一步处理

  • @param requestCode

  • @param permissions

  • @param grantResults

*/

@Override

public void onRequestPermissionsResult(int requestCode, String[] permissions, int[] grantResults) {

// 此处为android 6.0以上动态授权的回调,用户自行实现。

}

得到权限之后就可以进行下一步了,首先是初始化控件以及语音是被的核心SDK

protected TextView txtResult;//识别结果

protected Button startBtn;//开始识别 一直不说话会自动停止,需要再次打开

protected Button stopBtn;//停止识别

private EventManager asr;//语音识别核心库

/**

  • 初始化控件

*/

private void initView() {

txtResult = (TextView) findViewById(R.id.tv_txt);

startBtn = (Button) findViewById(R.id.btn_start);

stopBtn = (Button) findViewById(R.id.btn_stop);

startBtn.setOnClickListener(new View.OnClickListener() {//开始

@Override

public void onClick(View v) {

asr.send(SpeechConstant.ASR_START, “{}”, null, 0, 0);

}

});

stopBtn.setOnClickListener(new View.OnClickListener() {//停止

@Override

public void onClick(View v) {

asr.send(SpeechConstant.ASR_STOP, “{}”, null, 0, 0);

}

});

}

在onCreate方法中调用

在这里插入图片描述

@Override

protected void onCreate(Bundle savedInstanceState) {

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_main);

initView();

initPermission();

//初始化EventManager对象

asr = EventManagerFactory.create(this, “asr”);

//注册自己的输出事件类

asr.registerListener(this); // EventListener 中 onEvent方法

}

同时还需要实现EventListener,注意到这个实现的是百度的,不是自带的。

在这里插入图片描述

实现之后还需要一个回调方法,如下:

/**

  • 自定义输出事件类 EventListener 回调方法

*/

@Override

public void onEvent(String name, String params, byte[] data, int offset, int length) {

if (name.equals(SpeechConstant.CALLBACK_EVENT_ASR_PARTIAL)) {

// 识别相关的结果都在这里

if (params == null || params.isEmpty()) {

return;

}

if (params.contains(““final_result””)) {

// 一句话的最终识别结果

txtResult.setText(params);

}

}

}

最后就是在onDestroy里面关闭和处理

@Override

protected void onDestroy() {

super.onDestroy();

//发送取消事件

asr.send(SpeechConstant.ASR_CANCEL, “{}”, null, 0, 0);

//退出事件管理器

// 必须与registerListener成对出现,否则可能造成内存泄露

asr.unregisterListener(this);

}

可以运行了

在这里插入图片描述

点击开始,然后说 “你好”,识别出结果

在这里插入图片描述

可以看到,识别的结果还是蛮精准的,但是我们要的数据就只有那两个字而已,所以要进行数据的解析了

④ JSON数据解析


通过刚才代码的中大日志打印拿到JSON字符串,将这个字符串转成实体bean.

在这里插入图片描述

转出来的实体bean, 命名为ASRresponse,代码如下:

package com.llw.asrdemo;

import java.util.List;

public class ASRresponse {

/**

  • results_recognition : [“你好,”]

  • result_type : final_result

  • best_result : 你好,

  • origin_result : {“asr_align_begin”:80,“asr_align_end”:130,“corpus_no”:6835867007181645805,“err_no”:0,“raf”:133,“result”:{“word”:[“你好,”]},“sn”:“82d975e0-6eb4-43ac-a0e7-850bb149f28e”}

  • error : 0

*/

private String result_type;

private String best_result;

private OriginResultBean origin_result;

private int error;

private List results_recognition;

public String getResult_type() {

return result_type;

}

public void setResult_type(String result_type) {

this.result_type = result_type;

}

public String getBest_result() {

return best_result;

}

public void setBest_result(String best_result) {

this.best_result = best_result;

}

public OriginResultBean getOrigin_result() {

return origin_result;

}

public void setOrigin_result(OriginResultBean origin_result) {

this.origin_result = origin_result;

}

public int getError() {

return error;

}

public void setError(int error) {

this.error = error;

}

public List getResults_recognition() {

return results_recognition;

}

public void setResults_recognition(List results_recognition) {

this.results_recognition = results_recognition;

}

public static class OriginResultBean {

/**

  • asr_align_begin : 80

  • asr_align_end : 130

  • corpus_no : 6835867007181645805

  • err_no : 0

  • raf : 133

  • result : {“word”:[“你好,”]}

  • sn : 82d975e0-6eb4-43ac-a0e7-850bb149f28e

*/

private int asr_align_begin;

private int asr_align_end;

private long corpus_no;

private int err_no;

private int raf;

private ResultBean result;

private String sn;

public int getAsr_align_begin() {

return asr_align_begin;

}

public void setAsr_align_begin(int asr_align_begin) {

this.asr_align_begin = asr_align_begin;

}

public int getAsr_align_end() {

return asr_align_end;

}

public void setAsr_align_end(int asr_align_end) {

this.asr_align_end = asr_align_end;

}

public long getCorpus_no() {

return corpus_no;

}

public void setCorpus_no(long corpus_no) {

this.corpus_no = corpus_no;

}

public int getErr_no() {

return err_no;

}

public void setErr_no(int err_no) {

this.err_no = err_no;

}

public int getRaf() {

return raf;

}

public void setRaf(int raf) {

this.raf = raf;

}

public ResultBean getResult() {

return result;

}

public void setResult(ResultBean result) {

this.result = result;

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Android工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则近万的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

img

img

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Android开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注:Android)

总结

写到这里也结束了,在文章最后放上一个小小的福利,以下为小编自己在学习过程中整理出的一个关于Flutter的学习思路及方向,从事互联网开发,最主要的是要学好技术,而学习技术是一条慢长而艰苦的道路,不能靠一时激情,也不是熬几天几夜就能学好的,必须养成平时努力学习的习惯,更加需要准确的学习方向达到有效的学习效果。
由于内容较多就只放上一个大概的大纲,需要更及详细的学习思维导图的
还有高级UI、性能优化、架构师课程、NDK、混合式开发(ReactNative+Weex)微信小程序、Flutter全方面的Android进阶实践技术资料,并且还有技术大牛一起讨论交流解决问题。

跨平台开发:Flutter.png

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!

涵盖了95%以上Android开发知识点,真正体系化!**

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注:Android)

总结

写到这里也结束了,在文章最后放上一个小小的福利,以下为小编自己在学习过程中整理出的一个关于Flutter的学习思路及方向,从事互联网开发,最主要的是要学好技术,而学习技术是一条慢长而艰苦的道路,不能靠一时激情,也不是熬几天几夜就能学好的,必须养成平时努力学习的习惯,更加需要准确的学习方向达到有效的学习效果。
由于内容较多就只放上一个大概的大纲,需要更及详细的学习思维导图的
还有高级UI、性能优化、架构师课程、NDK、混合式开发(ReactNative+Weex)微信小程序、Flutter全方面的Android进阶实践技术资料,并且还有技术大牛一起讨论交流解决问题。

[外链图片转存中…(img-uWXLg2Kp-1713151861588)]

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!