ImageVerifierCode 换一换
格式:PDF , 页数:9 ,大小:514.39KB ,
资源ID:1498491      下载积分:5000 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
如需开发票,请勿充值!快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
注意:如需开发票,请勿充值!
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【http://www.mydoc123.com/d-1498491.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(GA T 1590-2019 警务智能语音服务平台技术要求.pdf)为本站会员(ownview251)主动上传,麦多课文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文库(发送邮件至master@mydoc123.com或直接QQ联系客服),我们立即给予删除!

GA T 1590-2019 警务智能语音服务平台技术要求.pdf

1、ICS 35.240.99 A 90 GA 中华人民共和国 公共安全 行业标准 GA/T XXXXX XXXX 警务智能语音服务平台技术 要求 Technical requirements for intelligent voice service platform for the police 点击此处添加与国际标准一致性程度的标识 ( 报批稿 ) XXXX - XX - XX 发布 XXXX - XX - XX 实施 中华人民共和国公安部 发布 GA/T XXXXX XXXX I 前 言 本标准按照 GB/T 1.1-2009给出的规则起草。 本标准由 安徽省公安厅提出。 本标准 由公安部

2、计算机与信息处理标准化技术委员会归口。 本标准起草单位: 智能语音技术公安部重点实验室 、安徽省公安厅、 讯飞智元信息科技有限公司 、 合肥市公安局、公安部第三研究所、公安部第一研究所、 苏州思必驰信息科技有限公司 。 本标准主要起草人: 祝占魁 、冯祥 、 刘琼 、胡先锋 、刘磊、查飞 、戎玲、孔耀晖 、 周伟达 、李伟 、 李磊、 吴波 、王伟 、 储明丽、吴鹏、程彪、刘韫韬 、余洪祥 、 游寒旭 。 GA/T XXXXX XXXX 1 警务智能语音服务平台 技术 要求 1 范围 本标准规定了警务智能语音服务平台 功能 要求 、 性能要求 和服务要求 。 本标准适用于 警务 智能语音服务平

3、台 设计、建设和 应 用 。 2 规范性引用文件 下列文件对于本 标准 的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 21023-2007 中文语音识别系统通用技术规范 GB/T 34083-2017 中文语音识别互联网服务接口规范 GB/T 34145-2017 中文语音合成互联网服务接口规范 GA/T XXXXX-XXXX 警务智能语音服务平台接口 规范 3 术语和定义 GB/T 34083-2017、 GB/T 34145-2017界定的以及下列术语和定义适用于本 文件 。 3.1

4、语音合成 text to speech 将给 定的文本转换成 对应 的 语音的过程 。 3.2 语音识别 speech recognition 将人类的 语音 信号转化为文字或者指令的过程。 3.3 有效语音 useful speech 语音采集过程中所关注、期望的语音信号。 3.4 干扰声 interfering sound 语音采集过程中,采集到的由非目标语音信号源发出的,能干扰、影响对目标语音信号的识别、理 解或处理的声学信号 。 3.5 GA/T XXXXX XXXX 2 截幅 clipping 音频信号幅度超过采样值所能表示的最大范围。 3.6 端点检测 endpoint detec

5、tion 对待识别音频进行 检测 ,分离出有效语音 。 4 平台功 能要求 4.1 平台功能构成 平台 应 包含 语音识别、语音合成、 文本 处理 等服务 组件 , 并 具备 对 平台 服务 支撑 、管理和 运行 监控 等功能 。 4.2 语音识别 服务 4.2.1 一般 要求 语音识别 服务应 能实现 下列功能 : a) 连续 语音 识别 ; b) 命令字识别; c) 录音文件语音识别; d) 多语种 语音识别, 一般包括 汉语、 英语 和 维吾尔语 、蒙语、藏语 等 多民族语言 ; e) 多 方言语音识别, 一般包括 四川 话 、广东 话 、东北 话 、河南 话 、上海 话 等 ; f)

6、针对特定 语种、 方言进行模型定制; g) 对待识 别音频的 有效语音进行前后端点检测,从连续音频流中分离出有效语音; h) 对待识别 的 音频进行 干扰声 抑制,提高 语音识别 准确 率; i) 对待识别音频的截幅、背景 干扰声 、有效时长进行检测; j) 对识别结果文本 产生 时间标签 。 4.2.2 专业 要求 除一般要求外,语音识别 服 务 还应 依据 不同 地区 、 不同 警种 对警务 工作 的实际需求,提供 以下功能: a) 用户自定义 警务热词,并在语音识别中生效 ; b) 通用要素 词汇 的 语音 识别优化和 个性化要素词汇的 语音识别扩展; c) 根据上下文语义,针对 当前

7、转写的句子内容进行修正; d) 支持 文书 、 笔录等 警务 文本资料导入 , 并利用 导入的文本资料对模型进行训练 和 优化。 4.3 语音合成 服务 语音合成 服务应 能实现 下列功能 : a) 多语种语音合成, 一般包括 汉语、英语 和 维吾尔语 、蒙语、藏语等多民族语言 ; b) 多 方言语音合成 , 一般包括 四川 话 、广东 话 、东北 话 、河南 话 、上海 话 等 ; c) 多音色语音合成, 一般包括 青年男声、青年女声 、 童声 等 , 支持定制个性化 音色 语音合成; d) 多种字符编码格式的文本语音合成,包括但不限于 UTF-8、 UTF-16、 GBK、 Unicode

8、、 ASCII等; e) 按照 用户指定的文本分词方式 或发音方式 进行语音合成 。 GA/T XXXXX XXXX 3 4.4 文本 处理 服务 文本 处理服务 应能实现 下列功能 : a) 从文本中 提取 警务要素 , 对照 相应的 标准化 要素信息库进行比对修正 ; b) 对符合预设句式 的警务 文本 语义 进行 抽取和 结构化 处理,并解析成计算机指令。 4.5 服务支撑 平台 服务支撑 应能 实现下列功能: a) 面向 Windows、 Linux、 Android等主流的操作系统 ,提供 软件开发工具包 ; b) 支持 在 个人计算机、智能手机、车载设备、可穿戴设备等多类型终端 上

9、使用 ; c) 支持 用户 体验 各类服务的应用效果 。 4.6 服务 管理 平台服务管理 应能实现下列功能: a) 对 用户 进行 管理, 支持 用户信息 新增 、 修改 和 删除 等操作 ; b) 支持 对用户网络地址 进行授权 ,允许 限制其访问权限 ; c) 对 服务进行分类 授权 , 支持 限制 其访问 服务类型、访问次数、使用期限 ; d) 支持 对 警务 终端 进行 授权 , 并对 其 访问权限进行管理 ; e) 对服务进行认证鉴权, 符合 用户 身份认证体系要求 。 4.7 运行监控 平台服务 运行监控 应能实现下列功能: a) 支持对 各 服务 组件 全生命周期 的 运行 状

10、 态 进行监控 管理 ; b) 支持 对服务 访问次数 、 终端 访问 总量 、 授权终端 数量 和用户使用总量等 指标 进行统计 。 5 平台 性能 要求 5.1 概述 语音识别性能主要 通过 语音端点检测正确率、语音识别正确率和 语音识别平均响应时间 等指标 进行 评价; 语音合成性能主要通过语音合成质量 进行 评价。 5.2 性能 评价项 5.2.1 语音端点检测正确率 一段音频中 每一帧 被标注 为语音 帧 或静音 帧 的正确率 , 当 语音 帧 或静音 帧 的 标注 结果 和判断结果相 一致时,则该帧分类正确。 语音端点检测正确率的计算方法见式( 1)。 CRVAD=CVAD/SVA

11、D 100% . ( 1) 式中: CRVAD 语 音端点检测正确率 ; CVAD 对于 该段 音频, 分类正确 的帧数 ; SVAD 音频 总帧数 。 GA/T XXXXX XXXX 4 5.2.2 语音识别 准 确率 语音识别 准 确率采用字准确率进行度量。字准确率的计算应 符合 GB/T 21023-2007中 5.2.1的要求。 5.2.3 语音识别平均 响应时间 语音识别平均响应时间 的计算应 符合 GB/T 21023-2007中 5.3的要求。 5.2.4 语音合成质量 语音合成质量 通过对 合成语音同真人语音在音质 和自然度等方面的差异进行主观评测 , 采用平均意 见得分 进行

12、计算。 主观 评测 标准见表 1。 表 1 主观 评测 标准 评分 测听效果 5 优秀, 语音自然, 音 色 接近 真实 4 较好, 仅能察觉若干不自然 3 尚可,能察觉到不自然但可以接受,评分分界线 2 较差,明显察觉不自然并不愿意接受 1 极差,无法接受 5.3 性能评价 要求 按照 5.2给出的评价项 ,根据各业务警种工作需要, 挑选 不低于 1000条 语料 形成 测试集 , 对平台性 能进行评价 。 平台性能指标要求 见 表 2。 表 2 平台性能评价 要求 语言类型 评价项 语音端点检测正确率 语音识别准确率 语音识别平均响应时间 语音合成质量 汉 语 普通话 90% 80% 2s

13、 4 分 四川 话 、广东 话 、东北 话 、 河南 话 、 上海 话 90% 80% 2s 3.5 分 维吾尔语 90% 80% 2s 3.5 分 蒙 语 90% 80% 2s 3.5 分 藏语 90% 80% 2s 3.5 分 英 语 90% 80% 2s 4 分 6 平台服务要求 6.1 平台 服务流程 平台面向警务应用提供基于网络的警务智能语音服务,各警种依据自身业务 特征 按需 调用平台服务 接口,实现语音识别、语音合成和文本处理等 功能 。 6.2 平台 数据 输入 GA/T XXXXX XXXX 5 用户在平台输入的数据包括语音数据和文本数据,其中: a) 语音数据 :各业务警种 在语音采集端以 说话 的形式输入语音, 或在平台上输入录音文件; b) 文本数据 :各业务警种在 平台上输入 文书、笔录等警务文本资料 。 6.3 平台服务接口 用户可通过网络调用平台服务接口,包括语音识别服务接口、语音合成服务接口和文本处理服务接 口。各 服务接口 要求应 符合 GA/T XXXXX XXXX的要求 。 6.4 平台服务输出 平台 将 语音识别、语音合成和文本处理结果返回至 应用系统 。 _

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1