GA T 1590-2019 警务智能语音服务平台技术要求.pdf

上传人:ownview251 文档编号:1498491 上传时间:2021-02-13 格式:PDF 页数:9 大小:514.39KB
下载 相关 举报
GA T 1590-2019 警务智能语音服务平台技术要求.pdf_第1页
第1页 / 共9页
GA T 1590-2019 警务智能语音服务平台技术要求.pdf_第2页
第2页 / 共9页
GA T 1590-2019 警务智能语音服务平台技术要求.pdf_第3页
第3页 / 共9页
GA T 1590-2019 警务智能语音服务平台技术要求.pdf_第4页
第4页 / 共9页
GA T 1590-2019 警务智能语音服务平台技术要求.pdf_第5页
第5页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 35.240.99 A 90 GA 中华人民共和国 公共安全 行业标准 GA/T XXXXX XXXX 警务智能语音服务平台技术 要求 Technical requirements for intelligent voice service platform for the police 点击此处添加与国际标准一致性程度的标识 ( 报批稿 ) XXXX - XX - XX 发布 XXXX - XX - XX 实施 中华人民共和国公安部 发布 GA/T XXXXX XXXX I 前 言 本标准按照 GB/T 1.1-2009给出的规则起草。 本标准由 安徽省公安厅提出。 本标准 由公安部

2、计算机与信息处理标准化技术委员会归口。 本标准起草单位: 智能语音技术公安部重点实验室 、安徽省公安厅、 讯飞智元信息科技有限公司 、 合肥市公安局、公安部第三研究所、公安部第一研究所、 苏州思必驰信息科技有限公司 。 本标准主要起草人: 祝占魁 、冯祥 、 刘琼 、胡先锋 、刘磊、查飞 、戎玲、孔耀晖 、 周伟达 、李伟 、 李磊、 吴波 、王伟 、 储明丽、吴鹏、程彪、刘韫韬 、余洪祥 、 游寒旭 。 GA/T XXXXX XXXX 1 警务智能语音服务平台 技术 要求 1 范围 本标准规定了警务智能语音服务平台 功能 要求 、 性能要求 和服务要求 。 本标准适用于 警务 智能语音服务平

3、台 设计、建设和 应 用 。 2 规范性引用文件 下列文件对于本 标准 的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 21023-2007 中文语音识别系统通用技术规范 GB/T 34083-2017 中文语音识别互联网服务接口规范 GB/T 34145-2017 中文语音合成互联网服务接口规范 GA/T XXXXX-XXXX 警务智能语音服务平台接口 规范 3 术语和定义 GB/T 34083-2017、 GB/T 34145-2017界定的以及下列术语和定义适用于本 文件 。 3.1

4、语音合成 text to speech 将给 定的文本转换成 对应 的 语音的过程 。 3.2 语音识别 speech recognition 将人类的 语音 信号转化为文字或者指令的过程。 3.3 有效语音 useful speech 语音采集过程中所关注、期望的语音信号。 3.4 干扰声 interfering sound 语音采集过程中,采集到的由非目标语音信号源发出的,能干扰、影响对目标语音信号的识别、理 解或处理的声学信号 。 3.5 GA/T XXXXX XXXX 2 截幅 clipping 音频信号幅度超过采样值所能表示的最大范围。 3.6 端点检测 endpoint detec

5、tion 对待识别音频进行 检测 ,分离出有效语音 。 4 平台功 能要求 4.1 平台功能构成 平台 应 包含 语音识别、语音合成、 文本 处理 等服务 组件 , 并 具备 对 平台 服务 支撑 、管理和 运行 监控 等功能 。 4.2 语音识别 服务 4.2.1 一般 要求 语音识别 服务应 能实现 下列功能 : a) 连续 语音 识别 ; b) 命令字识别; c) 录音文件语音识别; d) 多语种 语音识别, 一般包括 汉语、 英语 和 维吾尔语 、蒙语、藏语 等 多民族语言 ; e) 多 方言语音识别, 一般包括 四川 话 、广东 话 、东北 话 、河南 话 、上海 话 等 ; f)

6、针对特定 语种、 方言进行模型定制; g) 对待识 别音频的 有效语音进行前后端点检测,从连续音频流中分离出有效语音; h) 对待识别 的 音频进行 干扰声 抑制,提高 语音识别 准确 率; i) 对待识别音频的截幅、背景 干扰声 、有效时长进行检测; j) 对识别结果文本 产生 时间标签 。 4.2.2 专业 要求 除一般要求外,语音识别 服 务 还应 依据 不同 地区 、 不同 警种 对警务 工作 的实际需求,提供 以下功能: a) 用户自定义 警务热词,并在语音识别中生效 ; b) 通用要素 词汇 的 语音 识别优化和 个性化要素词汇的 语音识别扩展; c) 根据上下文语义,针对 当前

7、转写的句子内容进行修正; d) 支持 文书 、 笔录等 警务 文本资料导入 , 并利用 导入的文本资料对模型进行训练 和 优化。 4.3 语音合成 服务 语音合成 服务应 能实现 下列功能 : a) 多语种语音合成, 一般包括 汉语、英语 和 维吾尔语 、蒙语、藏语等多民族语言 ; b) 多 方言语音合成 , 一般包括 四川 话 、广东 话 、东北 话 、河南 话 、上海 话 等 ; c) 多音色语音合成, 一般包括 青年男声、青年女声 、 童声 等 , 支持定制个性化 音色 语音合成; d) 多种字符编码格式的文本语音合成,包括但不限于 UTF-8、 UTF-16、 GBK、 Unicode

8、、 ASCII等; e) 按照 用户指定的文本分词方式 或发音方式 进行语音合成 。 GA/T XXXXX XXXX 3 4.4 文本 处理 服务 文本 处理服务 应能实现 下列功能 : a) 从文本中 提取 警务要素 , 对照 相应的 标准化 要素信息库进行比对修正 ; b) 对符合预设句式 的警务 文本 语义 进行 抽取和 结构化 处理,并解析成计算机指令。 4.5 服务支撑 平台 服务支撑 应能 实现下列功能: a) 面向 Windows、 Linux、 Android等主流的操作系统 ,提供 软件开发工具包 ; b) 支持 在 个人计算机、智能手机、车载设备、可穿戴设备等多类型终端 上

9、使用 ; c) 支持 用户 体验 各类服务的应用效果 。 4.6 服务 管理 平台服务管理 应能实现下列功能: a) 对 用户 进行 管理, 支持 用户信息 新增 、 修改 和 删除 等操作 ; b) 支持 对用户网络地址 进行授权 ,允许 限制其访问权限 ; c) 对 服务进行分类 授权 , 支持 限制 其访问 服务类型、访问次数、使用期限 ; d) 支持 对 警务 终端 进行 授权 , 并对 其 访问权限进行管理 ; e) 对服务进行认证鉴权, 符合 用户 身份认证体系要求 。 4.7 运行监控 平台服务 运行监控 应能实现下列功能: a) 支持对 各 服务 组件 全生命周期 的 运行 状

10、 态 进行监控 管理 ; b) 支持 对服务 访问次数 、 终端 访问 总量 、 授权终端 数量 和用户使用总量等 指标 进行统计 。 5 平台 性能 要求 5.1 概述 语音识别性能主要 通过 语音端点检测正确率、语音识别正确率和 语音识别平均响应时间 等指标 进行 评价; 语音合成性能主要通过语音合成质量 进行 评价。 5.2 性能 评价项 5.2.1 语音端点检测正确率 一段音频中 每一帧 被标注 为语音 帧 或静音 帧 的正确率 , 当 语音 帧 或静音 帧 的 标注 结果 和判断结果相 一致时,则该帧分类正确。 语音端点检测正确率的计算方法见式( 1)。 CRVAD=CVAD/SVA

11、D 100% . ( 1) 式中: CRVAD 语 音端点检测正确率 ; CVAD 对于 该段 音频, 分类正确 的帧数 ; SVAD 音频 总帧数 。 GA/T XXXXX XXXX 4 5.2.2 语音识别 准 确率 语音识别 准 确率采用字准确率进行度量。字准确率的计算应 符合 GB/T 21023-2007中 5.2.1的要求。 5.2.3 语音识别平均 响应时间 语音识别平均响应时间 的计算应 符合 GB/T 21023-2007中 5.3的要求。 5.2.4 语音合成质量 语音合成质量 通过对 合成语音同真人语音在音质 和自然度等方面的差异进行主观评测 , 采用平均意 见得分 进行

12、计算。 主观 评测 标准见表 1。 表 1 主观 评测 标准 评分 测听效果 5 优秀, 语音自然, 音 色 接近 真实 4 较好, 仅能察觉若干不自然 3 尚可,能察觉到不自然但可以接受,评分分界线 2 较差,明显察觉不自然并不愿意接受 1 极差,无法接受 5.3 性能评价 要求 按照 5.2给出的评价项 ,根据各业务警种工作需要, 挑选 不低于 1000条 语料 形成 测试集 , 对平台性 能进行评价 。 平台性能指标要求 见 表 2。 表 2 平台性能评价 要求 语言类型 评价项 语音端点检测正确率 语音识别准确率 语音识别平均响应时间 语音合成质量 汉 语 普通话 90% 80% 2s

13、 4 分 四川 话 、广东 话 、东北 话 、 河南 话 、 上海 话 90% 80% 2s 3.5 分 维吾尔语 90% 80% 2s 3.5 分 蒙 语 90% 80% 2s 3.5 分 藏语 90% 80% 2s 3.5 分 英 语 90% 80% 2s 4 分 6 平台服务要求 6.1 平台 服务流程 平台面向警务应用提供基于网络的警务智能语音服务,各警种依据自身业务 特征 按需 调用平台服务 接口,实现语音识别、语音合成和文本处理等 功能 。 6.2 平台 数据 输入 GA/T XXXXX XXXX 5 用户在平台输入的数据包括语音数据和文本数据,其中: a) 语音数据 :各业务警种 在语音采集端以 说话 的形式输入语音, 或在平台上输入录音文件; b) 文本数据 :各业务警种在 平台上输入 文书、笔录等警务文本资料 。 6.3 平台服务接口 用户可通过网络调用平台服务接口,包括语音识别服务接口、语音合成服务接口和文本处理服务接 口。各 服务接口 要求应 符合 GA/T XXXXX XXXX的要求 。 6.4 平台服务输出 平台 将 语音识别、语音合成和文本处理结果返回至 应用系统 。 _

展开阅读全文
相关资源
猜你喜欢
  • NEN 10695-2-2-1994 Fire hazard testing Part 2 Test methods Section 2 Needleflame test(IEC 695-2-2 1991)《695-2-2-1991 着火危险试验 第2部分:试验方法 第2节:针焰试验》.pdf NEN 10695-2-2-1994 Fire hazard testing Part 2 Test methods Section 2 Needleflame test(IEC 695-2-2 1991)《695-2-2-1991 着火危险试验 第2部分:试验方法 第2节:针焰试验》.pdf
  • NEN 1070-1986 Supplement to NEN 1070 - Noise control in dwellings《NEN 1070的增补件 住宅内的噪声控制》.pdf NEN 1070-1986 Supplement to NEN 1070 - Noise control in dwellings《NEN 1070的增补件 住宅内的噪声控制》.pdf
  • NEN 10721-3-2-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 2 Transportation (IEC 721-3-2.pdf NEN 10721-3-2-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 2 Transportation (IEC 721-3-2.pdf
  • NEN 10721-3-4-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 4 Stationary use at non-weath1)《I.pdf NEN 10721-3-4-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 4 Stationary use at non-weath1)《I.pdf
  • NEN 10721-3-5-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 5 Ground vehicle installation+A.pdf NEN 10721-3-5-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 5 Ground vehicle installation+A.pdf
  • NEN 10721-3-6-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 6 Ship environment(IEC 721-3-件.pdf NEN 10721-3-6-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 6 Ship environment(IEC 721-3-件.pdf
  • NEN 10721-3-7-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 7 Portable and non-stationary87+A.pdf NEN 10721-3-7-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 7 Portable and non-stationary87+A.pdf
  • NEN 10721-3-9-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 9 Microclimates inside produc.pdf NEN 10721-3-9-1994 Classification of environmental conditions Part 3 Classification of groups of environmental parameters and their severities Section 9 Microclimates inside produc.pdf
  • NEN 10730-2-4-1993 Automatic electrical controls for household and similar use Part 2 Particular requirements for thermal motor protectors for motor-compressors of hermetic and semEC .pdf NEN 10730-2-4-1993 Automatic electrical controls for household and similar use Part 2 Particular requirements for thermal motor protectors for motor-compressors of hermetic and semEC .pdf
  • 相关搜索
    资源标签

    当前位置:首页 > 标准规范 > 行业标准 > GA公共安全

    copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
    备案/许可证编号:苏ICP备17064731号-1