这是一个用于批量对比ASR(自动语音识别)转写结果与标准文本之间字准确率的Python工具。
系统支持:Win10/11,x86-64
功能特性:
- 批量导入ASR转写结果文档和标准标注文档
- 通过拖拽方式建立ASR结果和标注文件的一一对应关系
- 自动计算字准确率(Character Accuracy Rate)
- 统计文档字数信息
- 支持导出统计结果为TXT或CSV格式
- 支持多种文本编码(UTF-8、GBK、GB2312、GB18030、ANSI)
- 提供800x600的默认窗口大小,支持窗口最大化
- 新增:基于jieba分词的中文文本预处理
- 新增:精确的中文字符位置定位和错误分析
- 新增:中文文本标准化处理(全/半角转换、数字统一等)
- 新增:语气词过滤功能,可选择是否将"嗯"、"啊"等语气词计入CER计算
- 新增:优化的用户界面布局,更大的结果展示区域
Full Changelog: https://github.com/wangminle/cer-matchingtools/commits/win-v0.1.0