Skip to content

cer-matchingtool-v0.1.0

Latest

Choose a tag to compare

@wangminle wangminle released this 18 Apr 08:24
· 14 commits to main since this release

这是一个用于批量对比ASR(自动语音识别)转写结果与标准文本之间字准确率的Python工具。
系统支持:Win10/11,x86-64
功能特性:

  • 批量导入ASR转写结果文档和标准标注文档
  • 通过拖拽方式建立ASR结果和标注文件的一一对应关系
  • 自动计算字准确率(Character Accuracy Rate)
  • 统计文档字数信息
  • 支持导出统计结果为TXT或CSV格式
  • 支持多种文本编码(UTF-8、GBK、GB2312、GB18030、ANSI)
  • 提供800x600的默认窗口大小,支持窗口最大化
  • 新增:基于jieba分词的中文文本预处理
  • 新增:精确的中文字符位置定位和错误分析
  • 新增:中文文本标准化处理(全/半角转换、数字统一等)
  • 新增:语气词过滤功能,可选择是否将"嗯"、"啊"等语气词计入CER计算
  • 新增:优化的用户界面布局,更大的结果展示区域

Full Changelog: https://github.com/wangminle/cer-matchingtools/commits/win-v0.1.0