杭州中雨29℃-17℃ 下载APP 我要投稿

西湖法院来了位新“同事” 人说出的话立刻转成文字 

2016-06-14 11:30

最近,有一个“机器人”出现在了西湖法院的法庭里,它的听力特别好,你说的每一句话,哪怕一个语气词,只要被它听到了,几乎都可以准确无误的把它变成文字,输进电脑。

昨天,钱报记者也专门到西湖法院对这个“机器人”进行了一场大考,测试结果,除了外语和方言不太好之外,听起普通话来,它毫不费力。

只要人听得懂的话

“机器人”听起来几乎毫不费力

这个“机器人”可能不像很多人想象中的那样,有一个又萌又可爱的外形,它其实是一个运用软件,名字叫做“浙江高院智能语音识别系统”,内置在电脑里,通过连接的话筒,可以把你说的话,瞬间变成文字。

“开始了吗?我现在可以说话了没?……”在西湖区人民法院网上法庭里,钱报记者坐在审判长的位置上,想试一试这个“机器人”到底有多聪明,没想到,就这两句询问工作人员的话,立即被准确无误地转化成了文字,显示在电脑屏幕前,而法庭两侧的大屏幕上,显示的文字也被同步投影。

一瞬间,记者有一种不敢随便开口的小尴尬,现场的技术人员说,只要系统一开,所说的每一个字都会被即时转化成文字,哪怕只是“嗯,啊,哦……”这样的语气词,也都逃不过“机器人”灵敏的耳朵。

在整个法庭当中,一共安装了四台只能语音识别设备,审判长,原告,被告等各个不同的身份座位前,都有一台电脑和一个话筒,在不同的座位前说的话,输出的文字,都会显示在相对应的角色下。

钱报记者也不断考验着“机器人”的智慧,念了很多段风格迥异的文字,不断的加快语速,放慢语速,变调发音,甚至含糊之词,总体来说,识别的准确率相当高,一段500字的文字,只错了3个字。记者还念了苏轼的《水调歌头·明月几时有》,除了标点和断句略微有些问题,文字基本没有错误。

记者发现,语音的识别几乎可以做到实时状态,完全没有时间上的滞后,在发音清晰的情况下,哪怕语速加到很快,“机器人”还是可以轻易的听懂你的意思,并且准确的将文字转换出来,哪怕记者故意将普通话的发音调整成不标准的“杭普话”状态,识别度也都还不错,“机器人”会自动结合上下文的意思,对内容的准确率进行修正。

不过,在发音含糊不清的状况下,“机器人”的识别度就会有所下降。“一般来说,如果说的话,人听起来没问题,系统都是可以准确识别的,但是如果人听起来都有困难,机器的识别度也会下降。”技术人员说。

外语,方言,数字

是“机器人”的软肋

记者继续不遗余力地考验着“机器人”,甚至使出了杀手锏,请了工作人员用温州话念了一段文字,终于,“机器人”奔溃了,显示出了一段完全风马牛不相及的文字。

技术人员告诉记者,目前,语音识别系统主要还是以识别普通话为主,对于外语,以及方言的识别还是有一些难度的,不过,接下来,像杭州话,广东话这些应用场景比较广泛的方言,也都会慢慢地加入到“机器人”大脑里。

除了外语和方言目前还没有学好之外,“机器人”还有什么别的软肋吗?

在试验中,记者发现,在人名的识别上,机器人常常会犯懵,主要是因为人名都是随机组成的文字,没有固定的词库可以参考,所以经常会出来一些同样发音,但是不同写法的字体,工作人员说,一般来说,在庭审中,如果涉及到人名,都会提前进行录入,这样就可以准确显示了。

数字也是“机器人”的一个痛处,如果听到一连串的数字,它还不能把他们转化成阿拉伯数字和数字符号来显示,只能是一五一十地按照中文文字的方式将它们显示出来。因为不精通外语和数字,所以对于一些包含了字母和数字的车牌号码,会常常让“机器人”栽跟头。

“我听清楚了。”“请问你听清楚了吗?”出现这种答案在前,问题在后的情况,有时候,是因为法官和被告同时在话筒前讲话造成的,一旦遇到抢话的情况,有时候“机器人”就会一时反映不过来,就会有这样小小的尴尬。

西湖区人民法院副院长陈辽敏告诉记者,现阶段,在庭审中,虽然有语音识别系统在自动进行记录,不过,书记员还会在一旁“监控”着,一旦出现一些小的问题,会及时进行人工的完善和调整,不过,接下来,随着识别率的不断提升,就可以完全脱离人工监控了。

接下去

更多法院都将使用“智能语音识别系统”

浙江高院从今年5月开始,率先利用智能语音识别系统,来进行庭审的文字笔录,这在全国都是非常领先的。这样一来,不但书记员的工作压力小了,也可以方便二审法官了解一审庭审情况。

目前,主要是在西湖法院和上城法院进行试点,接下去,还将陆续在更多的法院进行推广使用。

西湖法院法官林阳说:“之前庭审笔录经过书记员的理解、归纳,或多或少会存在偏差,而现在能够原原本本记录发言人的意思。作为法官,能更好地把握当事人的情绪及意向,有利于之后的调解工作或者判决书的攥写。”

根据西湖法院之前通过智能语音识别系统将庭审语音同步转化为文字生成庭审笔录的两起案件来看,准确率分别达到96.2%和97.7%。“现在,最低的准确度也在90%以上,最高的时候,准确率可以达到99%。”技术人员说。

“除庭审记录外,我们将在12368司法服务热线、调解、合议、审委会等更多领域试用语音识别记录。”浙江高院审判管理处处长姚海涛说,对语音识别出的文字,可以进行高频词分析、内容检索、知识挖掘等,充分发挥大数据的价值。

据浙江24小时

最新评论(8)

暂无内容!

点击加载更多…

热门新闻

0/0