道客优

1234
轻松离线语音转写、视频加字幕 讯飞智能录音笔SR502评测
2020-12-07 来源:科技氪 阅读:444

对于上班族,以及和我一样的媒体工作者来说,会议记录、采访、参加发布会、语音备忘等场景下,由于获取的语音信息较多,光凭记忆显然记不住,现场录音后再慢慢整理是以前最好的解决办法。而如今,AI技术加持的智能录音笔可以在会议的同时进行录音及转写,大大提升了效率。同时,在人多嘈杂环境下,智能录音笔的录音质量也比我们以往用的手机要好很多。科大讯飞一直是“语音技术”领域的引领者,旗下的智能录音笔也非常好,刚刚发布了新一代讯飞智能录音笔SR502,作为SR501的升级款,在硬件和软件方面都有不小升级。

传统的录音笔只具有记录声音的功能,面对快节奏的办公需求显然效率太低,科大讯飞SR系列智能录音笔,不仅可以做到传统高端录音笔的识别准、录得远、录得清,同时结合AI算法,还能实时将录音转写为文字,大大提高了后期整理的效率。此次SR502在SR501录音、转写功能的基础上,加入了离线转写功能,不需要网络也可以提供语音转写文字的功能,同时还加入了高清摄像头,支持OCR文字提取外,录制的视频还能实时生成字幕,非常方便。

外观升级:科技感十足,酷似高端手机

相比SR501,此次讯飞智能录音笔SR502的外观进行了较大升级,正面采用全玻璃覆盖,屏幕提升到更大的3.5英寸,分辨率是480*800;玻璃盖板的四周分布了6颗阵列麦克,加上顶部的2颗定向麦克,在不同的场景下使用不同的麦克风组合,匹配相应场景的算法,保证录音效果和回放,可以做到15米远距离录音,是录音笔品类中拾音距离最远的产品。

开箱第一次看到讯飞智能录音笔SR502时,就有一种熟悉的高端手机感觉,正面全玻璃盖板很像全面屏。整个机身采用兼顾质感和美感的金属机身,四角是圆润设计,星空灰的配色看起来很高端。

机身的按键布局也和手机类似,右边是电源键和SIM卡槽;左边是录音键和音量加减键,符合日常使用习惯。

机身背部也升级为玻璃背板,带来舒适的手感,左上方配备了一颗800万像素摄像头,可以实现OCR识别和视频拍摄。

底部是Type-C充电口,和当下主流的手机充电一样,不用再单独带充电线。充电口两边是双扬声器,播放录音音质挺不错。电池容量提升到2500mAh,息屏录音可以做到10小时,即使重度使用也足够。

功能再升级:离线转写、OCR识别效率更高

作为智能录音笔,讯飞智能录音笔SR502的系统是基于安卓8.1深度定制,和安卓手机的操作类似;内置全新升级的科大讯飞转写ED引擎,基于端到端的全新语音识别框架,除了纯中文、纯英文模式识别,同时支持中英混合识别场景,以及普通话-部分方言混合识别,实现语种无缝切换。

基于全新一代的转写引擎,SR502除了在线转写外,可实现无网络情况下语音实时转文字。无需4G/WIFI网络,依旧可以进行语音实时转写,离线转写准确率达95%;封闭的会议室和人多的发布会,经常会遇到网络不好的情况,有了离线转写就无惧断网。离线转写后的内容即刻保存,对于高机密内容存在本地更安全,如果想获得更高准确率的转写,在联网后可以进行上传转写。

SR502配备了800万像素摄像头,可以智能提取PPT、EXCEL、图片内的文字信息。办公遇到需要转写的PPT等,一拍就能转写成文字,快速编辑分享。对于办公来说这个可以极大提升效率,比如纸质的资料,一些无法复制的PDF文档等,直接拍照就能转写文字成电子档,后期编辑处理就非常方便了。

用SR502拍摄Vlog、短视频,可以实时生成视频字幕,自动检测普通话和方言、7种外语、以及少数民族语,录制结束后,字幕自动保存,并支持后续编辑。不过由于存储空间限制,目前只能录制5分钟内视,希望后续支持扩展,就能录制更长的记录视频。

顶部的2颗直径10mm定向麦克风+6颗矩阵麦克风,基于讯飞深度定制的Voice Cube 声立方技术,最远拾音距离达15米,对于大型会议、演讲发布会、课堂等场景拾音转写更准确。讯飞的Focus++智能降噪技术,根据场景主动识别人声,同时降低环境音干扰,让拾音更加清晰。

这次基础功能也有所升级,语音转写成文字准确率达98%,保存录音上传云端完成转写,准确率更高。全新升级的A.I.转写引擎, 除了纯中文、纯英文模式识别,更支持中英文混读、普通话与部分方言混读场景。中文语音识别除了普通话外,支持12种方言转写,包括河南话、粤语、四川话、云南话、贵州话、重庆话、天津话、河北话、东北话、甘肃话、山东话、太原话;外语支持英语、日语、韩语、西班牙语、越南语、俄语、法语;甚至还支持藏语和维吾尔语少数民族语言转写。

多场景实测 转写速度快、效率高

接下来我们实测一下讯飞智能录音笔SR502的转写和录音效果,首先,为了测试讯飞智能录音笔SR502离线转写速度与文字识别的准确率,我关掉WiFi没联网的情况下,用平时说话的语速录制了一段,从测试中直观看到的转写速度和准确率都非常让人满意。

虽然算不上完全同步,但也并没有明显的延迟现象,准确率上,由于每个人讲话可能会或多或少存在咬字不清和发音不准,这样转写也会存在一些错误,不过整体转写率很高。对于转写错误的地方,我们可以上传后同步云空间后,在手机APP或者电脑端进行修改,非常方便。

中英互译绝对是一大利器,像我喜欢看国外的一些博主的测评视频,之前看是大部分靠猜,有了讯飞智能录音笔SR502,直接在看的时候打开边录边译,基本就能实时看到中英互译内容。

OCR识别测试,我测试一下签订的整页租房合同,拍照后进行整页识别,速度非常快,这么多文字几乎是秒识别,纸上面的文字全部准确识别,保存文档后,同样可以在手机和电脑处理,非常高效。

对于户外采访和拍摄视频,我用SR502拍摄Vlog短视频,首先音质和录音清晰度上都是非常高的水准,A.I.智能拾音和降噪技术将鸣笛、路人说话的声音都很好过滤掉了,生成的字幕准确度很高。应用到采访场景中,视频采访相比SR501单独的录音采访会更加直观生动。

在会议记录中,SR502可以智能标记发言人,过滤掉非人声和无声片段,便于后期查看编辑。在录音的同时,同样可以使用OCR功能,拍摄的图片可以转写文字,开会中一些重要的资料实现一同转写,后期做会议纪要,整理资料非常高效,避免遗漏。

总结:讯飞智能录音笔SR502在SR501的基础上进行了大幅度升级,离线转写和OCR识别的加入大大提升了使用场景和效率,无论是私人还是企业商务人士,对于音频记录处理都非常专业高效。最重要的录音转写,毫无疑问达到了专业级别,2+6专业级麦克风配置与A.I.场景拾音和降噪算法相结合,在各种环境与场景下都可以为我们提供清晰、高音质的录音文件。

道客优(www.daokeyou.top)提醒:本网站转载【轻松离线语音转写、视频加字幕 讯飞智能录音笔SR502评测】文章仅为流传信息,交流学习之目的,其版权均归原作者所有;凡呈此道客优的信息,仅供参考,本网站将尽力确保转载信息的完整性,如原作者对道客优转载文章有疑问,请及时联系道客优,道客优将积极维护著作权人的合法权益。
推荐阅读: