2014年12月,百度发布新一代语音识别技术“Deep Speech”。同日,深圳市一科电子有限公司发布集成百度语音识别的全功能后视镜一体机——沃影HE808。
据了解,百度的语音识别技术名叫“Deep Speech”,这项技术在噪音较大的环境下(如汽车或人群中)的表现尤为突出。百度首席技术官吴恩达介绍,在噪音环境下,百度语音识别技术的表现超过了谷歌的语音识别API、微软的“必应语音”技术和苹果的Dictation技术。而在识别的正确率上,百度语音识别技术要比上述技术高出10个百分点左右。 同时,百度的语音识别技术也采用了“深度学习”(deep learning)这一人工智能的分支技术。深度学习是利用软件系统来以比较原始的形式模仿人类大脑皮层中的神经元活动,进而对外界的声音、图像和其它数据进行识别。“第一代基于深度学习的语音识别技术已经发展到了极限,”吴恩达在接受采访时表示。 沃影HE808集成的百度语音识别技术,可以借助设备内置的联通3G网络,自动联网升级更新,并学习车主的语音。车主还可以语音控制HE808的所有功能。 “打开记录仪“-----HE808开启高清行车记录功能; “我要拍照“--------HE808自动对当前现场拍照; “打开FM”---------HE808开启FM发射功能,车载音响可以接收设备的声音; “打开蓝牙”--------HE808开启蓝牙并连接到车主手机; “打电话给......”-----HE808自动打电话给您的朋友; 车主还可以使用更多语音功能来控制沃影HE808,就如同百度语音自我学习的功能一样;车主一样可以用语音发现HE808更多的实用功能。
据悉,百度在语音识别技术的研究中累计采集了9600人的长度达7000小时的语音数据。其中大部分是在安静环境中采集的,但有时也会通过喇叭或耳机来播放比较嘈杂的声音,从而让被录音者根据这些情况适当调高自己说话时的音调。研究团队在采集声音数据的过程中一共添加了15种不同类型的背景噪音,包括餐厅、汽车、地铁和人群等等,这实际上已经将语音样本数据的长度放大至10万小时左右,而这些数据都输入到百度的语音识别系统中让其进行学习识别。 1,所有数据自动升级;无论是电子狗数据,流动雷达频率数据,语音识别数据都可以借助高速3G网络自动升级; 2,百度导航实时路况功能;百度拥有国内最完善的实时路况数据,不仅覆盖城市和区域最多,也最为准确;借助百度路况功能,沃影HE808导航更加智能,可以随时躲避拥堵路段; 3,记录仪随时传输数据功能;当发现紧急情况,不需要按按键,也不需要用手挥动来唤醒屏幕,仅需要车主说“立刻拍照“或者“我要拍照”,沃影HE808立刻拍摄现场照片。 4,沃影HE808具备微信控制功能。车主将设备绑定到自己的微信号,即可通过微信来控制。可以实时获取车辆前方照片,获取车辆实时GPS地理位置,管理车辆30天内行驶轨迹路线; 5,沃影HE808具备停车监控功能;熄火停车后,车辆发生碰撞/拖车/撬动,设备立刻录像并拍照,将报警信息和照片发送给客户的微信上进行提醒; 6,沃影HE808具备车队管理功能;设备内置的高速移动网络,可以将每台车辆的地理位置,行驶路线记录下来,并提供 报 表数据给管理者;管理者也可以利用手机微信端或者PC端对所有设备进行语音广播,发布调度指令。
|