当前位置: 首 页 > 图像识别 >

OrCam:让盲人“看见”

来源:雷锋网 发布日期:2017-05-04

作者:吴德新 Liat Negrin是一个从小就视力受损的以色列小姑娘。而现在,凭借着一副简单而不突兀的眼镜,她能随意地走进一家便利店拿起商品并阅读上面的文字。 N...

作者:吴德新

Liat Negrin是一个从小就视力受损的以色列小姑娘。而现在,凭借着一副简单而不突兀的眼镜,她能随意地走进一家便利店拿起商品并“阅读”上面的文字。

Negrin先天患有虹膜缺损,她是以色列一家初创公司OrCam的员工。OrCam研发的产品是一套基于摄像头的增强现实系统——能让视力受损人群自由地阅读和活动。

到目前为止,市面上帮助视力受损人群阅读的设备或笨重,或使用条件苛刻。新近也有出现智能机上的app,但多是功能有限。而OrCam其实是一架扣在镜框上的摄像头,它通过一根细小的线缆与便携式的电脑相连,电脑的大小可以放在兜里。摄像头是通过磁铁跟镜框吸附在一起,同时骨传导的扬声器将读取到的内容清晰地传递给用户。

这一系统的宗旨是识别和传递“自然条件下的文字”(无论是报纸上的长文还是公交车上的数字),还有包括路标、红绿灯和人脸这样的情景。这款设备跟我们之前报道过的Argus II有很大不同,后者采取的方式是绕过视网膜直接向大脑传送图像的神经信号。

“OrCam的神奇之处在于它还能向用户学习来识别新的物品。”Tomaso Poggio,一位MIT的计算机专家表示,同时他也是OrCam的创始人Amnon Shashua的研究生同学。

这一项技术进步显然是得益于芯片在处理能力和体积上的改良,加上图形算法的精进。在更广泛的技术层面来说,OrCam是一系列AI尤其是制造业的图形处理和无人驾驶汽车领域技术进步的体现(Shashua曾是一家无人汽车图像采集技术公司Mobileye的创始人)。在iPhone和Android手机上,数以千万的用户正在使用语言识别技术。同时,自然语言处理也在简化计算机“阅读”文件的过程。

在Hebrew University 2011年发表的一篇关于OrCam技术的论文里:他们的技术实现能在识别的准确率和速度上达到不错的平衡。这项名为Shareboost的技术在当需要识别的物品数量增加时,系统会减少需要的附加计算单元。

除此之外,OrCam系统还配有一个很小的控制系统或者说UI。用户只要用手指指向他想识别的物品,那么设备就会开始读取这个场景。系统本身内置了一些物品的数据,而用户也可以不断向库中添加新的数据——比如商标上的文字、红绿灯等等——只要在摄像头的区域挥一挥手。

Shashua表示这一系统关键的难度在于不同光学条件下的快速识别,以及柔软材料表面的内容识别。“专业的光学字符传感器在图像清晰的情况下识别率已经非常好了,但是在一些别的情况下——比如手持的报纸表面就比较难处理。”他说道。

这款设备的初衷是给那些视力受损人群(也就是那些无法通过眼镜矫正的用户)使用,但盲人也可以使用。

OrCam的这款设备会在本周起它的官网开始发售,目前还只支持英语,价格是2500刀,跟一款中档助听器价位相当。目前这是公司唯一一款产品。

需要说明的是,在美国2120万18岁以上的人受视受损的困扰,包括因衰老,眼疾和先天等各种因素引起的障碍。OrCam表示全球范围内大约有3亿4千2百万的成人患有严重的视力受损,其中有5千2百万人属于中产阶级。

上一篇:专访亮风台CEO廖春元:智能玩具助推图像识别爆发
下一篇:谷歌收购机器学习创企Moodstock,旨在提升图像识别技术

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 又一AI公司入驻阿里云市场,图普科技在该平台

    又一AI公司入驻阿里云市场,图普科技在该平台

  • PRICAI 2016 论文精选 | 低分辨率人脸识别的

    PRICAI 2016 论文精选 | 低分辨率人脸识别的

  • 只训练一次数据就能识别出物体,谷歌全新 AI

    只训练一次数据就能识别出物体,谷歌全新 AI

  • Dreambit:这个图像合成搜索引擎能够预测你的

    Dreambit:这个图像合成搜索引擎能够预测你的