2016年4月,微软向全世界展示了一个特殊的眼镜。
它外表看上去平淡无奇,但内置了摄像头与麦克风。当有人戴上它时,只需轻轻触摸,眼镜内置的摄像头就会捕捉面前的画面,并通过AI系统分析后告诉用户这是什么,无论是周围的环境、物体还是人的表情,用户都能立即知晓。
这项技术的核心开发者是一位叫萨基博·萨科(Saqib Shaikh)的微软员工,他是一位盲人。萨科相信AI技术的可能性,于是他尝试开发了这样一副眼镜,并将其称为Seeing AI。2017年,微软基于萨科和团队的研究,推出了一款移动应用Seeing AI,让萨科的愿望在每个人的手机上更进一步实现。
如同当年那个神奇的眼镜一样,Seeing AI这款应用能借助AI技术来分析周围的物体,通过手机镜头捕捉到的文字、条形码、图像等直接「口述」出来传达给用户,让他们得以「看到」周围世界。我们也在App发布后带来过第一时间体验。如今,两年时间过去,3月12日微软大幅更新了这款应用,这一次它离「看见」的目标又进了一步,极客之选也第一时间下载下来体验了一番。
更丰富的体验和两年前相比,Seeing AI最大的变化在于功能的进一步完善(但依然不支持中文)。在原来支持人物、短文、文本、条形码和场景识别的基础上,如今的Seeing AI还加入了颜色(Color)、手写体(Handwriting)、光线(Light)的识别功能,这些功能对盲人朋友来说不但实用,而且也易于上手。
颜色功能是通过手机的后置摄像头来捕捉画面当中出现的颜色,并直接用语音传达给用户,它的处理速度很快,因为这一功能相比场景识别更简单。不过颜色识别和场景识别的作用并不一样,比如当盲人朋友买衣服或者鞋子的时候,这个简单的功能其实非常有用。
手写体识别的功能则接近于之前的文本识别,但细分出来可以更好识别出某人手写的信件或者菜单之类的图像信息,很遗憾经过尝试,手写体也同样识别不出中文语言,但对英文和阿拉伯数字识别准确率已经非常高,可以满足日常使用。
光线这个功能比较特殊,在摄像头捕捉到明暗程度不同的画面时,它会通过高低不同的声音(听起来类似蜂鸣)来表示当前场景的光线强度,这个功能我想象不出具体使用场景,但对于盲人使用者来说,或许也会在一些特定场合起到作用(比如晚上睡觉关灯?)。
不仅仅是这样的细分功能尝试,Seeing AI本次更新还有一大亮点,它终于支持浏览手机相册了。盲人群体虽然看不见世界,但他们也会用手机拍照,或者保存一些有美好回忆的照片在自己相册,新的Seeing AI可以直接打开每一张照片,给手机前的用户讲出每张照片的内容,并且告诉他们照片拍摄时间、地点,这不得不说是非常贴心的功能。