本月累计签到次数:

今天获取 积分

5

“Alice Who”的APP,是什么原理?

最近有款“Alice Who”(神马爱丽丝)的APP,我拍景物的照片,上传,就可以知道这是哪儿?这是什么原理?
已邀请 :
这个APP是好用,你只要把手机摄像头对准一栋建筑,或一家餐厅,“Alice Who”就会告诉你,这是什么地方,这家餐厅叫什么名字;“Alice Who”还能够帮你链接去美国版的大众点评网Yelp,FourSquare等,让你能够了解这家餐厅的详细信息和评价。
看似简单的应用,背后包含了复杂的技术。对于户外环境中建筑、店面的识别,一直是计算机视觉的难点。如何让计算机看清楚,看得准?即使户外的光线千变万化,即使环境中存在众多干扰因素?
 
这是一款新的机器视觉,

计算机视觉(Computer Vision)是近年来大家谈的较多的话题。无人驾驶汽车、无人机等产品渐渐进入大众视野,如何让机器能够像人一样,有看见、辨识周围环境的能力,成为这些产品成功的关键。
随着计算机视觉技术的发展,人们开发了不同的手段来帮助机器“看见”物体。大部分技术是基于同一基础的,那就是点状云(Point Cloud)。通过3D扫描物体,构建点状云,然后用点状云训练机器的算法,让机器能够辨识出这个物体。 
但是,这种标准的技术,在室内适用,识别物体、人脸都很给力,却不擅长识别户外建筑。在户外,随着光线的变化,不但建筑反光的颜色和强度会变化,阴影会变化;此外,建筑物周围的行人、停靠的车辆,也会影响机器对其的识别。
QQ图片20161114092257.jpg

举个例子,我们在上午10点拍摄的咖啡的图像,与下午4点再次拍摄的图像,对于机器识别来讲,可能是完全不同的两个场景。并且,建筑物的体积较大,人通常并不能拍到其全貌。这也给机器识别带来了挑战。
 
2

拔光的鸡

赞同来自 : 发如雪 图像语言

Fringefy独辟蹊径的计算机视觉技术,主要集中于应对这些挑战。Fringefy所开发的算法,专注于把握建筑的几何形状,而非整体和细节。也就是说,通过把握建筑的门、窗及主要结构,避开光线和干扰物的影响。
1

发如雪

赞同来自 : 图像语言

我还是不知道,这款APP是如何快速准确地进行图片识别?
1

图像语言

赞同来自 : 无国界

通常,Fringefy会把用户通过手机摄像头捕捉到的图像,与数据库中的图像进行比较、匹配。那么,如何将一个图像,与云上的成千上万张图像比较, 并且快速、精准?背后的两个关键词是:数据库和标签策略。

Fringefy的数据库来源分为两类。对于一些客户,例如国防安全类的,客户会负责提供图像数据库。但是Fringefy也能够自己抓取公开网络上的图像,快速形成图像数据库。例如,Yelp,Trip Advisor等网站上,有用户上传的大量图片,包含了建筑外观,并有相应的地点信息。在制作“Alice Who”APP时,Fringefy建立了整个旧金山的商业类建筑的数据库,包括所有的餐厅、酒吧等,只用了2到3天的时间。目前,这个公开网络数据抓取的能力,还不是全自动的。Fringefy的下一步,就是研发能全自动的从浩瀚的网页上抓取图像,形成数据库的解决方案。
不过,如果每次都要将一个图像与云上的成千上万张图像比较、匹配,可能会减缓识别的速度。所以Fringefy配合使用了标签(signature)策略,让计算机算法根据某类标签,先进行预筛选,然后再匹配识别,以配合现有的电脑处理的条件。
例如,地址可以作为一种标签。当用户在某一个地点用摄像头捕捉图像时,用户的手机会上传地理位置信息。Fringefy就能根据这个地理位置信息,先筛选出数据库里附近的建筑的图像,再与用户手机捕捉到的图像进行匹配,从而更快、更准的得到结果。

要回复问题请先登录注册