当机器学习遇到场景识别 |
发布时间: 2012/8/15 11:55:32 |
机器学习软件可通过Google街景图像来筛选出城市中独特的“视觉签名”,如巴黎某建筑的铸铁阳台和圆柱门廊以及伦敦的石头阳台和独特路牌。 卡耐基梅隆大学的研究人员正在开发机器学习程序,已识别如图中巴黎某建筑三楼的阳台铁栏杆、窗栏杆、路灯的形状以及木门的造型。 卡耐基梅隆大学研究人员开发的机器学习程序分析了12个主要城市的40000幅Google街景图像,并为每一张图片挑选出独一无二的“视觉签名”。伦敦的建筑两列通常有很多古典门廊,而巴黎的建筑往往有阳台栏杆,栏杆通常是石头做成的,而且往往是在二楼。 但当机器学习程序放大旧金山和纽约的阳台的照片时没有发现像巴黎那样的“视觉签名”,机器学习程序试图在公路隧道的标记和街道上汽车做出区别。研究人员表示相对于其他城市美国城市的建筑大多保持统一性,缺乏建筑自身的独特性。 从机器学习的角度来看,最大的难题是从大量的视觉数据中筛选出特有的位置,如数木、混凝土和天空。这就需要需找事物的不同点,例如两个城市间阳台的细微差别,想发现细微差别需要150个处理器运行一夜的时间来完成分析。 机器学习程序已经提供的功能可正确识别照片显示那一刻巴黎83%和布拉格92%的事物(如建筑,植物)。 此项目有卡耐基梅隆大学计算机科学教授Alexei Efros领导,成员包含INRIA/Ecole Normale Supérieure。 本文出自:亿恩科技【www.enkj.com】 |