图像识别技术——智能硬件产品交互模式之一

  智能硬件之所以被称为智能,主要是基于其自身具备的良好体验性以及更贴近现实的交互方式。目前智能硬件在交互模式上的发展,可分为语音和图像两个方向,尤其是在计算机视觉技术方面,近两年随着深度学习技术的应用,在硬件上的搭载图像识别尤其是人脸识别、肢体识别等算法开始加速,例如以商汤科技和旷视科技为代表的计算机视觉创业公司在toB和toC领域逐渐扩大的商业应用。
  计算机图像识别技术是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别所研究的问题,是如何用计算机代替人类去自动处理大量的物理信息,解决人类所无法识别或者识别过于耗费资源的问题,从而很大程度上解放人类的劳动力。



  图像识别技术是人工智能的一个重要领域。图像识别技术是以图像的主要特征为基础的。每个图像都有它的特征,对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。
  为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。例如模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的模板如果能与大脑中的模板相匹配,这个图像也就被识别了。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,有一定的局限性。格式塔心理学家又据此提出了一个原型匹配模型。这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。但是,这种模型没有说明人是怎样对相似的刺激进行辨别和加工的,它也难以在计算机程序中得到实现。因此又有人提出了一个更复杂的模型,即“泛魔”识别模型。
  随着计算机技术及人工智能技术的发展,图像识别技术越来越成为人工智能的基础技术,它将是未来科技领域几大关键产业的核心技术之一。微软、谷歌、Facebook、亚马逊、百度、腾讯等巨头都在倾注大量资源推动这项功能进步。目前,计算机的图像识别技术在公共安全、生物、工业、农业、交通、医疗等很多领域都有应用。例如交通方面的车牌识别系统;公共安全方面的人脸识别技术、指纹识别技术;农业方面的种子识别技术、食品品质检测技术;医学方面的心电图识别技术等。
  随着计算机技术的不断发展,图像识别技术也在不断地优化,其算法也在不断地改进。图像是人类获取和交换信息的主要来源,因此与图像相关的图像识别技术必定也是未来的研究重点。以后计算机的图像识别技术很有可能在更多的领域崭露头角,它的应用前景也是不可限量的,人类的生活也将更加离不开图像识别技术。
 
®关于本站文章™ | 若非注明原创,默认 均为网友分享文章,如有侵权,请联系我们™
㊣ 本文永久链接: 图像识别技术——智能硬件产品交互模式之一