随着科技的快速发展,人脸识别、语音识别和自动驾驶这些成为了高科技的代言词。其实早在1956年,人工智能这个“术语”就被正式提出了。但是由于当时的科技水平的低下,计算能力方面的欠缺,这方面的发展一直处于摸索阶段。
一直到20世纪80年代初,随着一类名为“专家系统”的AI程序开始为全世界的公司所采用,人工智能才兴起了第二次热潮。各国开始投入大量资金,例如日本经济产业省雄心勃勃旨在打造“第五代计算机”的研究计划,目标是制造出能够与人对话、翻译语言、解释图像,并且能像人一样推理的机器。80年代后期,产业界对人工智能系统投入巨大但只产生有限的应用产生质疑,人工智能的泡沫逐渐破裂,投入大幅消减,人工智能再一次步入寒冬。
那么,人工智能到底将靠什么走向大众?笔者认为,视觉AI技术将是发展方向。
简单来说,视觉AI就是研究如何让机器会“看”,即用摄影机和电脑代替人眼对图像进行特征提取和分析,并由此训练模型对新的图像数据进行检测、识别等任务,建立能够从图像或者多模态数据中获取“信息”的人工智能系统。源于深度学习的突破,视觉AI的识别能力突飞猛进,2012年的两个轰动事件,更被视为视觉AI的发展拐点。当时,由多伦多大学Geoffrey Hinton领导的团队,在一项名为ImageNet的图像识别竞赛中,利用深度学习和GPU的强大计算能力,将错误率降低了10%,震惊学术界,因为之前这项错误率每年只会降低1%—2%。
同年,“谷歌大脑之父”吴恩达带领团队,利用10亿参数的神经网络,在没有任何先验知识的情况下,仅仅通过观看无标注的YouTube的视频,创造了一套猫脸识别系统——从海量照片里自动识别出猫脸。视觉AI迅速成为人工智能领域最重量级的研究领域,源自于其在安防、医疗、无人驾驶等多个领域的应用前景。当下AI+医疗的红火,对推动这个行业的发展起到了不可磨灭的作用,还有丰富的应用场景和海量的机会等待挖掘,例如个性化医疗、可穿戴智能医疗设备的实时监测与分析等。
放眼未来,更多的应用前景都将贴上视觉AI的标签。比如,人脸识别技术有望在更多的物联网终端设备上应用,让安全便捷的身份认证无处不在,提升生活体验;在AI+工业领域,工业机器人、物流机器人将更多替代传统劳动力;在AI+文化领域,基于AI的增强现实技术,可以将古代文物、古代场景生动复原得以假乱真;在AI+教育领域,利用视觉技术实现学生的注意力管理、跟踪学生的知识点掌握,实现真正的因材施教。