新一代AI会“察言观色”了?
2020/07/28
一项可能预示着人工智能(AI)未来走向的技术已经问世。这项技术叫做“多模态AI”,可以像人类利用五感理解周围事物那样,通过图像、语音和文字等多种数据作出高水平的判断。AI更加接近人类、给社会各个领域带来影响的未来即将到来。
“您吃饭了吗?”“您按时吃药了吗?”可爱的机器人一边跟老奶奶聊天一边询问。虽然老人有时回答得模糊不清,有时只是默默点头,但新AI可以机智地察觉情况,判断出“没有问题”。
这是日本内阁府实施的项目一环,由KDDI及日本情报通信研究机构推进由AI看护独居老人等的研究。其目标是能够通过每天的对话来发现老人的细微异常变化。
重要的是,新AI不仅可以理解对话的内容,还可以通过视频察觉动作和感情的变化。如果可以感知体温,就“可以保护老年人免受新冠病毒的侵袭”(日本情报通信研究机构研究员鸟泽健太郎)。
如果是人类的话,即使对方嘴上逞强说“我很好”,也可以根据脸色不佳而察觉出对方“可能有烦心事”等。过去的AI可以对图像、语音和文字进行分析,但不具备察言观色的能力。多模态AI被认为将打破这一壁垒。
AI的概念诞生于上世纪50年代。虽经历了研究衰退的寒冬时期,但一直在进步。2012年左右开始受到关注的深度学习技术,擅长通过相机拍摄的图像来理解世界。以该技术为契机,掀起了AI热潮,图像识别精度等获得飞跃性的提升。这种情况甚至被比喻为“寒武纪大爆发”,即约40亿年前出现的生命在5亿年前有了眼睛并快速进化。AI让曾经被视为梦幻技术的汽车自动驾驶等一下子具有了现实意义。
版权声明:日本经济新闻社版权所有,未经授权不得转载或部分复制,违者必究。
报道评论