ai软件图层微软开发了一种新的图像字幕算法:准确率超过人类

微软开发了一种新的图像字幕算法,在这些有限的测试中,其具体率达到了人类。该人工智能平台已被用于升级该公司为视障人士提供的助理应用程序"SeeingAI",并将迅速被列入Word、Outlook和PowerPoint等其它微软产品中。在那里,它将被用于为图像建立alt文本等任务,这一用途对于改善无障碍性尤为重要。

这种应用包含微软自己的SeeingAI,该公司于2017年首次公布。SeeingAI利用计算机视觉为视障人士描述通过智能电脑摄像头发现的世界。它可以识别家庭物品ai软件图层,阅读和扫描文本,描述情景,甚至识别朋友。它还可以拿来描述其它应用中的图像,包括电子邮件用户端、社交媒体应用和WhatsApp等消息应用。

微软没有披露SeeingAI的用户总量,但AzureAI的企业经理裁EricBoyd告诉TheVerge,该软件是"为盲人或低视力专家提供的领先应用之一"。SeeingAI终于连续两年被盲人和低视力iOS用户社区AppleVis评选为最佳应用或最佳辅助应用。

微软新的图像字幕算法将明显提升SeeingAI的性能ai软件图层,因为它除了能分辨物体,还能更准确地表述他们之间的关系。因此,该算法可以在看一张照片时,不仅能说出图片中包括那些物件和物体(如"一个人、一把椅子、一个手风琴"),还能说出他们之间的互动关系(如"一个人坐在桌子上,正在拉手风琴")。微软表示,该算法是其之前自2015年起初使用的图像字幕系统的两倍。

该算法在9月底发表的一篇预印论文中进行了表述,在一个被称为"nocaps"的图像字幕基准测试上获得了有史以来最高的分数。这是一个业界领先的图像字幕评分板,不过它有自己的限制条件。nocaps基准测试由少于166,000个人类生成的字幕组成,描述了从OpenImagesDataset中提取的约15,100张照片。这些截图涵盖了一系列画面,从运动到假日抓拍,再到美食摄影等等。

添加微信

转载原创文章请注明,转载自设计培训_平面设计_品牌设计_美工学习_视觉设计_小白UI设计师,原文地址:http://zfbbb.com/?id=5378

上一篇:小米ai软件小米人工智能开放平台入选“世界互联网领先科技成果”(图)

下一篇:小米ai软件小米发布MIX2S之后,小米手机继续加码AI领域