第一个整合了GPT-4图像识别能力的应用程序被视障用户描述为 "改变了生活"。



Be My Eyes是一家丹麦初创公司,它将人工智能模型应用于盲人或弱视者的新功能。这个被命名为 "虚拟志愿者 "的物体识别工具可以回答关于它所发送的任何图像的问题。

例如,想象一下,一个用户很饿。他们可以简单地拍摄一种成分并要求提供相关的食谱。

如果他们更愿意外出就餐,他们可以上传一张地图的图像,并获得前往一家餐馆的路线。抵达后,他们可以拍下菜单的照片,并听取选项。如果他们想在健身房里消耗掉增加的卡路里,他们可以用智能手机的摄像头找到一个跑步机。

"我知道我们现在正处于人工智能的炒作周期中,但我们的几个测试者在描述该产品时使用了'改变生活'的短语,"By My Eyes的首席执行官迈克-巴克利告诉TNW。

"这有机会在赋予社区前所未有的资源方面进行变革,以更好地浏览物理环境,解决日常需求,并获得更多的独立性。"

虚拟志愿者利用了OpenAI软件的升级。与该公司以前的模型不同,GPT-4是多模态的,这意味着它可以分析图像和文本作为输入。

Be My Eyes抓住了测试新功能的机会。虽然文本到图像系统不是什么新鲜事,但这家初创公司以前从未对该软件的性能感到信服。

"Buckley说:"从太多的错误到无法交谈,市场上的工具并不具备解决我们社区的许多需求的能力。

"GPT-4提供的图像识别是卓越的,而由OpenAI提供的分析和对话层则成倍地增加了价值和效用。"

Be My Eyes之前只支持人类志愿者的用户。根据OpenAI的说法,新功能可以产生同样水平的背景和理解。但是,如果用户没有得到很好的回应,或者只是更喜欢人与人之间的联系,他们仍然可以给志愿者打电话。

该免费应用程序的第一个版本于2015年发布,目标是为2.53亿盲人或低视力者创造更独立的生活。Credit: Be My Eyes

尽管早期成果喜人,但巴克利坚持认为,这项免费服务将被谨慎地推出。测试者和更广泛的社区将在决定这一过程中发挥核心作用。

最终,巴克利相信该平台将为用户提供支持和机会。Be My Eyes也将很快帮助企业通过优先考虑无障碍性来更好地服务他们的客户。

可以说,这项技术不仅可以给盲人或低视力的人更多的权力,而且还可以为社区提供一个平台,让他们与世界其他地方分享更多的才华,"巴克利说。"对我来说,这是一个令人难以置信的可能性。