(资料图)
微软Bing Chat在台式机上又有了一次大的更新,支持图像识别,或称OCR。该功能使用OpenAI的ChatGPT-4视觉模型来检测和理解图像中的物体,并利用现实生活中的例子对图像进行详细解释。
微软正在向全球选定的用户推出Bing Chat视觉功能。更新后,用户会注意到语音图标旁边的一个新选项,允许你直接上传图片到聊天室,或从互联网上粘贴图片,并要求必应进行解释。
这项功能被官方称为"图像识别",只有部分用户表示可以使用它,这表明它可能是一个随机的A/B测试。在一份声明中,微软官员确认向不到10%的经常使用Bing Chat的人推出必应视觉,证实了我们的猜测,即这是一个随机的A/B测试过程,不过可以期待Bing Vision选项在未来几周内出现在所有人面前。
该功能也包括在WindowsCopilot中。你可以从桌面或文件资源管理器中拖出一张图片,把它放到Copilot上,并要求人工智能解释该图片或创造类似的东西。最后,你可以将图片直接复制到PowerPoint、Word或剪贴板上。
微软在5月对Safari和Chrome浏览器中的Bing Chat支持进行了简短的测试,我们预计很快就会有正式的公告来确认这一扩展。虽然通过修改用户代理有可能让Bing Chat在Chrome浏览器中工作,但可能没有必要。除了对Chrome和Safari浏览器的支持外,微软还希望利用微软的人工智能改进Bing Image Creator。
该功能可能会随着必应插件的整合而变得更好,官员们表示,微软正在计划"大规模推出插件",以扩大Bing Chat的功能。该公司计划将每项功能都变成一个插件,并创建搜索的不同方面。
微软已经对Bing Chat进行了一些重大改进,比如取消对微软账户的支持。此前,微软通过强迫用户用微软账户登录来阻止他们。这一限制已被取消,因为微软现在正试图推动采用必应人工智能,而不是其他服务,如微软账户或Edge。