天天播报:微软Bing Chat的GPT-4整合将为Windows 11带来更强的图像识别功能

(资料图)

微软Bing Chat在台式机上又有了一次大的更新，支持图像识别，或称OCR。该功能使用OpenAI的ChatGPT-4视觉模型来检测和理解图像中的物体，并利用现实生活中的例子对图像进行详细解释。

微软正在向全球选定的用户推出Bing Chat视觉功能。更新后，用户会注意到语音图标旁边的一个新选项，允许你直接上传图片到聊天室，或从互联网上粘贴图片，并要求必应进行解释。

这项功能被官方称为"图像识别"，只有部分用户表示可以使用它，这表明它可能是一个随机的A/B测试。在一份声明中，微软官员确认向不到10%的经常使用Bing Chat的人推出必应视觉，证实了我们的猜测，即这是一个随机的A/B测试过程，不过可以期待Bing Vision选项在未来几周内出现在所有人面前。

该功能也包括在WindowsCopilot中。你可以从桌面或文件资源管理器中拖出一张图片，把它放到Copilot上，并要求人工智能解释该图片或创造类似的东西。最后，你可以将图片直接复制到PowerPoint、Word或剪贴板上。

微软在5月对Safari和Chrome浏览器中的Bing Chat支持进行了简短的测试，我们预计很快就会有正式的公告来确认这一扩展。虽然通过修改用户代理有可能让Bing Chat在Chrome浏览器中工作，但可能没有必要。除了对Chrome和Safari浏览器的支持外，微软还希望利用微软的人工智能改进Bing Image Creator。

该功能可能会随着必应插件的整合而变得更好，官员们表示，微软正在计划"大规模推出插件"，以扩大Bing Chat的功能。该公司计划将每项功能都变成一个插件，并创建搜索的不同方面。

微软已经对Bing Chat进行了一些重大改进，比如取消对微软账户的支持。此前，微软通过强迫用户用微软账户登录来阻止他们。这一限制已被取消，因为微软现在正试图推动采用必应人工智能，而不是其他服务，如微软账户或Edge。

关键词：