ChatGPT搜索引擎要来了，但它面临的麻烦还不少

共计 2233 个字符，预计需要花费 6 分钟才能阅读完成。

眼下，OpenAI 仍为搜索数据所困。

新晋人工智能霸主 OpenAI 开始挑战搜索市场格局。

OpenAI 很可能推出基于 ChatGPT 技术的新搜索引擎。5 月 6 日，名为“GPT Search”的网页已经上线，但目前只有会员才能访问。

上述消息最早是创业孵化器 Y Combinator 中的一篇帖子透露的，文中称“search.chatgpt.com”的域名和安全证书已经创建。知名记者 Pete Huang 也发推特预告，表示 GPT Search 将在 5 月 9 日正式上线。

OpenAI 如何提供更个性化的深度集成搜索体验，以及带来怎样的人与信息的交互方式变革备受外界期待。自从 ChatGPT 诞生，科技圈都在等待着一场 OpenAI 与谷歌在搜索市场的正面对决。已经有大量用户通过微软的 Bing Chat、谷歌的 Gemini 等聊天机器人，获得人工智能生成检索答案。

目前，OpenAI 估值超 800 亿美元，微软已向该公司投入 130 亿美元。OpenAI 在搜索市场上显得“野心勃勃”。

“将 LLM（大型语言模型）与搜索进行深度集成，ChatGPT 可能是搜索的未来。”今年 4 月，OpenAI 首席执行官 Sam Altman 已经向人们昭示了该公司的宏大野心。

这家手握微软 130 亿美元投资的公司，目前估值超 800 亿美元。无论在技术还是资金上，它已然成为能够威胁到谷歌搜索地位的新势力。

事实上，OpenAI 已经在借助微软之力不断向搜索引擎逼近。去年 5 月，微软在其“2023 Build 开发者大会”上宣布，Bing 搜索将很快直接集成到 OpenAI 的 ChatGPT 聊天机器人中，从而在 Bing 上内置部分实时搜索功能。

微软还表示，ChatGPT 将内置一个世界级的搜索引擎，以提供更及时、更新的答案，并从网页上获取信息。

彼时，微软公司 CEO、董事长萨提亚·纳德拉曾乐观地表示，“整个搜索类别正在经历翻天覆地的变化，这样的机会很少出现。”

更有乐观者认为，此举或将成为人工智能的“iPhone 时刻”，有望削弱或颠覆谷歌在搜索市场的主导地位。

到了去年 10 月，微软 Bing 将 OpenAI 最新版本的图像生成模型 DALL-E3 纳入其中，帮助访问者生成逼真的图像，从而提升用户使用频率。

微软公司副总裁兼 Copilot 和 Bing 工程与产品负责人 Jordi Ribas 称，“DALL-E3 加入后，必应使用量增加了 10 倍，这确实对产品的参与度和用户产生了影响。”

彭博社分析称，2023 年第二季度，美国 Bing 月度活跃用户同比增长一倍以上，达到 310 万，用户在搜索引擎上花费的时间增加了 84%。SensorTower 的数据则显示，到年底，Bing 的月活跃用户已稳步增长至 440 万。

然而要谈 Bing 挑战谷歌的霸主地位还为时尚早。StatCounter 数据显示，截至 2023 年底，微软 Bing 仅占全球搜索市场的 3.4%，自宣布集成 ChatGPT 以来，其市场份额上升了不到 1 个百分点，而谷歌仍然占据全球 90% 的搜索市场总量。

对搜索而言，数据是决定搜索质量的关键因素，即搜索次数越多，搜索答案越精准。

生成式人工智能将如何改变搜索及排名结果，也将对谷歌颇为依赖的广告模式产生影响。过去，搜索广告主要依靠点击次数盈利，导致大量劣质广告信息前置，用户体验极差。在中国，类似的情况同样存在。

“如果我们能够建立一个比谷歌更好的搜索引擎，那就应该这样做。”Sam Altman 指出：“谷歌向你展示了 13 个广告和 10 个蓝色链接，也许有更好的方法来帮助人们搜索信息，并根据提示采取行动。”

但要拿下搜索市场，还需要硬件公司和内容数据方的深度配合。眼下，OpenAI 仍为搜索数据所困。

就在 4 月 30 日，奥尔登全球资本旗下的八家日报起诉 OpenAI 和微软，指控两家公司非法使用新闻文章为其人工智能聊天机器人提供动力。

这些公司在诉状中称，OpenAI 和微软在未经许可的情况下使用数百万篇受版权保护的文章来训练和喂养他们的生成式人工智能产品，包括 ChatGPT 和 Microsoft Copilot。该诉讼没有要求具体的金钱赔偿，但要求陪审团审判，并表示出版商因使用内容而应获得赔偿。

“我们花费了数十亿美元在出版物上收集信息和报道新闻，我们不能允许 OpenAI 和微软扩大窃取我们工作成果，以牺牲我们的利益为代价建立自己的业务。”奥尔登报纸的执行主编 Frank Pine 在一份声明中说。

OpenAI 发言人则回应称，公司此前并不了解奥尔登的担忧，但正在与许多新闻机构建立合作伙伴关系并进行对话，以探索合作机会。当地时间 5 月 6 日，英国《金融时报》宣布已与 OpenAI 达成内容许可协议，后者能够利用其数据库来训练 GenAI 模型。

与此同时，不少作家也开始行动，包括玛格丽特·阿特伍德、丹·布朗和乔迪·皮考特在内的 8500 多名作者，联合敦促 ChatGPT 和 Bard 等负责生成人工智能应用的科技公司，在未经适当授权的情况下停止使用他们的作品或提供补偿。

《纽约时报》最近的一项调查发现，许多科技公司在努力跟上人工智能步伐的过程中忽视了相关政策，并讨论规避版权法，以获取尽可能多的数据来训练聊天机器人。国内的大模型同样无法避免这一问题，各类大模型产品的参考答案多来自于媒体报道或已有的数据。

生成式人工智能从根本上改变搜索市场，距离这一天也许不会太遥远。但在此之前，这些 AI 公司需要首先解决好数据来源以及版权争议等问题。

本文来自“界面新闻”，记者：陈振芳，编辑：宋佳楠。该文观点仅代表作者本人，本平台仅提供信息存储空间服务。

微信扫描下方的二维码阅读本文