ChatGPTをサービスするOpenAI社が恐らく次世代のGPT-5の構築のネット上の様々な情報収集するためのクローラー「GPTbot」が、これからインターネット上のWebサイトをクロールし掲載されている公開情報を収集し始めるようです。
ChatGPTの対話の中で自分や自社の最新のネット上の公開情報が使用されるのであれば、むしろ大歓迎という方も多いでしょう。ただ個人の日記やつぶやきなどが学習データとして勝手に使われ、無機質なAIの言葉として語られることに嫌悪感を抱く方も居ます。
OpenAI社はこうした事情に配慮し、クローラーを制御する共通規格である「robot.txt」上でクロールの可否を決める事ができるようにしたようです。
GoogleやYahoo!、Bingなどの検索エンジンと違い、ChatGPTは対話の中でネット上の知識を使って答えを完結します。つまり、サイトに誘引する力は弱いため、情報のタダ乗り批判は以前よりありました。例えば広告で運営しているサイトなどは掲載情報だけ利用されてサイトに誘引されないため、インプレッションが下がり広告収入が低下するという懸念があります。
最近になり、引用元のサイトを表示するようになりましたが、それでも検索エンジンより弱いのは間違いありません。Googleが対話型AIを積極的に導入しないのは、自社の収入源である広告事業とコンフリクトを起こすから。などと実しやかに囁かれています。
comments