04:00
Gata、リアルユーザー向けのグローバル大規模ChatGPT会話データセット「ChatGPT-RealUser-2.2M」をリリース
ChainCatcherからのメッセージ、分散化AIインフラ企業Gataは、世界規模のリアルユーザーChatGPT対話データセットChatGPT-RealUser-2.2Mを発表しました。このデータセットはGataのGPT-to-Earnプログラム(ユーザーの自発的参加)を通じて収集され、2024年から2025年の間に224万を超えるリアルな対話と、近く356万のQ&Aペアを集めました。これらは1.5万を超えるリアルユーザーからのもので、GPT-3.5、GPT-4、o1との相互作用を含んでいます。
紹介によると、このデータセットはAllen Institute for AIの過去の同様のデータセットの約2倍の規模で、実際のシーンや多段階の対話をカバーしており、チェーン上のインセンティブメカニズムにより、多くの暗号関連のインタラクションが含まれています。プレビュー版は既に
GPT-9.92%