AI データセット ライセンス業界における最初の業界団体である Dataset Providers Alliance (DPA) は、人工知能 (AI) システムのトレーニング用の音楽、画像、ビデオ、その他のデータセットの提供を専門とする 7 つのコンテンツ ライセンス販売者で構成されています。
DPA は、業界の先駆者のリーダーシップのもと、倫理的なデータ取得をサポートし、コンテンツ所有者の知的財産権を保護することを目指しています。
「 倫理的なデータ調達」は、DPA の使命の最前線にあります。このグループは、データに含まれる個人の権利を尊重するデータセットを使用して AI システムをトレーニングすることに尽力しています。
近年、 Google 、Meta、 OpenAIなどのテクノロジー企業は、機械が人間の創造性を模倣できるようにする生成AI技術の使用により、一連の著作権訴訟に直面している。
これらの企業は、多くの場合、作成者や権利者の同意を得ずに、膨大な量のコンテンツをモデルに与えてモデルをトレーニングしてきました。DPA は、ライセンスされたデータが法的に準拠した方法で使用されるように、意識を高め、基準を確立する予定です。
Dataset Providers Alliance のメンバーは、米国を拠点とする音楽データセットプロバイダーの Rightsify、画像ライセンスサービスの vAIsual、日本のストックフォトプロバイダーの Pixta、ドイツを拠点とするデータマーケットプレイスの Datarade など、業界の著名な企業ばかりです。
新たな産業の台頭と立法化の要請
著作権所有者が法廷闘争に勝訴した場合、ライセンスされたデータの需要は大幅に増加すると予想されます。これにより、コンテンツをパッケージ化し、AI システムへのアクセスを販売する企業で構成される新興産業が出現しました。
この業界の倫理基準を確立するために、非営利団体 Fairly Trained を含むさまざまなグループが結成されました。Fairly Trained は、著作権で保護された素材をライセンスなしで使用していないモデルを認証し、AI 開発の公平性と合法性を確保しています。
昨年導入された「NO FAKES法」として知られる米国の法案は、DPAが支持するタイプの法案の典型です。
この法案は、個人の音声や容姿の無許可のデジタルコピーを作成した際の罰則を定めることを目的としています。DPA は、このような立法努力を推進することで、AI データセットのライセンス業界に関わるすべての利害関係者の利益を保護する明確な法的枠組みを確立することを目指しています。
DPA グループは、倫理的なデータ ソースと知的財産権の保護を推進するだけでなく、トレーニング データの透明性の向上を推進することを目指しています。
これには、欧州連合のAI法や米国の法案「生成AI著作権開示法」に記載されているようなニーズへの支援が含まれる。DPAは、これらの重要な問題に対する自らの立場を詳述したホワイトペーパーを7月に発表する予定である。
DPA の設立を主導した Rightsify とそのライセンス子会社 GCX の CEO であるアレックス・ベスタル氏は、同盟の活動においてアドボカシーが重要な役割を果たすことを強調しています。
ベストオール氏は、この分野で進行中の争いを解決するには時間とすべての関係者の関与が必要であると強調しています。DPA は、倫理基準と立法措置を提唱することで、AI データセットのライセンスに関する公平でバランスの取れた環境を育むことを目指しています。