

包括全球音乐授权机构Rightsify在内的7家AI数据集供应商,宣布成立数据集供应商联盟DPA,目标是推动训练AI模型所使用数据的合法授权的透明度及标准化
Dataset Providers Alliance (DPA)
7家涉及音乐、声音、影像、文本与技术的AI数据集供应商,在周三(6/26)共同宣布成立数据集供应商联盟(Dataset Providers Alliance ,DPA),将致力于推动AI与机器学习(ML)数据集之知识产权的负责任与合乎道德的授权活动,以于快速发展的AI及ML领域中宣导内容创作者的权利。
相较于金融时报、华尔街日报、纽约时报、美国唱片业协会(RIAA)或Reddit等知名组织直接与AI业者签署协议,DPA的创始成员多半为新创,采用联盟型态或许可取得更好的谈判筹码。
这7家业者包括全球音乐授权机构Rightsify,去年才成立且专门提供AI音乐数据集的GCX,专注于视觉AI解决方案的vAIsual,专门提供数据标注服务的Pixta AI,广纳音乐、图像、视觉与创意艺术家的社群平台ado,专门供应高品质视频及书籍文本以训练AI模型的Calliope Networks,以及数据商店Datarade等。
DPA的任务包括推动AI与ML数据集知识产权内容授权的透明度与标准化,教育市场使用合法数据的重要性,推动数据供应商,推动AI/ML研究人员及业界合作伙伴之间的沟通与合作,宣导内容创作者与权利人的权益,以及在鼓励与开发尖端AI/ML技术的同时确保知识产权的保护。
简言之,DPA是要创建训练AI模型所使用数据的合法授权的透明度及标准化,并准备在今年7月发表一份有关数据集授权标准的白皮书,让DPA成为数据集供应商的代言人,并让开发者得以存取大量高品质的AI训练内容。