Адвокатската кантора Clarkson заведе колективен иск във федералния съд на Северния окръг на Калифорния срещу OpenAI, разработчика на популярния бот с изкуствен интелект ChatGPT.
Жалбоподателят смята, че разработчикът на чатбота е нарушил правата на милиони интернет потребители, като е използвал техните публично достъпни данни за обучение на големи езикови модели, които са в основата на AI алгоритмите, отбелязва Вашингтон Пост.
Според управляващия партньор на Clarkson – Райън Кларксън, компанията представя в съда интересите на „реални хора, чиито данни са били откраднати и с тях е злоупотребено, за да се създаде тази много мощна технология”.
Става дума за публично достъпни потребителски данни, като коментари в социалните мрежи, публикации в блогове, статии в Wikipedia и др. Официалните представители на OpenAI засега се въздържат от коментари по заведения съдебен иск.
Делото на Clarkson засяга наболял проблем в областта на генеративните невронни мрежи, като AI ботове и генератори на изображения. Такива инструменти се обучават на огромно количество данни, налични в интернет. След завършване на обучението, големите езикови модели могат да формират отговори при общуване с човек, да композират стихотворения или истории, да водят сложни разговори и т.н.
Проблемът е, че хората, на чиито данни стъпва обучението на невронните мрежи, не са дали съгласие за използване на тази информация на разработчици като OpenAI.
„Цялата тази информация се използва в мащаб, въпреки че никога не е била предназначена за обучение на големи езикови модели”, казва Кларксън. Той очаква съдът да постави определени граници за това как могат да се обучават AI алгоритми и как хората могат да бъдат компенсирани за използването на техните данни. Компанията вече има група ищци и активно търси нови клиенти.
Делото на Clarkson срещу OpenAI не е първото, в което разработчиците на AI са обвинени в злоупотреба с данни. През ноември миналата година беше заведено дело срещу OpenAI и Microsoft във връзка с това, че компаниите са използвали програмния код на платформата GitHub за обучение на AI инструменти.
През февруари т.г. платформата Getty Images съди стартъпа Stability AI, обвинявайки го в незаконно използване на изображения, за да обучи своята генеративна невронна мрежа, която стои зад иновативната услуга за генериране на изображения.