Openai는 중국의 Deepseek AI 모델이 서구의 상대보다 훨씬 저렴한 OpenAi 데이터, 논쟁 및 시장 혼란을 사용하여 훈련을 받았을 것이라고 의심합니다. Deepseek의 출현으로 인해 주요 AI 회사의 주가가 급격히 떨어졌으며 Nvidia는 일일 최대의 손실을 경험했습니다.
Open-Source DeepSeek-V3을 기반으로 한 DeepSeek의 R1 모델은 Chatgpt와 같은 서양 모델에 비해 교육 비용 (6 백만 달러로 추정)과 계산 요구 사항을 상당히 낮게 자랑합니다. 이 주장은 논의되지만 AI의 미국 기술 회사의 대규모 투자에 대한 우려를 제기했습니다. DeepSeek의 앱은 미국에서 다운로드 차트를 차지했습니다.
OpenAi와 Microsoft는 DeepSeek이 모델 증류에 API를 사용하여 OpenAI의 서비스 약관을 위반했는지 여부를 조사하고 있습니다. 이는 더 큰 모델에서 데이터를 추출하는 기술입니다. Openai는 중국과 다른 회사의 이러한 시도에 대한 인식을 확인하고 미국 정부와의 협력을 포함하여 지적 재산 (IP)을 보호하려는 노력을 강조했습니다.
트럼프 대통령의 AI Czar 인 David Sacks는 OpenAI 모델에서 데이터 추출에 대한 의심을 뒷받침하여 AI 회사가 그러한 관행을 방지하기위한 추가 조치를 기대했습니다.
이 상황은 저작권이있는 자료를 활용하여 Chatgpt를 훈련시킨 자체의 역사를 고려할 때 Openai의 입장의 아이러니를 강조합니다. Openai는 이전에 저작권이없는 자료없이 Chatgpt와 같은 AI 모델을 만드는 것은 불가능하다고 주장했다. 이 주장은 뉴욕 타임즈와 저작권 침해를 주장하는 17 명의 저자의 소송에 의해 더욱 복잡해집니다.
AI 훈련 데이터를 둘러싼 법적 환경은 여전히 복잡하며, 2018 년 미국 저작권 사무소 판결은 AI 생성 예술이 "인간의 마음과 창의적 표현 사이의 넥서스가 없기 때문에 저작권이 없다고 진술했다. 이 진행중인 토론은 AI 개발과 저작권이있는 자료의 사용을 둘러싼 도전과 윤리적 고려 사항을 강조합니다.
DeepSeek은 OpenAI의 모델을 사용하여 증류를 사용하여 경쟁자를 훈련시킨 혐의로 기소되었습니다. 이미지 크레딧 : Getty Images를 통한 Andrey Rudakov/Bloomberg