게티 이미지가 웹 스크래핑 없이 생성형 AI 모델을 구축한 방법

AI 아트

(출처: Andrey Suslov/Shutterstock)

생성형 AI는 거의 모든 이미지를 만들어낼 수 있지만, 그 이미지의 출처나 저작권자에 대한 정보는 거의 제공하지 않습니다. 최근 스튜디오 지브리와 OpenAI 사이에서 발생한 논쟁은 이 문제의 심각성을 보여주었습니다. 하야오 미야자키와 관련이 없고 그의 작품을 모방할 권한도 없었음에도 불구하고, 스튜디오의 독특한 애니메이션 스타일을 모방한 AI 생성 이미지들이 바이럴이 되었습니다.

AI가 범람하는 세상에서 AI 모델이 스크래핑되고 허가받지 않은 콘텐츠로 훈련되는 경우가 많은 가운데, 게티 이미지는 다른 종류의 도구를 제공합니다: 라이선스가 있는 인간 제작 콘텐츠만으로 맞춤 제작된 이미지 생성 모델로, 기여자들이 자신의 작업에 대해 보상받을 수 있는 로열티 시스템이 갖춰져 있습니다.

게티 이미지의 AI/ML 책임자인 안드레아 갈리아노가 이것이 실제로 어떻게 작동하는지 설명했습니다. 그녀의 팀은 회사의 검색 및 생성형 AI 노력을 감독하고 있으며, 이는 광고 및 마케팅 캠페인에 사용되는 이미지, 일러스트레이션 및 비디오로 구성된 게티 이미지의 크리에이티브 측면에 뿌리를 두고 있습니다. 회사의 유명인, 정치, 시사를 다루는 에디토리얼 콘텐츠와 달리, 크리에이티브 라이브러리는 라이선스가 있는 기여자 콘텐츠에서만 가져온 것으로 저작권 문제가 없는 기반을 제공합니다.

게티 이미지는 AI 생성기에 엄격한 안전장치를 구축했습니다: 알려진 초상이나 인식 가능한 상표를 생성하지 않아 상업적 사용에 안전한 콘텐츠를 보장합니다. 갈리아노는 고객들이 법적 위험에 대한 걱정 없이 자유롭게 사용할 수 있는 시각적 자료가 필요하다고 말합니다. 목표는 양쪽 모두에서 창의성을 지원하는 것입니다: 사용자들이 경계를 넓힐 수 있도록 역량을 강화하는 동시에 이 모든 것을 가능하게 하는 아티스트들에게 계속 투자하는 것입니다.

"우리는 이것이 창의성을 높이고 고객, 크리에이티브, 아티스트들이 더 개념적이거나 창의성 측면에서 경계를 넓힐 수 있게 해준다고 진심으로 생각합니다. 하지만 우리는 크리에이터를 보호하고 상업적으로 안전한 방식으로 이루어지도록 하면서 그 힘을 활용하고 싶습니다."라고 갈리아노는 말했습니다.

인터넷에서 스크래핑한 공개 데이터로 모델을 훈련시키는 대신, 게티는 약 2억 개의 이미지로 구성된 라이선스가 있는 크리에이티브 라이브러리에 전적으로 의존하며, 기여자들은 제품 수명 동안 보상을 제공하는 수익 공유 모델을 통해 보상받습니다. 갈리아노는 콘텐츠가 "사진가와 기여자로부터 라이선스를 받았으며, 일회성 수수료가 아닌 반복적인 기준으로 해당 기여자들에게 보상을 돌려줍니다. 생성 도구가 창출하는 수익 비율에 따라 영원히 보상을 제공합니다."라고 말합니다.

AIwire가 테스트한 게티 이미지의 AI 생성 모델

AIwire는 게티 이미지의 AI 생성 모델을 테스트하여 아티스트와 그의 AI 어시스턴트 이미지를 만들었습니다. 사용자 인터페이스는 매우 직관적이었으며, 내장된의 프롬프트 빌더는 효과적이고 사용하기 쉬웠습니다. 또한 추가 프롬프팅을 사용하여 세부 조정하고 싶은 영역을 하이라이트하는 특별 도구를 사용하여 이미지를 미세 조정할 수 있었습니다.

많은 생성 도구와 달리 게티 이미지의 모델은 구체적인 것을 제공합니다: 법적 보증과 상업적 사용 가능성입니다. 생성된 시각 자료는 이미지당 최대 $50,000의 자동 법적 보호를 제공하며, 회사는 엔터프라이즈 솔루션의 일부로 상한선 없는 배상, 영구적이고 전 세계적인 사용 권한, 인쇄 부수나 디지털 노출에 제한이 없습니다. 또한 사용자 출력물은 게티의 검색 가능한 크리에이티브 라이브러리에 추가되지 않으며, 알려진 브랜드, 로고 또는 유명인의 초상을 생성하지 못하도록 프롬프트 안전장치가 마련되어 있습니다. "상업적 사용에 안전하다"는 것은 단순한 주장이 아니라 도구의 기반입니다.

진정한 저작권 무료 이미지를 약속하는 것은 쉬운 일이 아닙니다. 이 표준을 보장하기 위해 게티 이미지의 생성 모델은 기존 기반 모델에서 수정되지 않았습니다. 대신, 시각적 생성형 AI를 개발하기 위한 다중 모달 아키텍처인 NVIDIA Edify를 사용해 엔비디아와 협력하여 처음부터 구축되었습니다. 게티 이미지는 맞춤형 모델 구축을 위한 엔드투엔드 플랫폼인 NVIDIA AI Foundry를 사용하여 모델을 훈련하고 맞춤화했습니다. 이러한 접근 방식은 회사가 데이터 파이프라인뿐만 아니라 모델이 진화하는 방식도 제어할 수 있어서 사전 훈련된 공개 소스 모델과 함께 제공되는 법적 및 창의적 위험을 피할 수 있습니다.

회사는 또한 품질이나 독창성을 장기적으로 손상시킬 수 있는 일반적인 기술적 지름길을 피합니다. 게티 이미지는 강화 학습을 사용하거나 모델 자체의 결과물로 훈련하지 않습니다. 이 결정은 생성된 이미지가 점차 반복적이고 동질적인 스타일로 좁아지는 모델 붕괴(model collapse)라는 현상을 방지하기 위해 내려졌습니다.

"기본적으로 모델의 출력이 매우 작은 픽셀 분포로 수렴하기 시작합니다,"라고 갈리아노는 설명했습니다. "우리 모델이 더 일반화된 상태를 유지하는 것이 정말 중요합니다. 그래야 다양한 픽셀과 다양한 것들을 생산할 수 있습니다."

모델 붕괴를 방지하기 위해 게티는 전 세계 아티스트와 사진작가 네트워크가 기여한 약 1천만 개의 새로운 크리에이티브 이미지를 매 분기마다 공급합니다. 그 결과는 패션에서 문화적 미학에 이르기까지 현재의 시각적 트렌드를 반영할 뿐만 아니라 이미지를 통한 스토리텔링에 필수적인 다양성과 참신함을 보존하는 시스템입니다.

Andrea Gagliano

Andrea Gagliano

"우리는 사진작가와 기여자들과 함께 일하는 큰 팀이 있으며, 이들은 라이브러리에서 격차를 찾기 위해 정량적, 정성적 연구를 지속적으로 수행하고 있습니다,"라고 갈리아노는 말했습니다. 콘텐츠 팀은 기여자들과 협력하여 이러한 격차를 해결하고, El새로운 주제, 스타일 및 과소 대표된 관점을 추가하여 회사의 핵심 라이선스 사업과 생성 모델의 건강을 지원합니다.

신선함과 다양성에 대한 강조는 모델을 관련성 있고 확장 가능하게 유지하는 데 도움이 되지만, 갈리아노가 완전히 해결되지 않았다고 생각하는 생성형 AI 분야의 더 깊은 도전을 가리킵니다: 점점 확장되는 데이터 양에 대한 의존성입니다. "이 모델들은 배고픕니다,"라고 그녀는 말했습니다. "더 많은 데이터를 계속 공급하세요. 그것이 더 나은 출력을 얻는 힘입니다. 그것은 사실입니다. 하지만 아직 충분히 탐구되지 않은 연구 영역이 있다고 생각합니다. 바로 '어떻게 이 모델들이 더 적은 데이터로 더 효율적으로 작동하게 할 수 있을까?'입니다."

이 질문은 게티의 접근 방식의 핵심입니다. 회사는 콘텐츠를 라이선스하고 크리에이터에게 보상하기로 약속했기 때문에 대규모의 무차별한 데이터셋에 의존하는 지름길을 택할 수 없습니다. 대신, 갈리아노는 고품질의 큐레이션된 콘텐츠로 더 많은 작업을 할 수 있는 모델 아키텍처 개발에 중점을 둔다고 말했습니다.

"크리에이터에게 보상하고자 하는 세상에서는 때로는 더 적은 데이터로 그렇게 해야 합니다,"라고 그녀는 말했습니다.

합성 데이터가 종종 해결책으로 제시되지만, 갈리아노는 그것이 항상 깨끗한 해결책이 아니라고 경고했습니다. "합성 데이터는 훌륭할 수 있습니다,"라고 그녀는 말했습니다. "하지만 합성 데이터 자체가 라이선스가 있는 콘텐츠로 훈련된 모델에서 훈련된 경우에만 가능합니다." 그렇지 않으면 아티스트들이 보상을 받지 못하고, 모델들은 라이선스가 없는 소스에서 더 많은 데이터를 생성할 뿐입니다.

혁신과 예술적 무결성 사이의 이러한 미묘한 균형은 갈리아노가 양쪽 측면에서 이해하는 것입니다. 그녀가 게티에서 AI 노력을 이끌기 전에, 그녀는 지금도 시각 예술가였으며, 이러한 도전을 다루는 데 고유한 위치에 있습니다.

"이것은 좋은 시각적 요소와 덜 좋은 시각적 요소를 구분하는 데 대한 감사를 제공합니다,"라고 그녀는 말했습니다. "그리고 양쪽 모두에 대한 공감과 이해를 제공합니다: 혁신을 위한 기술적 추진력과 아티스트 및 크리에이터 보호를 위한 이해를 제공합니다. 나는 더 미묘한 해결책, 양극화된 모든 것이나 아무것도 아닌 해결책을 찾는 방법에 대해 정말 열심히 생각하려고 노력합니다."