copilot은 github에 공개된 수십억 개의 오픈소스들을 학습해서 코드를 제안해주는 AI이다. 주석을 통해 코드를 자동 완성할 수 있다. 현재는 베타 테스트를 하고 있고 이 단계가 지나면 유료 버전으로 출시될 예정이다.
출시되자마자 AI가 코딩을 대신 짜준다고?!라는 어그로로 많은 이목을 끌었는데 성능을 떠나서 프라이버시나 라이센스 때문에 말이 많다.
코파일럿이 제안한 다른 사람의 저작권 메시지 | source: https://blog.hrithwik.me/the-good-and-the-limitations-of-github-copilot
깃허브는 라이센스의 구분 없이 공개된 오픈소스를 무분별하게 copilot의 학습에 사용하고 있다. 깃허브 CEO는 이미 개발자가 깃허브에 가입한 순간 저작권에 대한 약관에 동의했고, 코파일럿이 그 소스를 가져다 쓰는 것은 공정 이용(fair use)에 해당한다고 말한다.
블로그 주인은 1. *copyleft 라이센스가 부여된 코드들은 저작권 보호를 엄격하게 하지 않는다. 2. 크롤링 자체는 그저 코드를 읽고 가져오는 것이므로 문제 없다. 3. 기계가 생성한 코드는 저작권 보호의 대상이 아니다. 라고 말한다.
*copyleft 라이센스 코드: 원본 코드와 동일한 라이센스로 출시되고, 공개되어야 한다.
여기에 많은 사람들(개발자들)은 1. 재가공한다해도 GPL 라이센스가 붙은 코드들을 그대로 사용하는 경우가 있어 사용하는 입장에서 저작권 침해의 위험이 있다. 2. 기계가 생성한 코드라고 면죄부를 받을 수 있는 건 아니다. 사용하는 입장에서는 법적인 책임을 져야한다. 3. 상업용, 독점적 이익을 얻기 위한 악용으로부터 창작물을 지키기 위한 라이센스의 의미를 무력화시킨다는 논리이다.
MIT, Apache 같이 기존 오픈소스를 가공해도 공개나 배포의 강제가 없는 permissive 라이센스는 상관없지만 GPL 같은 라이센스가 붙은 copyleft 오픈소스는 재생산한 코드를 공개해야한다.
개인 프로젝트에서 코파일럿을 사용한다면 그냥 공개해버리면 되지만 기업에서 코파일럿으로 코드를 짰을 때 GPL 라이센스의 오픈소스 코드를 사용하게 된다면 다른 프라이빗한 코드들과 함께 공개해야 되는 것 아닌가?
이전에 블렌더를 파면서 *GPL이라는 라이센스도 처음 알게 되었고(사실 라이센스도 거의 안씀,,) 블렌더가 깃허브에 코드를 공개하지 않는 것에 의문을 가졌다. Ton Roosendaal의 트윗을 보면 정말 선견지명이 아닐 수 없다. GPL 라이센스의 Blender가 깃허브에 코드를 올렸다면 copilot의 저작권 침해 재료로 쓰였을지도 모른다.
깃허브는 이미 마이크로소프트로부터 엄청난 투자를 받았고 마소는 깃허브를 통해 엄청난 수익을 얻으려 한다. GAFA같은 다른 거대 IT 기업들이 그렇듯이 플랫폼을 통해 데이터를 쌓고 데이터를 통해 시장에서 독점적인 위치를 차지할 것이다(이미 code management 시장에선 그런 것 같지만).
*GPL: General Public License, 자유소프트웨어재단 FSF에서 만든 오픈소스 라이센스. 소스코드 변경은 가능하지만 변경 시 원본이든 복제코드든 무조건 배포해야 한다. '공개' 자체에 강제성을 부여하는 강력한 오픈소스 라이센스이다.
source: ton twitter
깃허브를 무료로 사용하고 있다고 해서 우리가 공짜로 깃허브를 사용하는 건 아니다. star, watch 같은 다른 레파지토리에 리액션하거나 follow하고, code를 올리는 것 모두 플랫폼 노동이다. 개발자는 플랫폼에서 활동하면서 깃허브에 데이터를 제공한다.
그리고 우리가 제공한 코드로 학습해서 GPL 코드로 암살 시도를 할 수 있는 copilot을 유료로 사용해야 한다. copilot이 생산한 코드는 공개되지도 않는다. 공개하려면 코파일럿이 사용되는 private 레파지토리를 개인이 공개하거나 깃허브 쪽에서 공개해야할 것이다. 하지만 애초에 코파일럿이 제안한 코드가 GPL 라이센스의 코드인지 알 수나 있을까?
아직 법제화가 덜 된 AI 분야를 교묘하게 파고 들어서 저작권이 보호되어야할 코드들을 공개 없이 사용할 위험에 놓이게 한 것 같아 아쉽다.
copilot은 거대한 믹서기처럼 오픈소스 코드들을 갈아넣고 새로 가공한 코드를 완전 합법인 것처럼 포장한다. 사용자가 늘어나고 카피레프트 코드에 대한 법적 침해가 인정되지 않는 사례가 늘어나면 라이센스가 무슨 의미가 있을까.
기업이 이윤 창출하는 것이 나쁘다는 건 아닌데 그 배후에 마이크로소프트라는 거대 기업이 있어서 께름칙하다. 깃허브도 좋고 서비스도 좋지만. 이미 많은 걸 가졌는데 꼭 그렇게 모든 걸 가져가야만 했냐. 아무튼 라이센스 문제로 오픈소스 커뮤니티가 위축되는 일은 없었으면 좋겠다.
후련했냐 했냐 했냐 냐, 냐, 냐,,,