오픈웨이트 모델이란? 오픈소스 LLM과의 차이·라이선스 완전 정리

이 글을 끝까지 읽으면 오픈웨이트(open weights) 모델이 정확히 무엇인지, 오픈소스 LLM과 무엇이 다른지, 그리고 Llama·Gemma·Qwen·Mistral 같은 주요 모델의 라이선스 차이와 로컬 구동·실무 가치를 스스로 구분해 판단할 수 있습니다. "오픈웨이트"라는 단어는 광고에서 "오픈소스"와 자주 뒤섞여 쓰입니다. 그러다 보니 정작 회사에서 돈을 받고 서비스할 때 라이선스(사용 약속) 조항을 잘못 읽어 곤란을 겪는 경우가 늘고 있습니다.

이 글은 2026년 6월 확인 기준 정보입니다. AI 분야는 변화가 빨라 발행 후 모델 라이선스·약관이 달라질 수 있습니다. 도입 직전에는 각 모델의 공식 라이선스 문서를 다시 확인해야 합니다.

오픈웨이트 모델이란 무엇인가

먼저 어려운 단어 하나만 풀고 가겠습니다. AI 모델은 수많은 숫자 값으로 동작합니다. 이 숫자들을 가중치(weights)와 바이어스(bias), 묶어서 파라미터라고 부릅니다. 쉽게 말하면 AI의 '두뇌 설정값'입니다. 이 설정값이 정해져야 비로소 AI가 답을 내놓을 수 있습니다.

오픈웨이트 모델은 이 두뇌 설정값을 누구나 내려받아 자기 컴퓨터나 서버에서 돌리고, 입맛에 맞게 고칠 수 있게 공개한 모델입니다. 핵심은 "무엇을 공개하는가"입니다.

오픈웨이트가 공개하는 것은 학습이 끝난 두뇌 설정값(파라미터) 한 덩어리입니다. 이 설정값만 있으면 모델을 내 PC나 서버에서 실행할 수 있습니다. 비유하자면 완성된 요리 한 접시를 받는 것과 같습니다. 먹을 수는 있지만, 그 요리를 어떻게 만들었는지는 알 수 없습니다.

왜냐하면 오픈웨이트는 학습 코드(만드는 방법), 학습에 쓴 데이터(재료), 전체 학습 과정(레시피)은 보통 함께 주지 않기 때문입니다. 그래서 모델을 "사용"할 수는 있어도, 똑같은 모델을 처음부터 "다시 만들어 재현"할 수는 없습니다. 다시 만들려면 재료와 레시피가 필요한데, 오픈웨이트는 거기까지는 열어주지 않습니다.

오픈웨이트와 오픈소스 LLM의 차이

가장 헷갈리는 지점이 바로 이 둘의 차이, 즉 오픈소스 LLM 차이입니다. 결론부터 말하면 오픈소스를 정의하는 단체인 오픈소스 이니셔티브(OSI)는 오픈웨이트를 '진짜 오픈소스 AI'로 인정하지 않습니다.

OSI는 2024년 10월, 약 2년간의 논의를 거쳐 오픈소스 AI 정의(Open Source AI Definition, OSAID 1.0)를 발표했습니다(출처: OSI, opensource.org). 이 정의에 따르면 오픈소스 AI는 네 가지 자유를 보장해야 합니다. 바로 사용·연구·수정·공유입니다. 게다가 학습 코드와 학습 데이터 정보까지 충분히 제공해, 다른 사람이 "사실상 똑같은 모델"을 다시 만들 수 있어야 합니다.

오픈웨이트는 이 마지막 조건, 즉 '다시 만들 수 있어야 한다'는 부분을 채우지 못합니다. 두뇌 설정값(가중치·바이어스)만 줄 뿐, 재료(학습 데이터)와 레시피(학습 과정)는 빠져 있기 때문입니다. 그래서 OSI는 오픈웨이트를 '진짜 오픈소스 AI로 가는 출발점이자 차선책' 정도로 봅니다(2026년 6월 확인 기준).

정리하면 오픈웨이트는 '완성된 요리만 주는 것'이고, 오픈소스 AI는 '요리 + 레시피 + 재료 목록까지 다 주는 것'이라고 생각하면 쉽습니다. 아래 표로 한눈에 비교해 보겠습니다.

구분	오픈웨이트(완성 요리만)	오픈소스 AI(요리+레시피+재료)
두뇌 설정값(가중치·바이어스)	공개함	공개함
내 컴퓨터에서 돌리기·고치기	가능함	가능함
만드는 코드(레시피)	보통 안 줌	공개함
학습 데이터 정보(재료)	안 줌	다시 만들 수 있을 만큼 줌
OSI가 '오픈소스 AI'로 인정	인정 안 함	인정함

'완전한 오픈소스 AI'의 예로는 AI2(Allen Institute for AI)의 OLMo 2가 자주 언급됩니다. OLMo 2는 두뇌 설정값뿐 아니라 만드는 코드, 학습 데이터, 평가 방법까지 모두 공개하고 Apache 2.0이라는 자유로운 약속으로 배포됩니다(2026년 6월 확인 기준). 설정값만 여는 오픈웨이트와, 모든 것을 여는 완전 오픈소스 AI의 차이를 잘 보여주는 사례입니다.

라이선스가 진짜 차이를 만든다

여기서 라이선스라는 말이 자주 나옵니다. 라이선스는 어렵게 생각할 필요 없습니다. 친구에게 장난감을 빌릴 때 "이렇게 써도 되고, 저건 하면 안 돼"라고 정하는 사용 약속과 같습니다. 모델을 가져다 쓸 때 '무엇을 해도 되고 무엇은 안 되는지'를 정해 놓은 규칙입니다.

같은 오픈웨이트라도, 실제로 무엇까지 할 수 있는지는 바로 이 라이선스가 결정합니다. AI 도입을 검토하는 한 개발팀이 "오픈웨이트니까 다 똑같이 자유롭겠지"라고 넘겨짚으면, 막상 돈을 받는 서비스로 만들 때 막힐 수 있습니다. 모델마다 약속의 내용이 크게 다르기 때문입니다.

Apache 2.0·MIT — 약속이 가장 느슨한 쪽

Apache 2.0과 MIT는 '거의 마음대로 써도 좋다'에 가까운 너그러운 약속입니다. Alibaba의 Qwen3 오픈웨이트는 2025년 4월 28일 공개되었고 Apache 2.0으로 배포됩니다. Apache 2.0은 돈을 받는 상업 사용, 모델 고치기, 다시 배포하기를 별도 비용 없이 허용합니다(2026년 6월 확인 기준).

DeepSeek-R1은 코드와 두뇌 설정값을 MIT로 공개해, 상업 사용·수정뿐 아니라 증류(distillation)라는 학습 방식까지 포함한 응용도 허용합니다. 증류는 큰 모델의 지식을 작은 모델에 옮겨 담는 방법이라고 이해하면 됩니다. 다만 같은 DeepSeek 계열이라도 버전마다 약속이 달랐던 적이 있습니다. V3 초기에는 코드가 MIT, 두뇌 설정값은 별도 라이선스였고, 이후 버전에서 MIT로 통일되었습니다(2026년 6월 확인 기준, 버전별 상이).

Llama — 조건이 붙는 커뮤니티 라이선스

Meta의 Llama는 흔히 "오픈"이라고 불리지만, MIT·Apache처럼 무제한으로 자유로운 약속은 아닙니다. 대표적으로 월간 활성 사용자(MAU) 제한이라는 조건이 붙습니다. MAU란 한 달 동안 그 서비스를 쓴 사람 수를 말합니다.

직전 달 MAU가 7억 명을 넘는 서비스는 Meta에 따로 라이선스를 요청해야 합니다. 그리고 Meta가 직접 허락해 주기 전까지는 그 권리를 쓸 수 없습니다(출처: llama.com 라이선스, Llama 2·3·3.1·3.2 동일, 2026년 6월 확인 기준). 쉽게 말해 '너무 큰 회사가 쓰려면 따로 허락받아야 한다'는 규칙입니다. 여기에 더해 사용 정책(AUP)도 지켜야 합니다. 즉 MIT나 Apache에는 없는 상업적 제한이 붙은, 조건부 약속입니다.

Gemma·Mistral — "오픈웨이트지만 무제한 자유는 아님"

Google의 Gemma(현행 계열)는 Apache나 MIT가 아니라, Google이 따로 만든 약관인 Gemma Terms of Use로 배포됩니다. 돈을 받는 상업 사용은 허용하지만 금지 사용 정책(Prohibited Use Policy)을 지켜야 합니다. 특히 이 모델을 고쳐 만든 파생 모델(Model Derivative)에도 같은 약관과 사용 제한이 그대로 따라붙습니다(pass-through). 즉 빌린 장난감으로 새 장난감을 만들어도, 원래의 사용 약속이 그대로 이어진다는 뜻입니다(출처: ai.google.dev/gemma/terms, 2026년 6월 확인 기준). "오픈웨이트지만 무제한 자유는 아니다"를 보여주는 대표 사례입니다.

Mistral은 같은 회사 안에서도 모델과 시점에 따라 약속이 달랐던 경우입니다. 현행 오픈 모델은 Apache 2.0이라 상업 사용·직접 서버 운영·고치기에 제약이 적습니다. 다만 과거 일부 모델은 비상업 제한이 있는 MRL(Mistral Research License) 계열로 배포된 이력이 있습니다(2026년 6월 확인 기준). 그래서 특정 모델을 쓸 때는, 그 모델의 라이선스를 '쓰는 시점 기준으로' 직접 확인해야 합니다.

로컬 구동과 실무 가치

오픈웨이트 모델의 가장 큰 쓸모는, 두뇌 설정값을 내가 직접 가지고 내 컴퓨터에서 돌릴 수 있다는 점입니다. 이렇게 내 환경에서 직접 돌리는 것을 로컬 LLM이라고 부릅니다. 외부 회사의 서버(API)에 의존하지 않으니 내 데이터가 밖으로 나가지 않고, 쓸 때마다 돈을 내는 구조에서도 벗어날 수 있습니다.

로컬 LLM을 돌리는 데 필요한 컴퓨터 성능은 모델의 크기(파라미터 수)와 양자화(quantization) 수준에 따라 크게 달라집니다. 양자화는 사진 화질을 살짝 낮춰 파일 용량을 줄이는 것과 비슷합니다. 모델의 정밀도를 조금 낮추는 대신 더 가볍게 만드는 방법입니다.

그래서 같은 모델이라도 더 작은 버전을 고르거나 양자화를 더 세게 적용하면, 더 낮은 사양으로도 돌릴 수 있습니다. 대신 정밀도와 자원 사용량 사이에 절충이 생깁니다. 따라서 "이 정도 사양이면 무조건 된다"는 식의 고정된 숫자보다는, 쓰려는 모델의 크기와 양자화 옵션을 먼저 정하는 접근이 안전합니다.

또 하나 큰 가치는 파인튜닝의 자유입니다. 파인튜닝은 기성품을 내 입맛에 맞게 고치는 일이라고 보면 됩니다. 두뇌 설정값이 공개돼 있으면, 우리 회사 데이터로 우리 분야에 특화된 모델로 다듬을 수 있습니다. 다만 앞서 본 것처럼 파생 모델에 원래 약관이 그대로 따라붙는 경우(Gemma 등)가 있습니다. 그러니 고친 결과물을 배포하거나 상업화할 때는, 원본 라이선스의 '승계 조항'을 함께 확인해야 합니다.

모델 도입을 실제 개발 흐름에 연결하는 단계가 궁금하다면 AI 개발자 워크플로우 가이드를, 오픈웨이트처럼 헷갈리는 용어를 한 번에 정리하려면 AI 네이티브 개발자 용어집을 함께 참고하면 도움이 됩니다.

도입 전 체크리스트

오픈웨이트 모델을 실무에 들이기 전, 다음을 순서대로 확인하면 라이선스 함정을 줄일 수 있습니다.

이 모델이 "오픈웨이트(완성 요리만)"인지, "완전 오픈소스 AI(레시피·재료까지)"인지 구분합니다. 다시 만들 수 있는지와 학습 데이터 공개 여부가 갈림길입니다.
라이선스 종류를 확인합니다. Apache 2.0·MIT는 약속이 느슨하고, Llama 커뮤니티 라이선스·Gemma 커스텀 약관은 조건이 붙습니다.
상업화 계획, 사용자 규모(MAU), 파생 모델 배포 계획이 라이선스 조항에 걸리는지 점검합니다.
로컬 LLM 사양은 모델 크기와 양자화 수준을 먼저 정한 뒤 계산합니다.
도입 직전에 각 모델의 공식 라이선스 문서를 다시 확인합니다(시점에 따라 약관이 바뀔 수 있음).

정리

오픈웨이트 모델은 학습된 두뇌 설정값을 공개해 로컬 구동과 파인튜닝을 가능하게 합니다. 하지만 레시피와 재료(학습 코드·데이터)까지 여는 오픈소스 AI와는 OSI 기준에서 분명히 다릅니다. 이것이 핵심 오픈소스 LLM 차이입니다. 같은 오픈웨이트라도 Apache 2.0·MIT처럼 약속이 느슨한 경우가 있고, Llama·Gemma처럼 MAU 제한이나 파생 약관 승계 같은 조건이 붙는 경우도 있습니다. 결국 모델 선택의 진짜 차이는 라이선스를 정확히 읽는 데서 갈립니다. 도입을 검토한다면, 쓰려는 모델의 공식 라이선스를 확인 시점 기준으로 직접 살펴보는 습관이 가장 안전한 출발점입니다.

참고한 공식 자료

아래는 이 글의 라이선스·정의 설명이 근거로 삼은 공식 1차 자료입니다(2026년 6월 확인 기준).