Grok 모델 파라미터, 크기 및 식별자: 완벽한 xAI 가이드 (2026)
Grok의 파라미터는 얼마나 될까요? xAI의 Grok 모델 크기, 파라미터 수, 모델 식별자, API 문자열에 대한 완벽 가이드. Grok-3, Grok-4, 그리고 6조 파라미터의 Grok-5까지 다룹니다.
요약
모든 Grok 모델 한눈에 보기 — 파라미터 수, API 식별자 문자열, 컨텍스트 윈도우:
| 모델 | 파라미터 | API 식별자 | 컨텍스트 윈도우 | 상태 |
|---|---|---|---|---|
| Grok-5 | 6조 | grok-5 (예정) | 512K+ (예정) | 2026년 1~2분기 출시 예정 |
| Grok-4.1 | ~3조 (MoE) | grok-4.1 | 256K | 현재 플래그십 |
| Grok-4.1 Mini | ~4000억 (MoE) | grok-4.1-mini | 128K | 현재 경량 모델 |
| Grok-3 | ~3조 (MoE) | grok-3 | 128K | 레거시 |
| Grok-3 Mini | ~4000억 (MoE) | grok-3-mini | 128K | 레거시 |
| Grok-2 | ~3000억 (추정) | grok-2 | 128K | 지원 종료 |
| Grok-1 | 3140억 (MoE, 860억 활성) | grok-1 | 8K | 오픈소스, 지원 종료 |
Grok의 파라미터는 몇 개인가요?
답은 어떤 Grok 모델을 말하는지에 따라 다릅니다. xAI는 여러 세대를 출시했으며, 각각 파라미터 수가 다릅니다:
Grok-1 (오픈소스, 2023)
Grok-1은 xAI의 첫 번째 공개 모델이며, 완전히 오픈소스인 유일한 Grok 모델입니다. Mixture-of-Experts (MoE) 아키텍처를 사용하며 총 3140억 개의 파라미터를 가지고 있고, 추론 시 860억 개가 활성화됩니다. 이는 모델 가중치의 약 27%만이 각 토큰에 대해 작동한다는 뜻입니다.
- 총 파라미터: 3140억
- 활성 파라미터: 860억
- 아키텍처: 8개 전문가 중 2개 활성 MoE
- 컨텍스트 윈도우: 8,192 토큰
- 라이선스: Apache 2.0 (오픈소스)
- API 문자열:
grok-1(지원 종료)
Grok-2 (2024)
Grok-2는 성능이 크게 향상되었습니다. xAI는 정확한 파라미터 수를 공개하지 않았지만, 외부 추정치에 따르면 밀집 또는 희소 아키텍처에서 약 3000억 개의 파라미터입니다. 이미지 이해와 향상된 추론 능력이 도입되었습니다.
- 총 파라미터: ~3000억 (추정, 미확인)
- 컨텍스트 윈도우: 128K 토큰
- API 문자열:
grok-2(지원 종료)
Grok-3 (2024년 말 / 2025년 초)
Grok-3은 xAI가 조 단위 모델로 도약한 모델입니다. 멤피스에 있는 100,000개 이상의 NVIDIA H100 GPU를 갖춘 Colossus 슈퍼컴퓨터에서 훈련되었으며, 약 3조 개의 총 파라미터를 가진 Mixture-of-Experts 아키텍처를 사용합니다.
- 총 파라미터: ~3조 (MoE)
- 활성 파라미터: 미공개 (추정 3000억~6000억 활성)
- 컨텍스트 윈도우: 128K 토큰
- API 문자열:
grok-3
Grok-4.1 (현재 플래그십, 2025-2026)
Grok-4.1은 xAI API와 X의 Grok 챗봇을 통해 사용 가능한 현재 프로덕션 모델입니다. Grok-3의 아키텍처를 기반으로 추가 훈련과 개선이 이루어졌습니다. 파라미터 수는 향상된 훈련 데이터와 기술로 ~3조 범위를 유지합니다.
- 총 파라미터: ~3조 (MoE)
- 컨텍스트 윈도우: 256K 토큰
- API 문자열:
grok-4.1 - Mini 변형:
grok-4.1-mini(~4000억 MoE, 128K 컨텍스트)
Grok-5 (출시 예정)
Grok-5는 파라미터 수를 6조 개로 두 배 늘릴 것으로 예상됩니다. 네이티브 멀티모달 기능(텍스트, 이미지, 비디오, 오디오)과 Tesla 차량 및 X의 실시간 데이터 접근을 지원할 예정입니다.
- 총 파라미터: 6조 (예정)
- 컨텍스트 윈도우: 512K+ (예정)
- API 문자열:
grok-5(예정) - 출시: 2026년 1~2분기
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Grok 모델 식별자 문자열 찾는 방법
API 호출에 필요한 정확한 모델 식별자 문자열은 다음과 같습니다:
xAI API (직접)
xAI API는 OpenAI 호환 형식을 따릅니다. API 호출은 다음과 같습니다:
curl https://api.x.ai/v1/chat/completions \
-H "Authorization: Bearer $XAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-4.1",
"messages": [{"role": "user", "content": "Hello"}]
}'
2026년 3월 기준 사용 가능한 모델 문자열:
| 모델 문자열 | 설명 |
|---|---|
grok-4.1 | 현재 플래그십, 최고 품질 |
grok-4.1-mini | 빠르고 비용 효율적 |
grok-3 | 이전 세대 |
grok-3-mini | 이전 세대 경량 |
사용 가능한 모델 목록 조회
API를 쿼리하여 현재 사용 가능한 모든 모델 식별자를 가져올 수 있습니다:
curl https://api.x.ai/v1/models \
-H "Authorization: Bearer $XAI_API_KEY"
이 요청은 모든 모델 객체의 JSON 목록을 반환하며, 각 객체에는 모델 식별자 문자열이 포함된 id 필드가 있습니다.
서드파티 도구에서 Grok 사용하기
많은 도구와 프레임워크가 xAI의 Grok 모델을 지원합니다. 모델 식별자 문자열은 동일하며 xAI API 기본 URL만 필요합니다:
- 기본 URL:
https://api.x.ai/v1 - 모델 ID:
grok-4.1(또는 필요한 변형) - 인증: xAI API 키를 사용한 Bearer 토큰
Grok vs 기타 프론티어 모델 (2026년 3월)
Grok은 경쟁 모델과 어떻게 비교될까요?
| 기능 | Grok 4.1 | GPT-5.2 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|---|
| 파라미터 | ~3T (MoE) | ~2T (추정) | 미공개 | 미공개 |
| 컨텍스트 윈도우 | 256K | 400K | 1M | 1M |
| SWE-bench | ~78% | 80.0% | 80.8% | 80.6% |
| GPQA Diamond | ~90% | 92.4% | 91.3% | 94.3% |
| ARC-AGI-2 | ~55% | 52.9% | 68.8% | 77.1% |
| API 가격 (입/출) | $5/$15 | $15/$60 | $15/$75 | $2/$12 |
| 오픈소스 | Grok-1만 | 아니오 | 아니오 | 아니오 |
| 실시간 데이터 | 예 (X, Tesla) | 제한적 (브라우징) | 아니오 | 예 (Google 검색) |
핵심 요점
- Grok은 실시간 데이터에서 앞서갑니다 — X와 Tesla 차량 데이터 접근은 다른 연구소가 따라올 수 없는 진정한 차별화 요소입니다.
- Grok은 추론에서 뒤처집니다 — ARC-AGI-2 격차(55% vs Gemini의 77.1%)가 상당합니다. Grok-5가 이 격차를 줄여야 합니다.
- Grok은 경쟁력 있는 가격입니다 — GPT-5.2와 Claude Opus보다 저렴하고, Gemini 3.1 Pro보다 비쌉니다.
- 파라미터 수가 품질을 결정하지 않습니다 — Grok-4.1이 가장 많은 공개 파라미터를 가지고 있지만 벤치마크를 선도하지는 않습니다. 아키텍처, 훈련 데이터, RLHF가 더 중요합니다.
Mixture-of-Experts (MoE) 파라미터 이해하기
xAI가 Grok에 "3조 개의 파라미터"가 있다고 말할 때, 그 숫자에는 맥락이 필요합니다. Mixture-of-Experts 아키텍처에서는 각 순전파 과정에서 파라미터의 일부만 활성화됩니다.
MoE 작동 방식:- 모델에는 많은 "전문가" 하위 네트워크가 있습니다
- 라우터 네트워크가 각 토큰에 대해 활성화할 전문가를 결정합니다
- 일반적으로 8~16개 이상의 전문가 중 2~4개가 토큰당 활성화됩니다
- 총 파라미터는 크지만, 계산 비용은 더 작은 밀집 모델에 가깝습니다
Grok-1은 xAI가 정확한 숫자를 확인한 유일한 모델입니다: 총 3140억, 활성 860억 (8개 전문가, 2개 활성). 이후 모델들은 전문가 구성이 공개적으로 확인되지 않았습니다.
자주 묻는 질문
현재 Grok 모델의 파라미터는 몇 개인가요?
Grok-4.1(현재 플래그십 모델)은 Mixture-of-Experts 아키텍처에서 약 3조 개의 파라미터를 보유하고 있습니다. 추론당 활성 파라미터 수는 이보다 적으며, 3000억~6000억으로 추정됩니다.
Grok의 모델 식별자 문자열은 무엇인가요?
xAI API의 현재 모델 식별자는 플래그십 모델의 경우 grok-4.1이고, 경량 변형의 경우 grok-4.1-mini입니다. API 호출 시 이 문자열을 사용하세요.
Grok은 오픈소스인가요?
Grok-1(3140억 파라미터)만 Apache 2.0 라이선스로 오픈소스입니다. 이후의 모든 모델(Grok-2, 3, 4.1 및 출시 예정인 5)은 독점입니다.
Grok의 파라미터 수는 GPT-5와 어떻게 비교되나요?
~3조 파라미터의 Grok-4.1은 프론티어 모델 중 가장 많은 공개 파라미터 수를 가지고 있습니다. GPT-5.2의 파라미터 수는 확인되지 않았지만 약 2조로 추정됩니다. 하지만 파라미터 수만으로 모델 품질이 결정되지는 않습니다.
Grok-5는 언제 출시되나요?
xAI는 6조 파라미터의 Grok-5를 2026년 1분기에 출시할 것이라고 밝혔습니다. 2026년 3월 현재 정확한 날짜는 발표되지 않았습니다. 언제든 출시될 수도 있고 2분기로 연기될 수도 있습니다.
Grok이 지원하는 컨텍스트 윈도우는 얼마인가요?
Grok-4.1은 256K 토큰을 지원합니다. Grok-4.1-mini는 128K 토큰을 지원합니다. Grok-5는 512K 이상으로 확장될 것으로 예상됩니다.
어떤 AI 모델로든 구축하세요
2026년의 AI 모델 환경은 파편화되어 있습니다 — Grok, GPT, Claude, Gemini 모두 서로 다른 강점을 가지고 있습니다. 현명한 선택은 환경이 변화할 때 모델을 교체할 수 있는 제품을 만드는 것입니다.
Y Build 는 AI 기반 제품을 위한 완전한 성장 스택을 제공합니다: 배포, Demo Cut 제품 영상, AI SEO, 분석. 어떤 모델, 어떤 프레임워크에서든 작동합니다. 무료로 시작하기 →출처:
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.