NVIDIA Blackwell Ultra B300 양산 개시 — AI 추론 처리량 Hopper 대비 50배
한 줄 요약: NVIDIA가 Blackwell Ultra B300 칩의 양산을 6월 12일 시작했다. 추론과 에이전트 AI 워크로드를 겨냥한 새 세대 데이터센터 GPU다.
핵심
- HBM3e 288GB 탑재 — 전작 B200(192GB) 대비 50% 증가, 대형 모델 추론에 필수적인 메모리 확장
- DGX B300 기준 추론 192 petaFLOPS, 학습 70 petaFLOPS 성능
- Hopper(H100) 대비 메가와트당 처리량 50배, 토큰당 비용 35배 절감 — 저지연 에이전트 워크로드 기준
- 설계 목표: 더 긴 컨텍스트 윈도우, 더 큰 모델, 더 높은 처리량을 요구하는 에이전트·추론 AI
왜 중요한가
ChatGPT·Claude·Gemini가 단순 응답에서 에이전트(연속 태스크 수행)로 진화하면서 추론 비용과 처리 효율이 AI 사업의 핵심 변수가 됐다. B300의 양산 개시는 2026년 하반기 데이터센터 구축 사이클의 시작점이며, AI 서비스 단가와 성능 경쟁에 직접적인 영향을 줄 것이다.
더 보기
- NVIDIA Blackwell Ultra AI Factory Platform — NVIDIA Newsroom
- Nvidia Blackwell B300 Mass Production Begins — TechnoSports