모델

커맨드 A

Command A (Cohere)

Cohere가 만든 기업용 대규모 언어 모델로, GPU 두 장만으로 돌아가는 가벼운 몸집으로 도구 사용·RAG·다국어 작업을 잘 처리하도록 만들어졌다.

누가 왜 만들었나

Command A는 캐나다 AI 기업 Cohere가 2025년 3월 내놓은 대규모 언어 모델이다. Cohere는 처음부터 일반 소비자용 챗봇이 아니라 은행·정부·제조 같은 기업 현장에서 쓸 모델을 만들어 온 회사다. 그래서 Command A의 설계 목표도 분명하다. 화려한 점수 경쟁보다는, 회사 내부 문서를 검색해 답하고(RAG), 사내 시스템을 도구로 호출하고, 여러 나라 언어를 동시에 다루는 실무 작업을 안정적으로 잘 해내는 것이다.

무엇이 다른가

가장 큰 차별점은 적은 자원으로 돌아간다는 점이다. 1110억 개 파라미터에 25만 6천 토큰의 긴 컨텍스트를 다루면서도 A100·H100 GPU 단 두 장이면 구동되고, 이전 모델인 Command R+보다 추론 처리량이 1.5배 높다. 보통 이 정도 성능을 내려면 GPU를 훨씬 많이 깔아야 하는데, Command A는 같은 일을 더 싸고 빠르게 처리하도록 효율에 초점을 맞췄다. 덕분에 기업이 자체 서버에 모델을 직접 올려 데이터를 외부로 내보내지 않고 운영하기가 수월하다.

개발자가 어떻게 쓰나

Cohere API에서 모델 이름 command-a-03-2025로 호출하거나, AWS Bedrock·Oracle OCI 같은 클라우드에서 바로 불러 쓸 수 있다. 모델 가중치가 Hugging Face의 CohereLabs/c4ai-command-a-03-2025로 공개돼 있어 vLLM이나 Transformers로 자체 환경에 올리는 것도 가능하다. 실무에서는 사내 위키나 계약서 더미를 벡터 DB에 넣어두고 Command A로 RAG 파이프라인을 꾸려 "이 조항이 어느 문서에 있나"를 답하게 하거나, 사내 API를 도구로 등록해 두고 모델이 직접 조회·실행하는 에이전트로 쓰는 식이다. 기본값이 대화체로 장황하게 답하고 마크다운을 쓰기 때문에, 간결한 답만 필요하면 시스템 프롬프트로 "마크다운 없이 답만 달라"고 지시하는 게 권장된다.

주의할 점

범용 채팅이나 창의적 글쓰기보다 기업 업무에 최적화된 모델이라, 일상 대화용으로는 더 큰 프론티어 모델만큼의 폭넓은 만족도를 기대하기 어렵다. 또 2025년 8월에는 추론 특화 버전인 Command A Reasoning, 2026년에는 MoE 구조의 오픈소스 Command A+가 따로 나왔으므로, 작업 성격에 맞는 변종을 골라 쓰는 편이 좋다.

#Cohere#엔터프라이즈#RAG#에이전트

← AI Wiki에서 더 보기

updated at 2026-06-08