마이크로소프트, 구글과 오픈AI를 겨냥한 AI 모델 공개
최근 마이크로소프트가 자사의 AI 모델을 공개하며 오픈AI와 구글에 도전장을 내밀었다. 이 회사는 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2의 세 가지 독자 모델을 출시하였다. 이 모델들은 마이크로소프트 파운드리 플랫폼과 MAI 플레이그라운드를 통해 제공된다.
마이크로소프트 AI 모델의 기능
마이크로소프트의 새로운 AI 모델 삼총사는 듣기, 말하기, 보기의 다양한 사용 사례를 포함한다. 예를 들어, MAI-Transcribe-1은 25개 언어를 지원하는 음성 인식 모델로, 마이크로소프트의 기존 Azure Fast 서비스보다 2.5배 빠른 속도로 음성을 텍스트로 변환할 수 있다. 이 모델은 단 10명의 팀에 의해 개발된 것을 알리는 것은 흥미로운 사실이다.
MAI-Voice-1은 단 1초 만에 60초 분량의 자연스러운 오디오를 생성할 수 있으며, 짧은 오디오 클립을 기반으로 맞춤형 음성을 생성하는 것도 지원한다. 또한 MAI-Image-2는 Arena.ai 이미지 생성 리더보드에서 이미 상위 3위에 올랐으며, 현재는 Bing과 PowerPoint에 통합되어 사용되고 있다.
이 모든 것은 하루아침에 이루어진 일이 아니다. 사실 마이크로소프트는 2025년 10월까지 오픈AI와의 계약상 자사의 AI 모델을 개발할 수 없는 제약이 있었다. 두 회사는 2019년에 계약을 체결하여 마이크로소프트가 오픈AI의 모델에 대한 라이센스를 취득하는 대신 오픈AI의 클라우드 인프라를 지원하는 조건이었다.
오픈AI와의 관계
이런 제약이 해소된 이후 마이크로소프트는 독자적인 AI 모델을 출시하게 되며, 이는 코파일럿과 팀스의 뒤편에서 조용히 작동해왔다. 현재 개발자들은 파운드리 플랫폼을 통해 이러한 모델들을 활용하여 다양한 응용 프로그램을 개발할 수 있다.

그러나 마이크로소프트가 오픈AI와의 관계를 완전히 정리할 준비가 되었는지는 의문이다. 마이크로소프트 AI의 CEO인 무스타파 슐레이만은 회사가 여전히 오픈AI 파트너십에 헌신하고 있음을 재확인했다. 이러한 모델들이 등장하면서도 마이크로소프트는 협력이 필요한 전략을 유지하고 있으며, 가격대 또한 아마존과 구글의 비슷한 제품보다 낮은 수준으로 설정되어 있다. 이러한 AI 모델들이 우수한 성능을 발휘한다면 MAI 모델 패밀리는 마이크로소프트의 전체 AI 제품 포트폴리오의 중추가 될 가능성이 높다.
필자의 단상
필자는 마이크로소프트가 오픈AI와의 파트너십을 지속하면서도 독자적인 AI 모델을 개발하는 이중 전략이 매우 효과적일 것이라 생각한다. AI 기술의 발전 속도와 이를 통한 경쟁이 심화되는 가운데, 마이크로소프트가 자사 AI 생태계를 더욱 확장하는 모습을 기대한다. 앞으로 어떻게 이러한 기술들이 실제 비즈니스에 적용될지, 그리고 소비자들에게 어떤 변화를 가져올지 주목해야 할 시점이다.
함께 보면 좋은 글
참고 및 출처: Microsoft, digitaltrends