Gemini 2.0: 구글의 새로운 인공지능 모델, 멀티모달 기능 강화

Gemini 2.0: 구글의 새로운 인공지능 모델, 멀티모달 기능 강화

구글은 차세대 인공지능 모델 ‘Gemini 2.0 Flash’를 발표하며 멀티모달 기능과 도구 활용 능력을 한층 강화했다고 밝혔습니다. 이 모델은 구글 최고경영자 순다 피차이에게 있어 ‘범용 인공지능 비서’로 나아가는 중요한 진전으로 평가됩니다.

새로운 모델 소개 및 초기 도입

구글은 수요일, 실험적인 형태로 첫 번째 Gemini 2.0 Flash 모델을 공개했습니다. 이 모델은 현재 웹 기반 Gemini 앱에서 선택할 수 있으며, 곧 스마트폰 앱에서도 사용할 수 있도록 업데이트될 예정입니다.

Gemini 2.0 Flash는 이전 모델인 Gemini 1.5 Flash를 기반으로 개발되었으며, 멀티모달 입력 및 출력 기능을 포함한 새로운 기능을 추가했습니다. 구글은 이 모델을 2024년 초부터 자사의 여러 서비스에도 점진적으로 통합할 계획입니다.

멀티모달 기능과 도구 활용 능력 강화

이 모델은 텍스트, 이미지 및 오디오 데이터를 처리할 수 있으며, 단순한 텍스트 생성에서 나아가 이미지와 오디오 생성도 지원합니다. 특히, 사용자가 정의한 기능이나 코드를 실행할 수 있으며, 구글 검색과 같은 도구를 직접 호출할 수 있는 능력을 갖췄습니다.

개발자들은 Google AI Studio 및 Vertex AI의 Gemini API를 통해 새 모델에 접근할 수 있습니다. 멀티모달 출력 기능은 초기에는 일부 선택된 개발자 그룹에 한정되며, 내년 1월부터 모든 개발자가 사용할 수 있게 될 예정입니다.

CEO의 비전: ‘범용 인공지능 비서’

구글 CEO 순다 피차이는 이 모델을 ‘새로운 에이전트 시대’의 시작으로 평가하며, “Gemini 2.0은 우리가 개발한 가장 강력한 모델”이라고 강조했습니다. 그는 “이미지와 오디오 생성 같은 멀티모달 기능의 발전과 도구 활용 능력을 통해 범용 인공지능 비서라는 목표에 한 걸음 더 가까워졌다”고 말했습니다.

Gemini 2.0 Flash는 인공지능 모델의 새로운 표준을 제시하며, 다양한 서비스와 개발자 생태계에서 인공지능 활용의 가능성을 확장할 전망입니다.