#구글인공지능 #제미니 #제미니 #chatgpt #멀티모달 인공지능 #대규모 멀티태스킹 언어이해 테스트 #MMLU #새로운 도약 구글 멀티모달 AI 제미니 출시

구글은 지난 12월 6일 인공지능 기반 LLM 모델인 제미니(Gemini)를 공개했다. 구글은 오픈AI(OpenAI)의 GPT4뿐만 아니라 인간 전문가보다 언어 이해도가 뛰어난 최초의 AI 언어 모델로 소개했다. Gemini is Open AI의 Chat GTP의 기반이 되는 GPT와 같은 AI 모델입니다. 제미니(Gemini)는 텍스트와 이미지를 인식하고, 음성으로 말하거나 듣거나, 심지어 코드까지 할 수 있는 능력을 갖춘 멀티모달 AI로 탄생한 것으로 전해진다. 멀티모달이란 무엇입니까? 이는 여러 입력을 동시에 수락하고 처리할 수 있음을 의미합니다. 기존의 인공지능 서비스는 텍스트, 이미지, 음성을 선택해야만 각 입력에 응답하는… 인공지능 서비스의 완전히 새로운 도약이라고 볼 수 있습니다. 쉽게 말하면 사람 모양의 로봇을 만들어 설치하면 로봇이 보고 듣고 판단하고 말할 수 있게 되는 것이다. ^^ 대부분의 지표에서 기존 chatGPT(GPT-4 포함) AI 서비스의 성능을 넘어섰다고 합니다. 이런 지표를 보면 인간보다 똑똑하다는 뜻인데… 실제로 기술 발전은 눈에 보일 정도로 빠르게 진행되고 있다. 앞으로 상황이 어떻게 전개될지 무섭습니다. 머신러닝 학습 정도에 따라 3가지 모델이 출시됐는데, 조만간 구글의 인공지능 챗봇인 바드(Bard)에 범용 모델 ‘제미니 프로 모델(Gemini Pro Model)’이 탑재될 것으로 전해진다. ‘그녀’ 영화 속 사만다가 먼 길을 온 것 같은 느낌이 든다. 내년 초에 그녀를 만나자. ^^

Gemini – Google DeepMindGemini는 이미지, 비디오, 오디오 및 코드 전반에 걸쳐 원활하게 추론하는 다중 모드를 위해 처음부터 구축되었습니다.deepmind.google

