멀티모달 AI란?
Multimodal AI
A. 멀티모달 AI란
텍스트뿐 아니라 이미지·음성·영상 등 여러 종류의 정보를 다루는 AI입니다. 본 이미지를 설명하거나 음성으로 대화할 수 있습니다.
멀티모달 AI는 텍스트·이미지·음성·영상 등 여러 모달리티(정보의 종류)를 한꺼번에 이해하고 생성할 수 있습니다. 이미지를 업로드해 그 내용을 묻거나 음성으로 대화할 수 있습니다.
많은 주요 AI 챗봇이 멀티모달 기능을 강화하고 있으며, 이미지 입력·이미지 생성·음성 대화 지원 여부가 기능 비교에서 중요한 포인트가 되었습니다.