멀티모달 AI(이)란 무엇인가요?

AI GLOSSARY

멀티모달 AI(이)란?

Multimodal AI

A. 멀티모달 AI(이)란

텍스트뿐 아니라 이미지·음성·영상 등 여러 종류의 정보를 다루는 AI입니다. 본 이미지를 설명하거나 음성으로 대화할 수 있습니다.

멀티모달 AI는 텍스트·이미지·음성·영상 등 여러 모달리티(정보의 종류)를 한꺼번에 이해하고 생성할 수 있습니다. 이미지를 업로드해 그 내용을 묻거나 음성으로 대화할 수 있습니다.

많은 주요 AI 챗봇이 멀티모달 기능을 강화하고 있으며, 이미지 입력·이미지 생성·음성 대화 지원 여부가 기능 비교에서 중요한 포인트가 되었습니다.