AI GLOSSARY

멀티모달 AI란?

Multimodal AI
A. 멀티모달 AI란
텍스트뿐 아니라 이미지·음성·영상 등 여러 종류의 정보를 다루는 AI입니다. 본 이미지를 설명하거나 음성으로 대화할 수 있습니다.

멀티모달 AI는 텍스트·이미지·음성·영상 등 여러 모달리티(정보의 종류)를 한꺼번에 이해하고 생성할 수 있습니다. 이미지를 업로드해 그 내용을 묻거나 음성으로 대화할 수 있습니다.

많은 주요 AI 챗봇이 멀티모달 기능을 강화하고 있으며, 이미지 입력·이미지 생성·음성 대화 지원 여부가 기능 비교에서 중요한 포인트가 되었습니다.

관련 용어

관련 데이터·랭킹

더 보기

공개 데이터와 편집부 조사를 바탕으로 한 참고값이며, 실제 이용자 수를 완전히 나타내지는 않습니다.