반응형
Notice
Recent Posts
Recent Comments
관리 메뉴

꿈꾸는 사람.

인공지능에서의 멀티모달(Multimodal) 본문

AI/Machine Learning

인공지능에서의 멀티모달(Multimodal)

현무랑 니니 2023. 9. 14. 14:23
반응형

배경

나는 한국의 IT 개발자로 영어로 된 IT 용어를 접할 때 언어의 차이에서 오는 문제로 개념을 파악하는데 어려움이 있다.

한글로 된 멀티모달은 일단 의미가 와닿지 않는다.

그래서 멀티모달(Multimodal)의 언어적 기원과 특징을 찾아보았다.

 

멀티모달(Multimodal)의 언어적 기원과 특징

멀티모달(multimodal)이라는 용어는 라틴어에서 유래했고  
"Multi-"는 '많은'을, "-modal"은 '방식'이나 '모드' 또는 modalis"(모양, 양식)를 의미한다. 

따라서 멀티모달은 '여러 가지 방식'이나 '여러 가지 모드'를 동시에 사용한다로 해석한다.

 

기존 IT 에서의 멀티모달

기존 IT 분야에서의 멀티모달은 사용자 인터페이스(UI)에 관한 문맥에서 많이 사용된다.

예를 들어, 터치스크린, 음성 인식, 키보드 등 다양한 입력 방식을 하나의 시스템에서 지원하는 것을 의미할 수 있다.

특징

  • 다양한 입력/출력: 여러 가지 방식으로 사용자와 상호작용
  • 접근성: 다양한 사용자 및 장치에 대한 접근성을 높임.
  • 유연성: 사용자가 원하는 대로 다양한 방식으로 서비스를 이용

 

인공지능에서의 멀티모달

인공지능에서의 멀티모달은 주로 다양한 타입의 데이터(텍스트, 이미지, 음성 등)를 동시에 처리하는 모델을 의미한다.

예를 들어, 텍스트와 이미지를 동시에 분석하여 더 정확한 결과를 도출하는 AI 모델이 그 예이다.

특징

  • 데이터 융합: 여러 타입의 데이터를 하나의 모델에서 처리
  • 고차원 분석: 단일 모드보다 더 다양한 정보를 분석하여 결과를 도출
  • 효율성: 여러 타입의 데이터를 동시에 처리하기 때문에, 개별 모델을 각각 만드는 것보다 효율적

멀티모달의 차이점

구분 인공지능에서의 멀티모달 일반 IT 에서의 멀티모달
주요 목적 데이터 분석 및 처리 사용자 인터페이스
처리하는 데이터/입력 텍스트, 이미지, 음성 등 터치, 음성, 키보드 등
핵심 특징 데이터 융합, 고차원 분석 다양한 입력/출력, 접근성
대표적인 사용 예 자연어 처리, 이미지 분석 등 스마트폰, 웹 서비스 등

 

반응형

'AI > Machine Learning' 카테고리의 다른 글

시계열 예측(Time Series Forecasting) 개요  (0) 2021.05.04
Comments