본문 바로가기

IT Insight

"트웰브랩스, 초거대 AI 영상 언어 생성 '페가수스' 공개"

728x90

 

개요

 

 

 

 

영상 이해 초거대 인공지능(AI) 개발 기업 트웰브랩스가 9일 자체 개발한 초거대 AI 영상 언어 생성 모델인 '페가수스'(Pegasus-1)를 공개했다.

 

페가수스는 긴 영상을 마치 사람처럼 정확하고 정교하게 텍스트로 요약하거나 챗GPT를 사용하듯 영상에 관한 자유로운 질의응답을 가능케 한다고 트웰브랩스는 설명했다.

 

이전에 존재하지 않았던 영상 기반의 텍스트 생성 기능이라고 회사는 강조했다.페가수스 모델의 매개변수(파라미터)는 800억 개 규모다.

 

트웰브랩스가 자체적으로 구축한 영상·텍스트 데이터세트 3억여 개 가운데 약 10% 규모인 3천500만 개가 이번 모델 개발을 위해 활용됐다.

 

페가수스는 개발자용 API(응용프로그램 인터페이스) 형태로 상용화돼 즉시 도입할 수 있다.

 

 

 

 

 

 

  DEMO 버전

 

검색어를 입력하면 ai가 해당 영상을 찾아준다 현재 youtube의 사용률도 높아지고 있으며 사람들은 텍스트보다는 직접적으로 확인이 가능한 사진이나 영상을 선호한다고 볼 수 있다. 따라서 페가수스 ai는 여러 방면의 검색 엔진으로서 효율적으로 사용이 가능할 것으로 생각이된다

 

 

 

 

 

 

 

 

 

https://www.yna.co.kr/view/AKR20231109114900017?section=industry/technology-science

 

트웰브랩스, 초거대 AI 영상 언어 생성 '페가수스' 공개 | 연합뉴스

(서울=연합뉴스) 홍국기 기자 = 영상 이해 초거대 인공지능(AI) 개발 기업 트웰브랩스가 9일 자체 개발한 초거대 AI 영상 언어 생성 모델인...

www.yna.co.kr

https://twelvelabs.io/

 

Twelve Labs - The only video search API that matters

Twelve Labs helps developers make programs that can see, listen, and understand the world as we do by giving them the most powerful video search API

twelvelabs.io