상세 컨텐츠

본문 제목

[OpenAI Dev Day] ③ 멀티모달 갖춘 GPT API (TTS 추가, 6명 목소리) 챗GPT

Tech news

by 애피스트 APPIST 2023. 11. 8. 08:10

본문

반응형
[2023년11월7일] 챗GPT 개발사 오픈AI가 6일(현지시간) 미국 샌프란시스코 본사에서 '오픈AI 개발자 회의(OpenAI Dev Day)'를 열고 챗GPT 업데이트를 발표했다. 다음은 Dev Day 내용에 대한 시리즈 작성을 한다.

③ 멀티모달 갖춘 GPT=4.0터보 API


비전능력
GPT-4 터보는 API를 통해 이미지를 입력으로 받아 캡션 생성, 실제 이미지 분석, 그림 있는 문서 읽기 등 각정 작업을 수행할 수 있다. 사용 사례를 가능하게 합니다. 예를 들어, 덴마크 비영리 스타트업인 비마이아이즈는 비전능력을 사용하여 시각 장애가 있거나 시력이 낮은 사람들을 위한 서비스를 내놓았다. 제품을 식별하거나 매장을 탐색하는 등의 일상적인 작업을 할 수 있도록 돕는 것이다. 개발자는 API에서 gpt-4-vision-preview를 사용해 테스트 할 수 있다. 프리뷰라는 이름이 붙었기 때문에, 날짜는 미정이다. 가격은 입력 이미지 크기에 따라 달라진다. 예를 들어, 1080×1080 픽셀의 이미지를 GPT-4터보로 전송하는 비용은 $0.00765입니다. 즉 가격이 약 10원꼴이다.

DALL-E 3
개발자는 챗GPT 플러스 및 엔터프라이즈 사용자를 대상으로 출시한 DALL-E 3를 dall-e-3을 모델로 지정해 이미지 API를 통해 앱과 제품에 직접 통합할 수 있다. 현재 스냅 Snap, 코카콜라 Coca-Cola, 셔터스톡 Shutterstock과 같은 기업들은 DALL-E 3를 사용해 고객과 캠페인을 위한 이미지와 디자인을 프로그래밍 방식으로 생성했다. 이전 버전의 DALL-E와 마찬가지로 이 API에는 개발자가 애플리케이션을 오용으로부터 보호할 수 있도록 내장된 조정 기능이 통합돼 있다. 가격은 생성된 이미지당 0.04달러부터 시작한다. 전송당 52.48원 수준.


텍스트 음성 변환(TTS)
지금껏 없던 항목이다. 개발자는 텍스트 음성 변환 API를 통해 텍스트에서 사람 음성을 생성할 수 있다. 새로운 TTS 모델은 선택할 수 있는 6개의 사전 설정 음성과 두 가지 모델 변형인 TTS-1 및 TTS-1-HD를 제공한다. TTS는 실시간 사용 사례에 최적화되어 있고 TTS-1-HD는 품질에 최적화돼 있다. 가격은 입력 1,000자당 $0.015부터 시작한다. 약 20원부터.

목소리는 크게 남4명 여2명이다.
Alloy: 미국 발음 남성
Echo: 미국 발음 남성(발음을 길게 끄는 느낌)
Fable: 미국 발음 남성(톤이 높은 느낌)
Onyx: 미국 발음 남성(톤이 낮은 느낌)
Nova: 미국 발음 여성 Shimmer: 미국 발음 여성

현재 6명의 발음으로 시연을 들을 수 있다. 황금빛 태양이 수평선 아래로 내려앉아 고요한 초원에 긴 그림자를 드리우면 세상은 조용해지고 평온함이 지구를 감싸며 모든 생명체에게 평화로운 밤의 휴식을 약속합니다.

 

[OpenAI Dev Day] ① GPT-4.0터보 "책을 통째로 이해한다" (128k 토큰)

[2023년11월7일] 오픈AI가 6일(현지시간) 미국 샌프란시스코 본사에서 '오픈AI 개발자 회의(OpenAI Dev Day)'를 열고 챗GPT 업데이트를 발표했다. 다음은 Dev Day 내용에 대한 시리즈 작성을 한다. ① GPT-4.0

appist.tistory.com

 

 

[OpenAI Dev Day] ② AI 코드 몰라도, AI챗봇 만든다 (에이전트 플레이그라운드)

[2023년11월7일] 오픈AI가 6일(현지시간) 미국 샌프란시스코 본사에서 '오픈AI 개발자 회의(OpenAI Dev Day)'를 열고 챗GPT 업데이트를 발표했다. 다음은 Dev Day 내용에 대한 시리즈 작성을 한다. ② AI 코드

appist.tistory.com

 

 

[OpenAI Dev Day] ③ 멀티모달 갖춘 GPT API (TTS 추가, 6명 목소리)

[2023년11월7일] 오픈AI가 6일(현지시간) 미국 샌프란시스코 본사에서 '오픈AI 개발자 회의(OpenAI Dev Day)'를 열고 챗GPT 업데이트를 발표했다. 다음은 Dev Day 내용에 대한 시리즈 작성을 한다. ③ 멀티모

appist.tistory.com

 

반응형

관련글 더보기