권혁민의 ChatGPT 03 [생활 속 스며든 AI②]
Hello, 달리! Goodbye 디자이너?
하이퀄리티 이미지, 동영상까지 척척
안녕이 아닌 협업의 중요성 더욱 강조
AI를 활용해 제작한 해리포터 캐릭터가 등장하는 '발렌시아가' 패션쇼 영상, by @demonflyingfox
ChatGPT의 GPT (Generative Pre-trained Transformer)모델은 생성형 인공 지능 모델로 딥 러닝을 사용하여 인간과 유사한 텍스트를 생성한다.
학습 모델의 인풋(Input)이 문자 텍스트와 이미지를 기반으로 학습되었기에 결과로 문자와 이미지를 내놓을 수 있다. 이렇듯 텍스트를 받아 다양한 아웃풋을 보여주는 다양한 기술과 서비스가 소개되고 있다.
생성형 AI는 텍스트를 입력하면 텍스트, 이미지, 영상을 아웃풋으로 내놓는다ⓓ
GPT모델을 이용한 DALL.E2는 문자를 입력해 이미지를 내어 놓는 서비스이다.
최근 사용자가 급증하고 있는 DALL.E2 와 미드져니(Midjourney)는 GPT 모델을, STABLE DIFFUSION은 DIFFUSION 모델을 사용하고 있다. 그리고 막강한 자본을 가진 기업이 주축이 되어 모델을 개발하고 고객이 사용의 편리성을 높여 UI로 제공하는 DALL.E2와 미드져니가 현재 사용층이 두터운 서비스로 자리잡고 있다. 다만 사용 편의성은 좋으나 유료로 사용해야 한다.
반면 STABLE DIFFUSION 모델은 무료로 오픈했고 사용자 편의성을 제공하는 다양한 UI도 무료 오픈으로 공개하는 일이 많으며 파인 튜닝으로 독특한 아이디어가 적용된 다양한 모델을 공개하고 있다.
흡사 OS 시장의 윈도우(Windows)와 리눅스(LINUX)의 상황이라고나 할까? 어떻든 모두 활발하게 사용되어 비전문가임에도 하이퀄리티의 이미지 생성에 크게 사용되고 있다.
이제는 원하는 텍스트만 주고도 영상을 만드는 것은 누구나 가능해졌고, 이미지에 소리와 얼굴 표정, 입의 움직임을 주는 모션 기능의 추가도 너무 쉬워진 세상이다.
스토리 라인만 잘 구성하고(*이 부분도 ChatGPT의 도움을 받는다면 더 쉽게 가능) 이미지로 영상으로 쉽게 제작할 수 있으니 그 활용의 범위가 공식 보고서이든 상품을 소개하는 마케팅이든 유트브의 영상이든 특별한 기술이 없어도 할 수 있는 시대가 오고 있는 것이다.
이제는 스크립트만 입력하면 알아서 제목과 영상을 입혀 동영상을 제공받는 서비스는 다양하게 있다. 스크립트를 기준으로 AI는 신속하게 스토리 라인을 잡아 준다. 여기서 사람이 개입해 수정해 줄 수 있는데 수정보다는 다른 것을 보여 달라, 즉 다시 요구 컨펌의 과정이라고 보면 된다.
# Lumen5 서비스 사례
텍스트를 넣어 영상을 제작할 수 있는 생성형 AI Lumen5ⓓ
# Midjourney 사례
프롬프트를 주면 아래와 같은 이미지를 만들어 준다.
이미지를 생성해 가면서 선택해 가는 과정을 통해 내가 원하는 이미지로 만들어 가는 과정만 거치면 일러스트를 전혀 몰라도 이미지가 완성된다.
인풋에 문자와 이미지를 동시에 입력하고 결과를 원하니, 이미지의 요소를 반영해 프롬프트 대로 원하는 이미지를 출력해 준다. 마치 모사할 이미지를 주고 그 이미지를 참고해 그려주니, 조금 더 다양한 원하는 이미지를 만들어 내는 과정이 쉬워진다.
이제 그래픽 다자이너, 웹 디자이너가 아니어도 하이퀄리티의 이미지를 만드는 것이 너무 쉬워진 세상이다.
앞으로는 지식을 축적하는 것보다 도구를 적절하게 사용하고 조합하는 능력이 더 중요해진 것은 아닌지. 그리고 혼자보다 인공지능이든, 오픈된 지식 공간의 커뮤니티이든 협업의 중요성에 대해서 다시금 생각해 보는 것이 필요하지는 않을까?
권혁민의 ChatGPT 시리즈 연재
1.Rising Star “ChatGPT”
2.생활 속 스며든 AI①
3.생활 속 스며든 AI②
4. ChatGPT 재테크 비서 사용법①
5. ChatGPT 재테크 비서 사용법②
권혁민 대표가 운영하는 F&PLUS는 중국 상해에 2019년 창립, 5년차 패션 AI 신생기업이다. 수집된 패션 빅데이터에 이미지 인식(CNN) 기술을 더해 분석과 패션 트렌드 예측을 플랫폼으로 지원하는 전문 회사이다.
권혁민의 ChatGPT 03 [생활 속 스며든 AI②]
Hello, 달리! Goodbye 디자이너?
AI를 활용해 제작한 해리포터 캐릭터가 등장하는 '발렌시아가' 패션쇼 영상, by @demonflyingfox
ChatGPT의 GPT (Generative Pre-trained Transformer)모델은 생성형 인공 지능 모델로 딥 러닝을 사용하여 인간과 유사한 텍스트를 생성한다.
학습 모델의 인풋(Input)이 문자 텍스트와 이미지를 기반으로 학습되었기에 결과로 문자와 이미지를 내놓을 수 있다. 이렇듯 텍스트를 받아 다양한 아웃풋을 보여주는 다양한 기술과 서비스가 소개되고 있다.
생성형 AI는 텍스트를 입력하면 텍스트, 이미지, 영상을 아웃풋으로 내놓는다ⓓ
GPT모델을 이용한 DALL.E2는 문자를 입력해 이미지를 내어 놓는 서비스이다.
최근 사용자가 급증하고 있는 DALL.E2 와 미드져니(Midjourney)는 GPT 모델을, STABLE DIFFUSION은 DIFFUSION 모델을 사용하고 있다. 그리고 막강한 자본을 가진 기업이 주축이 되어 모델을 개발하고 고객이 사용의 편리성을 높여 UI로 제공하는 DALL.E2와 미드져니가 현재 사용층이 두터운 서비스로 자리잡고 있다. 다만 사용 편의성은 좋으나 유료로 사용해야 한다.
반면 STABLE DIFFUSION 모델은 무료로 오픈했고 사용자 편의성을 제공하는 다양한 UI도 무료 오픈으로 공개하는 일이 많으며 파인 튜닝으로 독특한 아이디어가 적용된 다양한 모델을 공개하고 있다.
흡사 OS 시장의 윈도우(Windows)와 리눅스(LINUX)의 상황이라고나 할까? 어떻든 모두 활발하게 사용되어 비전문가임에도 하이퀄리티의 이미지 생성에 크게 사용되고 있다.
이제는 원하는 텍스트만 주고도 영상을 만드는 것은 누구나 가능해졌고, 이미지에 소리와 얼굴 표정, 입의 움직임을 주는 모션 기능의 추가도 너무 쉬워진 세상이다.
스토리 라인만 잘 구성하고(*이 부분도 ChatGPT의 도움을 받는다면 더 쉽게 가능) 이미지로 영상으로 쉽게 제작할 수 있으니 그 활용의 범위가 공식 보고서이든 상품을 소개하는 마케팅이든 유트브의 영상이든 특별한 기술이 없어도 할 수 있는 시대가 오고 있는 것이다.
이제는 스크립트만 입력하면 알아서 제목과 영상을 입혀 동영상을 제공받는 서비스는 다양하게 있다. 스크립트를 기준으로 AI는 신속하게 스토리 라인을 잡아 준다. 여기서 사람이 개입해 수정해 줄 수 있는데 수정보다는 다른 것을 보여 달라, 즉 다시 요구 컨펌의 과정이라고 보면 된다.
# Lumen5 서비스 사례
텍스트를 넣어 영상을 제작할 수 있는 생성형 AI Lumen5ⓓ
# Midjourney 사례
프롬프트를 주면 아래와 같은 이미지를 만들어 준다.
이미지를 생성해 가면서 선택해 가는 과정을 통해 내가 원하는 이미지로 만들어 가는 과정만 거치면 일러스트를 전혀 몰라도 이미지가 완성된다.
인풋에 문자와 이미지를 동시에 입력하고 결과를 원하니, 이미지의 요소를 반영해 프롬프트 대로 원하는 이미지를 출력해 준다. 마치 모사할 이미지를 주고 그 이미지를 참고해 그려주니, 조금 더 다양한 원하는 이미지를 만들어 내는 과정이 쉬워진다.
이제 그래픽 다자이너, 웹 디자이너가 아니어도 하이퀄리티의 이미지를 만드는 것이 너무 쉬워진 세상이다.
앞으로는 지식을 축적하는 것보다 도구를 적절하게 사용하고 조합하는 능력이 더 중요해진 것은 아닌지. 그리고 혼자보다 인공지능이든, 오픈된 지식 공간의 커뮤니티이든 협업의 중요성에 대해서 다시금 생각해 보는 것이 필요하지는 않을까?
권혁민의 ChatGPT 시리즈 연재
1.Rising Star “ChatGPT”
2.생활 속 스며든 AI①
3.생활 속 스며든 AI②
4. ChatGPT 재테크 비서 사용법①
5. ChatGPT 재테크 비서 사용법②
권혁민 대표가 운영하는 F&PLUS는 중국 상해에 2019년 창립, 5년차 패션 AI 신생기업이다. 수집된 패션 빅데이터에 이미지 인식(CNN) 기술을 더해 분석과 패션 트렌드 예측을 플랫폼으로 지원하는 전문 회사이다.