권혁민의 ChatGPT 02 [생활 속 스며든 AI①]
‘콩 심은데 콩’? 이제는 ‘콩 심은데 팥 나오는 세상’
멀티 모달리티 발달로 AI 생태계 대폭발
생활 속 일상이 되고 있는 AI의 활용
지난 3년 간의 코로나19는 전세대를 디지털 세대화했다. 일을 하려면 화상 회의에 익숙해야 했고, 온라인 채널로만 의사 소통하는 것에 익숙해져야 했다. 질병을 관리하는 수단으로 QR 코드가 쓰이는가 하면 쇼핑하고 구매하는 방식도 큰 변화를 겪었다. 새로운 정보를 얻고 학습하는 방법 역시 사람을 대면하지 않고도 접근할 있는 새로운 채널에 익숙해져 버렸다.
0, 1 두 조합으로 만들어진 디지털 세상ⓓ
세상이 원자로 구성되었다면 디지털은 ‘0’과 ‘1’ 이 두 조합으로 만들어진 세상이다.
숫자, 문자, 이미지, 소리, 영상도 온라인 세상에서는 결국 0, 1로 만들어진 세상이라는 것을 아는가?
신경망 모델은 인풋(input)이 히든 과정을 거쳐 아웃풋(output)을 만든다. 인풋에는 그것이 어떤 데이터이든 결국 0, 1의 값이 들어가고, 나오는 값도 결국 0, 1의 조합이다.
얼마 전까지 인공지능을 학습할 때 한가지 유형의 데이터를 인풋으로 했다. 또한 결과도 한가지 형태의 아웃풋으로 학습을 진행했다. 예를 들어 이미지를 인풋하고 이미지 속 물체의 이름을 맞추는 인공지능이라면 인공 지능 학습은 이미지를 인풋하고 그 아웃풋은 문자를 얻어 내는 학습 과정인 것이다.
# 문자, 이미지 등 멀티 모달리티로 GPT의 발달
뭘 넣어도, 무엇을 만들어도 잘 만들어지는 AI 생태계ⓓ
하지만 ‘GPT’ 모델만 하더라도 학습을 위해 인풋되는 데이터가 이미지와 문자로 데이터 타입이 다양하게 동시에 학습되었다. 이런 인풋 데이터의 타입이 다양해지는 것을 멀티 모달리티(Multi Modality)라고 한다. 모달리티(Modality)는 모드 또는 데이터 타입이라고 이해하면 좋다. 멀티가 붙게 되면 한가지 타입이 아닌 여러 타입이 동시에 사용된다고 이해하면 된다.
한마디로 학습을 위한 신경망 모델이 더 진화한 것이고 다양한 인풋과 다양한 아웃풋을 만들 수 있다는 이야기인 것이다.
멀티 모달리티 학습으로 이미지를 넣으면 이미지, 텍스트, 비디오 등의 생성이 가능해졌다.ⓓ
우리가 경험하는 그림 그려주는 AI를 생각해 보면 텍스트를 넣었는데 이미지가 나오는 것도 멀티 모달리티(Multi Modality) 학습이 가능해졌기 때문이다.
그리고 서비스가 다양해지도록 인공지능 모델의 활용 다양성을 지원하는 파운데이션 모델이 발전하고 있는 것도 지금의 여러 다양한 인공 지능 서비스가 폭발하는 상황을 만드는 원인이다.
큰 범용의 인공지능을 만들어 누군가가 그것을 사용해 생태계를 만들고 서비스화하지 않으면 그런 투자를 할 수도 없다. 네이버, 구글, MS, BAIDU와 같은 IT 공룡 기업이 범용 인공지능을 만들고 API (Application Program Interface)로 공개해 사업화 하도록 하는 것도 결국 생태계를 만들어 고객층을 확장하고 궁극적으로 그 시장의 지배자가 되기 위한 것일 것이다. 한마디로 다양한 서비스를 만들도록 중소 기업을 돕는 환경을 조성해 지원하는 것이 IT 공룡 기업의 생존을 위한 필수 조건인 셈이다.
지금은 학습을 시키는 방법도 멀티 모달리티(Modality)로 다양화되었고 활용 측면에서 그 어느때보다 활발하게 응용되도록 지원하는 ‘파운데이션 모델’도 빠른 속도로 진화하고 있으니 다양한 인공 지능 서비스의 생태계가 하루가 다르게 급성장하고 있는 것이다.
# 제품 이미지만 넣으면 상세 페이지를 만들 수 있을까?
이번 소개에서는 이미지가 인풋 되어 다양한 아웃풋의 결과를 만들어 내는 사례들을 살펴보고 우리의 생활 속에 얼마나 가까이 들어와 있는지 느껴 보길 바란다.
또한 내 비즈니스에 활용할 방법들은 없는지 생각해 보는 기회이기를 바란다.
이미지 인풋 - 이미지 아웃풋ⓓ
이미지 인풋 - 이미지 & 텍스트 아웃풋ⓓ
이미지 인풋 - 텍스트 아웃풋ⓓ
권혁민의 ChatGPT 시리즈 연재
1.Rising Star “ChatGPT”
2.생활 속 스며든 AI①
3.생활 속 스며든 AI②
4.ChatGPT 재테크 비서 사용법①
5. ChatGPT 재테크 비서 사용법②
권혁민 대표가 운영하는 F&PLUS는 중국 상해에 2019년 창립, 5년차 패션 AI 신생기업이다. 수집된 패션 빅데이터에 이미지 인식(CNN) 기술을 더해 분석과 패션 트렌드 예측을 플랫폼으로 지원하는 전문 회사이다.
권혁민의 ChatGPT 02 [생활 속 스며든 AI①]
‘콩 심은데 콩’? 이제는 ‘콩 심은데 팥 나오는 세상’
지난 3년 간의 코로나19는 전세대를 디지털 세대화했다. 일을 하려면 화상 회의에 익숙해야 했고, 온라인 채널로만 의사 소통하는 것에 익숙해져야 했다. 질병을 관리하는 수단으로 QR 코드가 쓰이는가 하면 쇼핑하고 구매하는 방식도 큰 변화를 겪었다. 새로운 정보를 얻고 학습하는 방법 역시 사람을 대면하지 않고도 접근할 있는 새로운 채널에 익숙해져 버렸다.
0, 1 두 조합으로 만들어진 디지털 세상ⓓ
세상이 원자로 구성되었다면 디지털은 ‘0’과 ‘1’ 이 두 조합으로 만들어진 세상이다.
숫자, 문자, 이미지, 소리, 영상도 온라인 세상에서는 결국 0, 1로 만들어진 세상이라는 것을 아는가?
신경망 모델은 인풋(input)이 히든 과정을 거쳐 아웃풋(output)을 만든다. 인풋에는 그것이 어떤 데이터이든 결국 0, 1의 값이 들어가고, 나오는 값도 결국 0, 1의 조합이다.
얼마 전까지 인공지능을 학습할 때 한가지 유형의 데이터를 인풋으로 했다. 또한 결과도 한가지 형태의 아웃풋으로 학습을 진행했다. 예를 들어 이미지를 인풋하고 이미지 속 물체의 이름을 맞추는 인공지능이라면 인공 지능 학습은 이미지를 인풋하고 그 아웃풋은 문자를 얻어 내는 학습 과정인 것이다.
# 문자, 이미지 등 멀티 모달리티로 GPT의 발달
뭘 넣어도, 무엇을 만들어도 잘 만들어지는 AI 생태계ⓓ
하지만 ‘GPT’ 모델만 하더라도 학습을 위해 인풋되는 데이터가 이미지와 문자로 데이터 타입이 다양하게 동시에 학습되었다. 이런 인풋 데이터의 타입이 다양해지는 것을 멀티 모달리티(Multi Modality)라고 한다. 모달리티(Modality)는 모드 또는 데이터 타입이라고 이해하면 좋다. 멀티가 붙게 되면 한가지 타입이 아닌 여러 타입이 동시에 사용된다고 이해하면 된다.
한마디로 학습을 위한 신경망 모델이 더 진화한 것이고 다양한 인풋과 다양한 아웃풋을 만들 수 있다는 이야기인 것이다.
멀티 모달리티 학습으로 이미지를 넣으면 이미지, 텍스트, 비디오 등의 생성이 가능해졌다.ⓓ
우리가 경험하는 그림 그려주는 AI를 생각해 보면 텍스트를 넣었는데 이미지가 나오는 것도 멀티 모달리티(Multi Modality) 학습이 가능해졌기 때문이다.
그리고 서비스가 다양해지도록 인공지능 모델의 활용 다양성을 지원하는 파운데이션 모델이 발전하고 있는 것도 지금의 여러 다양한 인공 지능 서비스가 폭발하는 상황을 만드는 원인이다.
큰 범용의 인공지능을 만들어 누군가가 그것을 사용해 생태계를 만들고 서비스화하지 않으면 그런 투자를 할 수도 없다. 네이버, 구글, MS, BAIDU와 같은 IT 공룡 기업이 범용 인공지능을 만들고 API (Application Program Interface)로 공개해 사업화 하도록 하는 것도 결국 생태계를 만들어 고객층을 확장하고 궁극적으로 그 시장의 지배자가 되기 위한 것일 것이다. 한마디로 다양한 서비스를 만들도록 중소 기업을 돕는 환경을 조성해 지원하는 것이 IT 공룡 기업의 생존을 위한 필수 조건인 셈이다.
지금은 학습을 시키는 방법도 멀티 모달리티(Modality)로 다양화되었고 활용 측면에서 그 어느때보다 활발하게 응용되도록 지원하는 ‘파운데이션 모델’도 빠른 속도로 진화하고 있으니 다양한 인공 지능 서비스의 생태계가 하루가 다르게 급성장하고 있는 것이다.
# 제품 이미지만 넣으면 상세 페이지를 만들 수 있을까?
이번 소개에서는 이미지가 인풋 되어 다양한 아웃풋의 결과를 만들어 내는 사례들을 살펴보고 우리의 생활 속에 얼마나 가까이 들어와 있는지 느껴 보길 바란다.
또한 내 비즈니스에 활용할 방법들은 없는지 생각해 보는 기회이기를 바란다.
이미지 인풋 - 이미지 아웃풋ⓓ
이미지 인풋 - 이미지 & 텍스트 아웃풋ⓓ
이미지 인풋 - 텍스트 아웃풋ⓓ
권혁민의 ChatGPT 시리즈 연재
1.Rising Star “ChatGPT”
2.생활 속 스며든 AI①
3.생활 속 스며든 AI②
4.ChatGPT 재테크 비서 사용법①
5. ChatGPT 재테크 비서 사용법②
권혁민 대표가 운영하는 F&PLUS는 중국 상해에 2019년 창립, 5년차 패션 AI 신생기업이다. 수집된 패션 빅데이터에 이미지 인식(CNN) 기술을 더해 분석과 패션 트렌드 예측을 플랫폼으로 지원하는 전문 회사이다.