Translink Deep Tech Weekly (DTW).

🌍 Website: link
💾 Repository: link

DTW-1

Week 1 (DTW-1)

ChatGPT를 분해해 보면 그 구조가 어떻게 되어있을까?

OpenAI. (2022, Nov. 30). ChatGPT: Optimizing Language Models for Dialogue. https://openai.com/blog/chatgpt/

인터넷 상 570GB 정도의 텍스트 데이터_{(또는 3000억 개의 단어들)}를 추출함
이 데이터를 활용하여 prompt (question) 데이터셋을 구축함
레이블링하는 사람이 prompt (question) 데이터셋으로부터 output (answer)을 만들어 모아진 데이터로 지도학습모델을 훈련함_{(지도학습은 input과 output 예시 데이터셋이 있을 시에 학습 가능한 머신러닝 기법이다)}
후에 output에 대한 사람의 직접적인 피드백_{(best-to-worst를 순차적으로 나열)}을 통한 보상모델을 훈련함_{(보상모델은 강화학습을 하기 위해 활용된다)}
어느정도 원하는 수준의 답을 내기까지 계속된 강화학습을 진행

(On Prem이 아닌 Azure AI Infrastructure를 통해 모든 학습이 이루어지었다.)
(강화학습은 과거 알파고를 개발할 때에도 쓰인 기술이다. 보통 게임승부와 같은 태스크에서 강화학습이 쓰인다.)
(예전에 2021년 GPT-3를 베타 테스트 웨이팅리스트 기회가 와서 했을 때에 비해 ChatGPT는 더 긍정적인 톤의 답을 내놓는다는 생각이 들어서 최근 2022년 3월부터 적용한 강화학습(link)은 더 긍정적이게 만든 효과가 있을 수 있겠다 생각했다.)

따라서, 지도학습과 강화학습을 적절히 조합한 방식으로 ChatGPT를 학습했다고 볼 수 있다.

ChatGPT는 결국 GPT-3 기반으로 같은 수의 175B 파라미터로 만들어진 GPT-3.5와 동의어로 생각할 수 있고, InstructGPT의 연장선이라 볼 수 있다. 2018년에 나타난 GPT-1 ("Improving Language Understanding by Generative Pre-training", link)부터 시작해, 2019년 GPT-2 ("Language Models are unsupervised multitask learners", link), 2020년 GPT-3 ("Language Models are few shot learners", link), 그리고 GPT-3.5까지 발전했다. 곧 파라미터 수가 확 늘은 GPT-4가 만들어질 것이라 계속해서 발전된 형태의 output을 기대할 수 있다. GPT-4는 2023년 1분기에 나올 수 있다는 추측이 있다(link). 그리고 2021년 이후의 더 최신 데이터를 input으로 넣는지에 따라 더 좋은 결과를 낼 수 있다.

Acquisition.com LLC. https://acquisition.com

ChatGPT 특이점: 과거 유명해지고 현재까지 쓰이는 인공지능 기술들인 이안 굿펠로우(Ian Goodfellow)의 2014년 General Adversarial Networks (GAN)이나 벤 밀든홀(Ben Mildenhall), 매튜 탄식(Matthew Tancik)의 2020년 NeRF (Neural Radiance Fields)는 유명 학회나 저널을 통해 발표된 기술들이다. GAN은 NIPS란 학회에 accept이 되었고, NeRF는 ECCV의 Oral 부문에서 Best Paper 상을 받았다. 이를 통해 어떤 사람이 처음 어떤 기술을 제안했는지 알 수 있고, 어떤 매체의 검증을 거쳤는지 알 수 있었다. 그러나 ChatGPT는 이와 다르게 유명 학회나 저널의 peer review로 제3자의 검증을 거치지 않았다는 특이점이 흥미로울 수 있다. 그리고 source code가 오픈소스로 공개되지 않아 정확히 어떤 기존 데이터나 모델을 활용하고 했는지 알 수 없다. 외람된 이야기지만 흥미롭게도 이안 굿펠로우는 2016년 3월에 OpenAI에 조인을 했다가 11개월 만에 다시 Google Research로 복귀한 바가 있다. SOTA _{(최고성능, State of the Art)}를 내던 인기 기술로는 어떤 태스크(link)에 적용하느냐에 따라 다양한 종류들이 있으며, Transformers, CLIP, GAN, NeRF, Stable Diffusion 등이 대표적으로 있다.
ChatGPT 우려점: 데이터를 Stack Overflow와 같은 타 사이트를 scrapping 또는 crawling 해서 integrity 이슈가 생길 수 있다. 보통 웹사이트 상 프론트 부분인 UI에서 보여지는 어떤 데이터든 scrapping 하는 것에는 법적인 문제가 없지만, 이를 통해 제3자가 2차 수익을 내는 것은 문제가 있을 수 있다. Y Combinator에서는 어제(2023년 2월 5일) 이에 대한 댓글토론도 있었는데, 실상 ChatGPT의 합법성에 대해 어떤 답이 내려진 상태가 아니다(link). 또, 틀린답을 내놓을 수 있기 때문에 output에 대해 검증을 하는 수단이 또 필요하게 될 것이다.
서버 비용이 학습하고 추론하는 데에 많이 쓰여 research preview 때만 제공하려던 무료서비스를 지속할 수 없을 수 있고, 결국 올해 2023년 마이크로소프트가 29B USD valuation으로 10B USD 투자로 49% 지분의 대주주가 되면서 유료 서비스가 생겼다(link). 마이크로소프트가 Open AI 인수함에 따라 AWS, GCP, Azure의 market share도 Azure의 홍보에 의해 달라질 수 있을 것이다. 한국에서 주로 쓰이는 AWS와 GCP 사이에 Azure 사용자가 늘 수 있다. 또, Bing에게 적용이 될 ChatGPT를 통해 Bing의 사용량이 늘 수 있을 것이라 Google search engine의 market share도 줄 수 있다.

Source: StatCounter Global Stats - Search Engine Market Share

Multi-modal learning AI를 통해 앞으로 text의 한 도메인 학습보다 text-to-image (DALL-E), text-to-video 등의 멀티 도메인 generative AI가 더 흥행할 수도 있을 것이다. ChatGPT는 챗봇의 형태로 특수하게 훈련된 모델인데, 그 이후로 CLIP이란 기술을 통해 이미 만들어진 text-to-image 모델인 DALL-E 2(link)를 능가하는 더 섬세하고 semantic한 그림을 생성하는 DALL-E 3나, 2d를 넘어서는 3d 이미지 생성이나, 비디오 생성을 하는 단계까지 갈 수 있다.
또한, 최근 대두되는 것은 OpenAI에서 근무한 분들이 차린 스타트업의 성장세이다. 2021년에 세워진 Anthropic은 Claude란 챗봇을 따로 만들어서 2022년 말에 Google이 300 million USD를 여기에 투자했다(link). ChatGPT는 인간의 피드백을 수용한 강화학습의 일종인 reinforcement learning from human feedback (RLHF)을 따랐고, Anthropic은 Constitution AI란 모델을 써서 fine-tuned된 아웃풋에 대해 인간이 아닌 컴퓨터가 강화학습을 진행하도록 한 차이가 있다(link). Anthropic 이외에도 다수의 파생 스타트업이 생겨나 이제 아래 그림과 같이 페이팔 마피아에 이어 OpenAI 마피아란 명칭이 생겨났다.

Analytics India Magazine. (2023). OpenAI Mafia. https://analyticsindiamagazine.substack.com/p/openai-mafia

2023년 서울대 이교구 교수님의 Supertone (Mnet, SBS 등에서 죽은 가수가 환생해 최신곡을 커버함)을 인수한 하이브처럼 최신 리서치에 관심이 있는 스타트업이 경쟁력이 있고 IP확보에 유리할 것이다. 지난 2023년 1월 31일 하이브가 Supertone에 490억원을 투자해 56%의 지분을 받아 과반상의 지분을 확보했다(link). Supertone과 같은 경우에는 글쓴이 본인의 옆 연구실이었고, 교수님의 수업을 들은 바로 음성 뿐만이 아니라 안무를 음악비트에 맞춰 생성한다든지의 연구가 수년 간 이루어졌다. 또, 연구실 소속 스타트업으로 서울대 전병곤 교수님의 FriendliAI(link)가 있다. PeriFlow란 GPT-3의 경량된 버전 서비스를 만들어 배포하고 있으며, 이를 통해 Scatter Lab의 이루다 챗봇이 서포트 되고 있다.

인공지능 컨텐츠 쪽에 voice.ai를 보면 유튜브에 쇼츠로 일반인이 일론 머스크의 비디오로 다른 목소리(모간 프리먼, 조 바이든, 앤드류 테이트 등 50여 가지)와 sync를 맞출 수 있는 예시들을 유저들이 꾸준히 체험해 볼 수 있게끔 한다(link). 다른 비디오에서는 Roblox에 voice.ai를 통해 목소리를 입히는 법을 알려준다. 같은 퀄리티의 Core AI 기술이더라도 각종 창의적인 수단으로 B2C, B2B 홍보하고 입소문이 잘 나게끔 하는 스타트업들이 ChatGPT와 같은 폭팔적 인기를 끌 수 있을 것이다.
위의 컨텐츠에 이어서 NVIDIA와 같은 경우에도 눈의 시선을 자연스럽게 보정해주는 기술(NVIDIA Broadcast)이 개발이 되었고, 2023년 현재 1.4버전 서비스 중이다(link). 이를 통해 사람들이 대본을 읽고 웹캠 상에 발표를 할 때, 대본에 눈이 가 있거나, 다른 곳에 눈이 향해 있어도 NVIDIA Broadcast로 눈은 카메라로 향할 수 있게끔 보정해 준다. 이 기술을 통해 활용할 수 있는 상황들을 꾸준히 영상들로 PR해 사람들의 관심을 모을 수 있다(link).

Name		Name	Last commit message	Last commit date
Latest commit History 168 Commits
.github/workflows		.github/workflows
assets/img		assets/img
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Translink Deep Tech Weekly (DTW).

Week 1 (DTW-1)

최신 핫한 논문들에 대한 내용은 다음주 DTW-2에 확인가능

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Translink Deep Tech Weekly (DTW).

Week 1 (DTW-1)

최신 핫한 논문들에 대한 내용은 다음주 DTW-2에 확인가능

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages