From 60654e38f2c38b40165563efd9100f25cef00d7e Mon Sep 17 00:00:00 2001 From: Kim Junseo <snoger1234@ajou.ac.kr> Date: Fri, 23 Jun 2023 15:47:53 +0900 Subject: [PATCH] =?UTF-8?q?=EA=B8=B0=EB=A7=90=20=EA=B3=BC=EC=A0=9C=20?= =?UTF-8?q?=EB=B3=B4=EA=B3=A0=EC=84=9C=20commit?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 57 +++++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 57 insertions(+) create mode 100644 README.md diff --git a/README.md b/README.md new file mode 100644 index 0000000..0b5dbf0 --- /dev/null +++ b/README.md @@ -0,0 +1,57 @@ +# 오픈소스SW입문 기말 과제 보고서 + +# 주제: 대형 언어 모델의 소개 및 ChatGPT 사용 가이드 + +## 아이템 선정 동기 + +저는 이전부터 인공지능에 대한 관심이 많았습니다. + +특히 이번학기에 들어오게 되면서 생성형 AI를 사용한 해커톤에 나가보기도 하고, 기계학습 강의를 수강하면서 인공지능에 대한 관심이 더욱 늘어난 것 같습니다. + +그런데 그렇게 공부를 하면서 주변을 둘러보니 주변에서도 사람들이 ChatGPT를 여럿 활용하는 +모습을 볼 수 있었습니다. 그런데 주변 사람들은 단순히 ChatGPT를 제품으로 생각하고 사용하고, +사용하는 방식 또한 단순히 A를 질문하고 A에 대한 결과를 제공받고, 그렇게 얻은 결과를 너무 +맹신하는 모습을 보게되었습니다. + +여기서 저는 제가 알고 있는 내용들을 활용해 ChatGPT를 다루면 더욱 다채롭고 체계적으로 결과를 제공받을 수 있는데 도울 방법이 없을까 생각했습니다. + +그 때 마침 오픈소스SW입문 강의에서 본인이 기존에 알고 있던 내용을 다른 사람들에게 설명하는 기말과제의 주제로 앞선 ChatGPT에 대한 설명을 진행하면 좋을 것 같다 생각해 이번 기회에 +준비해보게 되었습니다. + +## 새롭게 알게된 내용들 + +저는 기존에 대형 언어 모델들에 대해서 Google, MS와 같이 좀 자본이 크고 엄청 세계적인 기업들만 조금씩 관심을 가지고 있다고 생각하였습니다. 이는 제가 ChatGPT와 같은 텍스트 기반의 대형 언어 모델들만 관심이 있었고, 사용해봤기 때문입니다. + +하지만 이번 기말 과제를 준비하는 과정에 있어 생각보다 많은 기업들이 ChatGPT 이후 대형 언어 +모델에 꽤나 큰 자본을 투자하고 있었고, 한국에서 또한 네이버, 카카오와 같은 기업에서 대형 언어 모델 개발에 많은 힘을 쓰고 있다고 알게 되었습니다. + +이를 통해 대형 언어 모델은 최신 인공지능, IT 업계의 엄청난 트렌드라고 이해하였고, 저 또한 이런 동향에 맞춰 관련된 여러 공부를 꾸준히 해야겠다고 생각했습니다. + +또한 앞서 저는 텍스트 기반의 언어 모델들만 이야기를 했는데 이런 언어 모델의 기반이 된 Transformer 모델이 최근에 Vision-Transformer 모델로 개량되어 이미지 처리에도 뛰어난 성능을 +보이고 있다고 들었습니다. + +한 때 NovelAI로 인해 AI 그림에 대한 관심과 집중이 쏠린 뒤 최근에는 이에 관련된 내용을 들어본 +적이 거의 없어 그림 AI는 거기서 조금 멈췄나라고 생각하였습니다. + +하지만 DALL-E, Stable Diffusion과 같은 모델들이 꾸준히 개발되면서 비전 모델에 대한 연구로 +끊기지 않고 지속적으로, 또 많은 성능의 향상을 이루며 이뤄지고 있다고 알게 되었습니다. + +## 발생했던 문제점 + +ChatGPT를 시연하는 과정에 있어 조금의 문제가 있었습니다. ChatGPT의 경우는 결국 입력한 질문을 토대로 다음에 나올 문장을 예측하는 대형 언어 모델이기에 같은 상황들에 대해서 언제는 좋은 +결과가 나오고 어느 때는 좋지 않은 결과가 나오는 확률이 제각각이었습니다. + +그래서 ChatGPT를 활용하는데 있어 ‘역할을 정해서 질의 응답’, ‘대량의 데이터를 입력’과 같은 몇 가지 활용 방안이 있었지만 이런 방안은 건너뛰고 결과가 확실하게 나오는 ‘영어로 질문’, ‘구체적으로 질문’, ‘문단을 나눠서 질문’과 같은 활용 방안으로 내용을 축약하여 강의를 구성하였습니다. + +## 감상 + +이전에 구글링을 잘하는 방법에 대해 교육을 진행해 본 적이 있습니다. 구글도 ChatGPT와 +마찬가지로 사용 방법을 자세히 알고 있다면 좋은 결과를 쉽고, 빠르게 얻을 수 있지만 모른다면 +항상 같은 결과, 내용에 갇혀 새로운 정보를 얻을 수 없었을 겁니다. + +이와 같이 ChatGPT 또한 매우 훌륭한 제품이자 도구입니다. 하지만 ChatGPT도 사용하는 방법에 +따라, 사용자에 따라 각양각색의 결과를 얻어낼 수 있으므로 이번 강의를 들은 사람들로 하여금 +그들의 작업에 있어 ChatGPT를 좀 더 효율적으로 사용하였으면 좋을 것 같다고 생각하였습니다. + +추가로 강의에서도 저의 의견을 밝혔듯이 무분별한 ChatGPT, 대형 언어 모델의 사용은 항상 이득이 아닌 손해로 다가올 수되 있다고 생각합니다. 제가 작성한 내용을 본 사람들로 하여금 이러한 도구들을 모든 것을 완성하는 마스터키로 사용하기 보다는 부분 부분 부족한 내용을 채우거나 도와주는 +서포터로써 사용하면 ChatGPT의 효과를 확실하게 느낄 수 있다고 생각합니다. \ No newline at end of file -- GitLab