chatGPT 소개 + 공부 방법 예시
오늘 아침 chatGPT (GPT-3.5)의 최신형 모델인 GPT-4.0이 출시했다.
GPT-4.0 개발사인 OpenAI 블로그 포스트를 살펴보면,
https://openai.com/product/gpt-4
GPT-4.0은 단순히 성능이 나아진 것뿐만 아니라,
이제는 이미지를 인식하고 입력할 수 있을 뿐더러
사이트에 대한 링크를 제공하면 웹사이트의 내용을 요약할 수 있다.
위 두가지 task는 기존 NLP (자연어처리 – 인공지능의 한 분야)로
얼마든지 할 수 있었던 작업이긴 하지만,
chatGPT라는 아주 무거운 모델에 메모리 부하 없이 해당 기능을 추가했다는 점에서
아직 인공지능이라는 방대한 영역에 한 발자국 담근 학부생 입장에서
이러한 혁신을 일궈낸 openAI 개발자들이 정말 대단하다고 생각한다.
이번 글에서는 chatGPT에 대해서 간단하게 설명하고
chatGPT를 활용해 공부에 도움받는 방법을 소개하고자 한다
직접 해보면 어떻게 쓰는지 빠르게 감을 잡을 수 있으니까
웹사이트에 들어가서 일단 시도해보자.
기존 chatGPT 모델 (gpt-3.5)는 무료고
성능이 좋은 GPT-4.0 은 한달에 20달러다.
처음부터 인공지능이 이렇게 똑똑한 건 아니었다
인공지능 기준으로 18년도는 아주 오래 전이지만
불과 5년 전만해도 AI는 우가우가 침팬지만도 못한 성능을 보였다
수능은 5지선다고 하나의 숫자로 답을 밀기만 해도 최소 20점은 확보하니까
4번으로 답을 몰아 쓴 침팬지만도 못한 것이 자연어처리 AI의 현실이었다.
사실 chatGPT의 근간이 되는 기술은 이 때 수능을 푸는 AI와 거의 동일하다.
하지만 어느 점을 보완했기에 이렇게 엄청난 발전을 이룰 수 있었을까?
그 원인은 바로 이 멍청한 학생에게 아주 뛰어난 과외 선생님을 붙여줬기 때문이다.
알파고의 학습방법이기도 한 강화학습 (Reinforecement Learning)은
우리 침팬지가 오답을 내더라도, 답변에 대한 보상 (Reward)을 정의하고
이 보상을 최대화하는 방향으로 수백 번 모델을 훈련시켜서
각 훈련마다 조금씩 정답에 가까워지도록 공부시키는 AI계의 일타강사라고 할 수 있다.
chatGPT도 이와 같이 매 판마다 오차를 줄이고 정확도를 높여가면서
결국에는 이렇게 뛰어난 학습모델이 된 것이다.
그러면 우리는 이 프로그램을 사용해서 어떻게 공부에 도움을 받을 수 있을까?
대학생들은 이미 과제를 푸는 데에 있어 많이 사용하고 있을 거라 생각해서
수능 영어문제 풀이를 예시를 들어 설명하겠다.
이 문제는 작년 2023년 수능 영어 32번 문제다.
정말 당연한 듯이 정답을 맞추었지만, 이 해설을 가지고 공부하기에는 답변이 많이 빈약하다.
그래서 우리가 진짜 원하는 답변을 받으려면
선생님 혹은 과외선생님한테 질문하는 것처럼 조금 더 자세한 해설을 요구해야 한다.
설명을 요구하니까 조리 있게 잘 설명한 것 같긴 하다.
하지만 나는 영어 문단을 처음부터 독해하는 것부터 막히는 실력이라,
문단 내용을 잘 모르기 때문에 이 설명도 잘 이해가 되지 않아서 처음부터 독해하는 해설이 필요하다.
그래서 문장 단위로 해석하라고 지시해서 나온 내용이다.
그런데 영어 문단 해석에서 문법이 중요한 역할을 하는데, 문법 분석이 빠진게 약간 아쉽다.
그래서 문장 단위로 문법을 설명하라고 지시하면 얘가 알아서 출력해준다.
디테일에서 조금 빈약한 점이 느껴져서 이 부분은 다음에 더 개선된 모델을 기다리거나
내가 질문을 조금 더 자세히 입력해야 한다.
가끔가다 출력이 5000자를 넘기면 답변이 끊기는 일이 발생하는데,
이 때 이어서 출력하라는 명령을 하면 그대로 이어서 출력해준다.
내가 공부하고 있는 해설지에서는 이러한 공부방법을 제시했는데,
이 수능 문제에 해당 공부방법을 적용하고 싶어 생각이 들면
그대로 해주라고 지시하면 바로 결과가 나온다.
이렇게 chatGPT를 활용해서 실제 과외선생님에게 질문하는 것처럼
자신이 막히는 문제에 대한 해설을 요구할 수 있다.
하지만, 앞선 예시와 같이 자신이 알기를 원하는 내용을 상세히 적어야 원하는 답을 얻을 수 있다.
자신이 부족한 점이 무엇인지 인식하고,
이에 대한 해답을 chatGPT에 넣어서 해설을 보고 공부함으로 복습한다면,
정말 괜찮은 공부 방법이 될 수 있을 거라고 생각한다.
위의 문제는 2023년 국어 10번 문제인데, 너무 뻔뻔스럽게 정답을 맞혀버렸다.
이렇게 국어 등 다른 과목도 영어 때의 접근방식과 비슷하게 풀이를 불러올 수 있다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
이걸어케말함
-
넣은 원금이 그대로 돌아오는 거임 아니면 실패했을 때 주가로 받는 거임??
-
좋아요 N개시 6
-
ㅇㅈ 6
오랜만에 놀러옴요 펑
-
몰랐어
-
시반공에서 빠지는 인원의 대부분은 의대 목표가 아님 내신이 이미 좋은데 수시 한...
-
의대논란언급글 메인갈때마다 블라당했었음
-
4수도실패하면 6
많이무너져내릴것같아요 5수까지실패하면 인생의모든걸다영영잃어버린느낌일것같네요
-
글밀필요가없음 5
ㄹㅇㅋㅋ
-
왜케 사람 많음 1
4시 40분인데 오랜만에 ㅇㅈ하고 자려했는데 사람 개많네
-
글을 산더미처럼 쌓아서 안보이게함요
-
대한민국 공화국 0
자극적 단어 하나에 신분, 학벌 구분없이 대부분이 선동 당하며, 그것 조치 인지하지...
-
사람 개많네 5
1시간 후에 옴뇨
-
나쁜 것 같기도 하고 좋은 것 같기도 하고
-
그새 또 올랐었네
-
걍본계로맞팔걸까 고민중
-
효율 효율 4
극단적인 효율충
-
사자마자 몇 프로가 떨어지는 거임뇨… 이건 답이 없을 거 같아서 손절해버림..
-
난 블라인드먹은게 2개나있어서 그것들은 못지움..
-
감기가 왜 이리 안 낫는 거지 으으윽 코푸느라힘들어요
-
ㅜ 3
-
ㅅㅂㅋㅋㅋ
-
대학마저못가면어떡함. 망한인생임?
-
피부과 가야겠네 초기에 잡아야된대
-
친구 하나 데리고 같이 가기로 함뇨, 토요일 오전1시~9시
-
코엑스에서 하는거
-
해냇죠 5
.....
-
귀엽죠 17
-
내 인증 평은 6
왜 맨날 못 봤다냐 그냥 못 본 걸로 생각하고 싶은 건가
-
해야 함? 작년엔 안 했는데 ,,,
-
ㅇ.ㅈ 5
반응점.
-
나도 뭐 먹을까 2
본능에 따라야지 동물인데
-
ㅇㅈ 5
여기에 참치마요 삼김까지 먹는데 진짜 존맛탱
-
여름엔 계곡 갓는데
-
우리 하니는 못 참겠다 ㅇㅇ..
-
나땐 그런거 없었는데
-
. 10
준비하셔야돼요
-
프세카재활훈련중 10
게임이너무어려버요
-
공부 2
다들 언제부터?
-
ㅇㅈ해주셈요 18
저 오르비언들의 ㅇㅈ 볼 준비가 됐어요
-
내일2시전에는 일어날거임뇨
-
반갑습니다. 12
-
. 16
.
-
자고 10시에 일어나서 10
하버 달려야징
-
맨발에 슬리퍼신은 내가 문제일까
-
예나 3
안자..
-
수직선 영어로 3
수직선 영어로 거의 다 Vertical line으로 알고 잇던데, 이건 어디...
-
정시에 소신권으로 쓸거 합격하게 해달라고 빌고왔어요
-
흠냐
-
또 지방대가게 생겻네 에횽 그냥 인설약갈까
안녕하세요. 글의 내용에 약간 오류가 있는 거 같아 댓글 남깁니다~ chatGPT 아키텍처는 강화학습 모델이 적용되지 않았습니다. 자연어 처리 분야에서의 획기적인 성능 향상은 Encoder-Decoder에 Attention 노드를 도입한 Transformer 아키텍처의 개발 덕입니다. 사진에서 첨부한 2018년 즈음이면, attention node의 연구가 막 이루어지던 시점인 것으로 생각됩니다. 아마 사용된 모델의 아키텍처도 Transformer가 아닌 LSTM이나 GRU 계층에 의존하는 Rnnlm이었을 걸로 예상됩니다. 이 아키텍처를 개선한 Transformer모델이 성능 향상의 핵심이었지 강화학습이 자연어 처리에 적용됐다는 건 정확하지 않습니다. 강화학습은 자연어 처리보다는 다른 영역에서 더 적합한 기술이기 때문입니다. 예를 들어 말씀해주신 알파고 같은 경우가 그렇습니다. 하지만 자연어 처리 영역은 많이 다르다는 것이죠.
또한, chatGPT는 비지도 학습 또한 적용되어 학습되었기 때문에 보상을 늘리는 방식의 학습이 애플리케이션 성능을 향상시켰다는 것은 적절치 않습니다.
이 외의 chat GPT를 공부에 활용하는 방법은 참 좋은 거 같네요~ 저도 많이 배워갑니다~
즐거운 하루되세요 ^^
무슨 틀린 얘기를 이리도 길게... ㅋㅋㅋ chatgpt는 논문이 따로 없는데 instructgpt를 그대로 사용했습니다. 그러니 해당 논문을 참고해보면 RLHF를 사용했다는걸 알 수 있어요.
gpt3의 결과를 랭킹한다음 그걸로 학습한 모델을 일종의 리워드 함수로 사용한거죠..
사실 검색만 해봐도 나오는 사실을 이제막 ai배우시는분인 것 같은데...
알파고같은데만 쓰이는게 아니라 최적화와 관련된 모든 분야에 강화학습을 사용할 수 있어요.
예를들어 퓨샷같은 메타러닝에도요.. 찾아보면 in context learning을 더 잘하기 위해 퓨샷 전용 강화학습 적용하는 경우도 있어요
강화학습이 쓰이지 않았다니 ㅋㅋㅋ 당장 유저 인풋을 반영해서 새로운 보상을 제시한다고 밝힌 내용인데 chatgpt는 절대 순수 generative model로는 만들 수 없는 모델이에요 그리고 gpt모델의 베이스 모델인 transformer가 쓰이지 않았다는거는 무슨 말씀이신가요? Gru는 디퓨전 모델이나 GAN에 자주 쓰이지 gpt는 순서정보가 중요해서 트랜스포머가 우월전략이 확실합니더
트랜스포머가 아니라 rnnlm을 사용했다고 너무 당당하게 단언해버리시면 zzzzzz 설마 트랜스포머의 feed forward층에 있는 gru층을 rnn구조라고 생각하신건가요 ^^b
트랜스포머가 2018년의 혁신이긴 했지만 그로부터 gpt2까지 오면서 대중들에게 크게 와닿지 않았던 이유는 nlp모델로만 이루어진 모델은 성능에 한계점이 있었기 때문이에요 당장 gan만 봐도 아무리 비지도학습을 열심히 해도 모델 collapsing현상이 나오잖아요? 그래서 강화학습이 쓰인거고 그래서 빅테크랑 개인간의 간격이 벌어지느 거에요. 빅테크가 주도하는 사회변화는 이제 거부할 수 없을 겁니다