본문으로 건너뛰기

AI로 공부하기전에

이 절은 빼거나 줄여야 할 것

AI챗봇를 활용해 데이터 분석에 대해 배우고 실행해 나갈 것이기 때문에 여기에서 AI챗봇에 대해서 이해하고간다. AI챗봇은 공부할 때 많은 도움이 많이 되는 도구이다. 백과사전, 맞춤법 교정기, 검색 엔진, 문서 요약가 같은 기능을 모두 한번에 지원한다. 마치 가정교사가 옆에 앉아서 가르쳐 주는 것과 같은 느낌을 줄 때도 있다. 그래서 AI챗봇을 많이 사용하면 자신 실력이 늘지 않는 것은 아닐까 걱정하는 사람들이 있다. 일부는 사실이다. 실제로 AI가 답을 바로 알려주기 때문에 스스로 생각하거나 고민하는 습관이 없어지고 고민에 쓰는 시간이 줄어들 수 있다. 고민과 깊은 사고는 문제 해결 능력을 높여주므로 매우 중요하기 때문에 문제가 없다고 할 수는 없다. 하지만 그런 사실을 알고 있다면 그 사실을 의식하고 집중한다면 AI를 활용해서 오히려 더 빠르게 성장할 수도 있다.

AI챗봇을 사용할 때 중요한 점은 AI챗봇이 제시한 답을 무조건 받아들이지 않고 그 답이 왜 그런지 혹시 틀린 부분은 없는지 스스로 검토하고 생각하는 습관을 갖는 것이다. AI가 알려준 내용을 바탕으로 추가로 자료를 찾아보거나, 여러 AI에게 같은 질문을 해보고 답을 비교해보는 것도 좋은 방법이다. 위키피디아나 검색 엔진, 공식 문서 같은 것도 살펴봐야 한다. 또한 AI에게 질문을 할 때도 단순히 "정답"만을 요구하기보다는 "왜 그런지 설명해줘", "다른 방법도 있을까?", "관련된 예시를 들어줘" 등 다양한 방식으로 질문을 던져보면 더 깊이 있는 학습이 가능하다.

결국 AI챗봇은 도구일 뿐이며 어떻게 활용하느냐에 따라 내 능력 향상에 도움이 될 수도 있고 오히려 방해가 될 수도 있다. AI의 답을 맹신하지 않고 항상 비판적으로 검토하고 스스로 생각하는 습관을 기른다면 AI는 최고의 학습 파트너가 될 수 있다.

하지만 AI챗본은 할루시네이션(hallucination, 착각) 현상과 같은 것을 비롯해 문제점이 있다. 그래서 맹목적으로 결과를 믿어서는 안되며 틀린 부분이 있는지 신경서서 살펴봐야 한다. AI챗봇은 틀린 사실을 답할 때 일부만 틀리게 말하는 경향이 많다. 때문에 틀린 내용을 쉽게 인지하기 어렵게 만든다.

AI의 역사

AI의 역사적 발전

((다이어그램))

graph TD
A[1950년대: 인공신경망(Perceptron) 등장] --> B[1970~80년대: AI 겨울(연구 침체기)]
B --> C[1986년: 역전파 알고리즘 재발견]
C --> D[1990~2000년대: 기계학습(머신러닝) 발전]
D --> E[2012년: 딥러닝(Deep Learning) 붐, 이미지넷 대회]
E --> F[2017년: 트랜스포머(Transformer) 논문 발표]
F --> G[2020년대: GPT, LLM 등 생성형 AI 대중화]
G --> H[미래: 멀티모달 AI, 자가학습 AI 등 발전]

style A fill:#f9f,stroke:#333,stroke-width:2px
style E fill:#bbf,stroke:#333,stroke-width:2px
style G fill:#bfb,stroke:#333,stroke-width:2px

최근 주로 사용하는 생성현 인공지능 모델은 뉴럴 네트워크(neural notebook, 인공신경망)라는 것에서 시작했다. 인공신경망은 1950년대에 시작해서 역사가 길지만 중요한 문제를 해결하지 못해 긴 세월 발전과 변화가 없었던 시기가 있었다. 인공지능의 암흑기가 라고 부른다. 하지만 비교적 최근 제프리 힌튼 교수(노벨상 수상자)의 연구성과로 결함을 해결하는 방법을 찾아서 딥러닝(deep learning)이라고 이름을 붙였다. 그 이후 딥러닝을 기반으로 한 CNN, RNN 등을 비롯한 구글의 트랜스포머까지 많은 딥러닝 아키텍쳐가 개발되었고 트랜스포머를 기반으로 한 GPT 모엘이 나오면서 세상을 바꾸는 상황까지 오게 되었다.

ChatGPT, Claude, Gemini의 기반은 LLM(Large Language Model)이라는 인공지능 언어 모델이다. 모델(model)이라는 것은 데이터(숫자)를 이용해서 되풀이 할 수 있는 규칙을 찾아내서 문제를 해결하는데 사용하는 데이터와 코드를 합친 것을 말한다. 모델은 수학을 기본으로 해서 어떤 문제해결을 하는데 사용하는 해결책이다.

예를 들어, 고양이와 개 사진을 구분하는 인공지능 모델은 수많은 동물 사진을 분석해서 "고양이와 개의 차이점"을 스스로 학습한다. 이렇게 학습이 끝나면 새로운 사진을 주었을 때 이 모델은 "이건 고양이입니다" 또는 "이건 개입니다"라고 대답할 수 있게 된다.

LLM (Large Language Model)

뉴럴 네트워크 기반의 인공지능이 사용된 분야는서 사용되는데 음성, 비전(vision, 이미지, 비디오 등)인데 LLM이 등장하면서 텍스트까지 처리할 수 있게 되었다. 구글의 트랜스포머(Transformer)라는 딥러닝 아키텍쳐를 더 작게 분리하고 축소해서 GPT라는 새 구조를 만들었는데 이 모델에 많은 데이터를 넣으면 지금까지 해결하지 못한 인간의 문제를 개선할 수 있다는 것이 밝혀졌다. 그리고 지금 사람들이 사용하는 AI챗봇은 모두 GPT를 기반으로 하거나 변형해서 만든 것이다.

LLM은 언어 모델이고 다음과 같은 언어 문제를 해결하는 인공지능 모델이다

  • 통역과 번역
  • 음성 인식
  • 음성 생성
  • 문맥 이해
  • 문서 요약 및 분류
  • 자동 문서 생성

LLM은 생성형 AI인데 이름에 포함되어 있듯이 문서 생성에 특화되어 있다. 하지만 “문서 생성”이라는 말을 넓은 의미로 확장하면 긴 문서에 대한 요약 문서를 생성, 음성 입력에 다한 텍스트를 생성, 입력된 텍스트에 문액생성등이 모두 여기에 포함되기 때문에 문서 생성을 응용해서 다른 것들을 모두 할 수 있다.

LLM 사용 주의사항

잘 알려져 있지만 LLM을 이용해 만들어진 AI챗봇 서비스는 LLM이 가진 문제점을 그대로 가지고 있다. LLM의 근본에 대해 표현한 것중에 유명한 확률론적 앵무새(Stochastic Parrots)라는 표현은 구글의 보고서에서 언급된 이후 LLM의 본질을 설명할 때 자주 비유로 사용되는데 비교적 적절한 표현이라고 생각한다. LLM이 확률론적 앵무새라고 불리는 이유는 사용자가 입력한 문장의 뒤에 나올 단어들을 확률적으로 예측해서 계속 이어어 붙어져 긴 문장을 생성하기 때문이다. 즉, 입력한 단어에 이어서 반드시 정답인 것을 붙여서 완성하는 것이 아니라 뒤에 오면 바람직한 가장 높은 확률을 가진 단어들 중 하나를 선택해 이어 붙이는 방식이기 때문이다. 이렇게 확률적으로 단어를 이어 붙이기 때문에 할루시네이션(hallucination)이라고 부르는 거짓 정보나 사실과 다른 방향이 다른 내용을 만들어내는 일이 빈번하게 발생하는데 이러한 문제는 아직까지 기술로는 완벽하게 해결할 수 없다.

LLM 기본 모델과 추론 모델의 차이

현재 AI챗봇 서비스들을 사용하면 사용하는 모델을 선택하는 것을 볼 수 있다.

LLM(대형 언어 모델)은 파운데이션 모델이라고 하는 근본 모델에서 추가 개량을 한 다양한 종류의 모델이있고 AI챗봇 서비스는 그 모델을 선택해서 쓸 수 있게 한다. 다양한 목적과 사용 환경에 맞게 여러 종류의 모델로 분류이 있는데 대표적으로 기본 모델, 추론 모델, 하이브리드 모델, 리서치(연구) 모델로 구별할 수 있다.

1. 기본 모델 (Base Model)

가장 범용적으로 사용하도록 설계된 LLM으로 다양한 주제에 대해 자연스러운 대화, 글쓰기, 정보 요약, 번역 등 일반적인 언어 작업에 최적화되어 있다. 빠른 응답 속도와 자연스러운 문장 생성이 장점이다. 할루시네이션이 많은 것이 단점이다.

2. 추론 모델 (Reasoning Model)

복잡한 논리적 사고, 단계별 문제 해결, 수학적 계산, 코딩 등 고차원적 추론이 필요한 작업에 특화된 모델인데 모델에게 프롬프트에 대한 답을 할때 단계별로 분할해서 차근차근 처리하도록 하며 단계별 결괘물에 대해 다시 생각ㅎ게 하는 방식으로 응답을 만든다. Chain of Thought(단계별 사고 전개, 체인 오브 쏘트)라는 것을 지원하는데 수학, 과학, 논리 퍼즐, 복잡한 분석, 코딩과 같은 논리적인 문제를 해결할 때 좋다. 단점은 응답을 완료하기까지 시간이 많이 걸련다는 것이다. 답을 내기까지의 과정을 논리적으로 설명하거나 중간 단계를 명확히 보여주는 특징이 있다.

3. 하이브리드 모델 (Hybrid Model)

기본 모델의 빠른 응답성과 추론 모델의 논리적 사고력을 모두 결합한 모델인데 사용 목적에 따라 두 가지 모드를 선택하거나 자동 전환할 수 있다. 일상 대화, 정보 생성, 요약 등은 기본 모드로 빠르게 처리하고 복잡한 문제나 단계적 사고가 필요한 경우 추론 모드로 전환한다. 사용자가 직접 모드를 선택하거나 AI가 자동으로 적합한 모드를 선택할 수 있다.

4. 리서치(연구) 모델 (Research Model)

스스로 문제를 해결하는 모델로 상용화 이전의 신기술 테스트, 논문 기반 실험, AI 연구 개발에 활용한다. 일반 사용자보다는 연구자, 개발자, AI 엔지니어 등이 주로 사용하는데 매우 풍부하고 정확한 응답을 한다. 단점은 너무 많은 연산 자원을 사용하기 때문에 비용이 매우 비싸고 응답을 받기까지 매우 느리다.

AI챗봇 서비스의 각 모델들

AI챗봇에 선택할 수 있는 모델은 다음과 같다. 모델을 계속해서 개발되고 오래된 모델은 사라지고 있기 때문에 지금 내용은 바뀔 수 있다. 어떤 것을 선택하든지 큰 차이는 없고 부수적으로 이미지와 텍스트를 동시에 입력받아 응답을 하는 멀티모달 모델(Multi Modal Model)이 있고 검색 엔진으로 정보를 찾아서 참조하는 검색 엔진 결합도 있다. 멀티 모달은 모델이 다른 것이지만 검색 엔진으로 정보를 찾아서 참조하는 것은 모델을 별도로 만들기 보다는 응용 기술을 서비스에 결합한 것이다.

현재 ChatGPT에서 지원하는 대표 모델들을 다음과 같다.

(())

모델명분류특징 요약
o1, o1-mini추론 모델단계별 논리 전개, 복잡한 문제 해결, Chain of Thought 지원, STEM·코딩 특화
o3-mini, o3-mini-high추론 모델o1-mini 대비 성능·속도 향상, 논리적 추론 및 분석에 특화
GPT-4, GPT-4.5기본 모델다양한 주제에 강한 범용 모델, 창의적 글쓰기·대화·정보 생성에 최적화
GPT-4o기본 모델최신 멀티모달 범용 모델

Claude(Anthropic)는 2025년 기준으로 Claude 3 시리즈(및 3.5, 3.7 등)의 Haiku, Sonnet, Opus 등 다양한 모델을 제공한다. 최근에는 "하이브리드 추론(hybrid reasoning)" 모델도 제공하고 있다.

모델명분류특징 요약
Claude 3 Haiku기본 모델빠른 응답, 경량화, 실시간 대화·간단한 질문에 최적화
Claude 3.5 Haiku기본 모델Haiku의 최신 버전, 텍스트 중심, 데이터 추출·라벨링·실시간 챗봇 등 경량 작업에 적합
Claude 3 Sonnet기본 모델속도와 성능의 균형, 장문 생성 및 다양한 용도에 활용
Claude 3.5 Sonnet기본 모델Sonnet의 최신 버전, 코드 생성·시각 데이터 추출 등 다양한 업무에 활용
Claude 3 Opus추론 모델고난도 분석, 복잡한 단계적 작업, 고급 코딩·분석·추론에 특화
Claude 3.7 Sonnet하이브리드기본(빠른 응답)과 추론(단계별 사고) 모두 지원, 사용자가 모드 선택 가능

Google의 Gemini는 다음과 같다.

모델명분류주요 특징 및 설명
Gemini Nano기본 모델모바일 등 경량 환경용 소형 모델
Gemini Flash기본 모델속도와 비용 효율성을 중시한 경량화 모델, 실시간 서비스에 적합
Gemini 1.5 Flash기본 모델Gemini 1.5 Pro에서 distillation된 경량 모델, 2M+ 토큰 컨텍스트 지원
Gemini 2.0 Flash기본 모델Gemini 2.0의 기본 경량화 모델, 실시간 멀티모달 API, 이미지·음성·비디오 처리 지원
Gemini Pro기본 모델다양한 서비스에 적용되는 주력 범용 모델, 균형 잡힌 성능
Gemini 1.5 Pro기본 모델확장된 컨텍스트(수백만 토큰), 멀티모달, 범용성 강화
Gemini 2.0 Pro기본 모델2025년 2월 출시, Gemini 2.0의 범용 주력 모델
Gemini Ultra추론 모델최상위 성능의 멀티모달 모델, 복잡한 추론·분석·코딩·STEM 분야 특화, MMLU 등 벤치마크 1위
Gemini 2.0 Flash Thinking추론 모델"Thinking" 기능 내장, 답변 과정의 논리적 사고를 드러냄
Gemini 2.5 Pro Experimental추론 모델2025년 3월 공개, 체인 오브 쏘트 내장, 수학·과학·코딩·멀티라운드 추론에 강점
Gemini 2.5 Pro추론 모델Gemini 2.5 시리즈의 주력 추론/코딩/복합 문제 해결 특화 모델

현재에는 하이브리드 모델이 많이 나오고 있는데 앞으로는 기본 모델과 추론 모델의 경계가 점점 옅어질 것이다.

프롬프트(Prompt)

프롬프트(Prompt)는 사전적인 의미로는 “어떤 일을 하도록 하다”라는 뜻이다. 윈도우의 “명령 프롬프트”라는 소프트웨어의 이름안의 프롬프트도 동일한 뜻으로 쓰이는데 터미널(terminal) 프로그램을 실행하고 사용자의 명령을 기다릴 때 깜박이는 커서(cursor)를 “프롬프트 커서”라고 하는것도 같은 의미이다. 명령어로 생각하는 것이 이해하기에 쉽다. AI챗봇에서의 프롬프트도 동일한 것으로 AI에게 답을 얻거나 그림을 그리거나 어떤 일을 하도록 명령하는 것을 말한다. AI 프롬프트은 내용과 쓰는 방식, 문장의 구체성에 따라 AI가 생성하는 답변의 품질과 방향가 내용이 달라지므로 명확하고 구체적으로 작성하는 것이 중요하다.

예시:

  • "데이터 분석이란 무엇인지 초보자에게 설명해줘."
  • "파이썬으로 리스트의 합을 구하는 코드를 알려줘."
  • "아래 표를 바탕으로 시각화 코드를 작성해줘."

이와 같이한다. 프롬프트 작성에는 몇가지 요령이 알려져 있는데 먼저 길이는 너무 짧지 않은 것이 좋다. 길게 적는 것이 반드시 좋은 것은 아니다. 사용하는 단어가 구체적이고 명확한 것이 좋다. AI챗봇의 초기에는 프롬프트에 오타를 넣으면 오류가 섞여 나오거나 할루시네이션이 생길 수 있고 영문으로 작성하면 답이 더 상세히 나오거나 하는 문제가 있었지만 최근 AI챗봇에는 그런 문제가 대부분 해소되었다. 또 프롬프트를 영어로 작성하는 경우에 존댓말로 작성하면 답이 더 잘 나온다는 경향이 있지만 한국어는 큰 차이는 없는 것으로 보인다.

지시어 (Instruction)

지시어(Instruction)는 AI챗봇에게 특정한 행동이나 작업을 명확하게 지시하는 문장 또는 문구를 의미합니다. 프롬프트가 질문이나 요청의 형태라면, 지시어는 AI가 어떻게 답변해야 하는지, 어떤 형식이나 조건을 따라야 하는지 구체적으로 안내하는 역할을 합니다.

예시:

  • "아래 내용을 표로 정리해줘."
  • "3문장 이내로 요약해줘."
  • "코드에 주석을 추가해서 설명해줘."
  • "영어로 번역해줘."

이처럼 지시어를 활용하면 AI가 보다 원하는 방식으로 답변을 생성하도록 유도할 수 있습니다.