LLM | Hello AI | Hello AI

Large Language Model

LLM이란?

LLM은 텍스트를 이해하고 생성하는 거대한 패턴 인식기다.

수십억 개의 텍스트에서 언어 패턴을 학습해 새로운 텍스트를 생성한다.

책, 웹페이지, 코드 등 방대한 데이터가 하나의 모델로 압축된다.

책/논문100B+

웹페이지1T+

코드50B+

학습

수십억 파라미터

"인터넷의 모든 책을 읽은 학생" - 패턴은 기억하지만 진짜 이해하는 건 아니다

Next Token Prediction

다음 단어 예측

LLM의 핵심은 '다음에 올 단어가 뭘까?'를 맞추는 것이다.

수십억 번의 빈칸 채우기 게임을 통해 언어 패턴을 학습했다.

후보 단어 위에 마우스를 올려 확률 분포를 확인해보세요.

오늘 날씨가 정말?

후보 단어

45%좋다

25%덥다

2%바나나

1%컴퓨터

"스마트폰 자동완성의 극한 버전" - 문맥을 보고 가장 그럴듯한 다음 단어를 선택한다

Training Pipeline

학습 여정

처음 만든 LLM은 대화가 안 된다. 패턴 학습 → 지시 학습 → 인간 피드백 단계를 거쳐야 ChatGPT가 된다.

패턴만 아는 모델을 '지시를 따르고 인간과 대화하는 모델'로 변환하는 과정이다.

3단계를 클릭해 각 단계에서 모델이 어떻게 변하는지 확인하세요.

Pre-training

인터넷의 방대한 텍스트에서 언어 패턴을 학습한다.

입력: 인터넷 데이터 (책, 웹, 코드)

출력: 패턴만 아는 모델

프롬프트:

"프랑스의 수도는"

응답:

"파리이다. 파리는 세계적인 도시로... (끝없이 이어짐)"

질문에 답하지 않고 그냥 이어쓰기만 함

"야생마를 길들이는 과정" - 원시 모델을 친절한 어시스턴트로 훈련시킨다

Generation Flow

프롬프트 → 응답

입력을 받으면 토큰을 하나씩 이어붙이며 답변을 완성한다.

한 번에 전체 답변을 만드는 게 아니라, 다음 단어를 반복 선택하는 과정이다.

버튼을 눌러 토큰이 하나씩 생성되는 과정을 확인하세요.

프롬프트

인공지능이란 무엇인가요?

응답

"한 글자씩 타이핑하는 빠른 타자수" - 이전 맥락을 보고 다음 토큰을 선택하는 과정을 반복한다

Limitations

한계와 환각

학습 데이터 밖의 것은 '그럴듯하게 지어낸다' - 이를 환각(Hallucination)이라 한다.

모델은 패턴을 학습했을 뿐, 진짜 사실을 '아는' 것이 아니다.

원 안은 학습된 지식, 원 밖은 모르는 영역 - 밖의 질문에는 지어낼 수 있다.

미지의 영역

학습된 지식

~2024년 데이터

답변 가능

환각 가능성

"오픈북 시험인데 책이 2024년까지만 있다" - 최신 정보나 개인 정보는 알 수 없다

Search vs Generate

AI vs 검색엔진

검색은 기존 정보를 '찾고', AI는 새로운 답변을 '만든다'.

둘은 완전히 다른 도구다. 목적에 맞게 선택해야 한다.

같은 질문을 던졌을 때 결과가 어떻게 다른지 비교해보세요.

파이썬 리스트 정렬 방법

docs.python.org

리스트 정렬하기

stackoverflow.com

How to sort a list

wikidocs.net

파이썬 정렬 함수

실시간 정보

정확한 출처

맞춤 설명

검색엔진을 쓸 때

오늘 날씨, 주가, 뉴스
공식 문서 원본이 필요할 때
정확한 수치/통계가 필요할 때

AI를 쓸 때

개념 설명, 요약, 정리
코드 작성, 번역, 글쓰기
아이디어 브레인스토밍

"도서관 사서 vs 개인 과외 선생" - 사서는 책 위치를 알려주고, 선생은 직접 설명해준다