LLM이란?
LLM은 텍스트를 이해하고 생성하는 거대한 패턴 인식기다.
수십억 개의 텍스트에서 언어 패턴을 학습해 새로운 텍스트를 생성한다.
책, 웹페이지, 코드 등 방대한 데이터가 하나의 모델로 압축된다.
"인터넷의 모든 책을 읽은 학생" - 패턴은 기억하지만 진짜 이해하는 건 아니다
다음 단어 예측
LLM의 핵심은 '다음에 올 단어가 뭘까?'를 맞추는 것이다.
수십억 번의 빈칸 채우기 게임을 통해 언어 패턴을 학습했다.
후보 단어 위에 마우스를 올려 확률 분포를 확인해보세요.
후보 단어
"스마트폰 자동완성의 극한 버전" - 문맥을 보고 가장 그럴듯한 다음 단어를 선택한다
학습 여정
처음 만든 LLM은 대화가 안 된다. 패턴 학습 → 지시 학습 → 인간 피드백 단계를 거쳐야 ChatGPT가 된다.
패턴만 아는 모델을 '지시를 따르고 인간과 대화하는 모델'로 변환하는 과정이다.
3단계를 클릭해 각 단계에서 모델이 어떻게 변하는지 확인하세요.
Pre-training
인터넷의 방대한 텍스트에서 언어 패턴을 학습한다.
"프랑스의 수도는"
"파리이다. 파리는 세계적인 도시로... (끝없이 이어짐)"
질문에 답하지 않고 그냥 이어쓰기만 함
"야생마를 길들이는 과정" - 원시 모델을 친절한 어시스턴트로 훈련시킨다
프롬프트 → 응답
입력을 받으면 토큰을 하나씩 이어붙이며 답변을 완성한다.
한 번에 전체 답변을 만드는 게 아니라, 다음 단어를 반복 선택하는 과정이다.
버튼을 눌러 토큰이 하나씩 생성되는 과정을 확인하세요.
인공지능이란 무엇인가요?
"한 글자씩 타이핑하는 빠른 타자수" - 이전 맥락을 보고 다음 토큰을 선택하는 과정을 반복한다
한계와 환각
학습 데이터 밖의 것은 '그럴듯하게 지어낸다' - 이를 환각(Hallucination)이라 한다.
모델은 패턴을 학습했을 뿐, 진짜 사실을 '아는' 것이 아니다.
원 안은 학습된 지식, 원 밖은 모르는 영역 - 밖의 질문에는 지어낼 수 있다.
학습된 지식
~2024년 데이터
"오픈북 시험인데 책이 2024년까지만 있다" - 최신 정보나 개인 정보는 알 수 없다
AI vs 검색엔진
검색은 기존 정보를 '찾고', AI는 새로운 답변을 '만든다'.
둘은 완전히 다른 도구다. 목적에 맞게 선택해야 한다.
같은 질문을 던졌을 때 결과가 어떻게 다른지 비교해보세요.
docs.python.org
리스트 정렬하기
stackoverflow.com
How to sort a list
wikidocs.net
파이썬 정렬 함수
- 오늘 날씨, 주가, 뉴스
- 공식 문서 원본이 필요할 때
- 정확한 수치/통계가 필요할 때
- 개념 설명, 요약, 정리
- 코드 작성, 번역, 글쓰기
- 아이디어 브레인스토밍
"도서관 사서 vs 개인 과외 선생" - 사서는 책 위치를 알려주고, 선생은 직접 설명해준다