본문 바로가기
독서

[독서] 박태웅의 AI 강의 2025 1강을 읽고서

by 프론트엔드 지식백과 2025. 1. 13.

느낀점

  • 인공지능, 특히 LLM의 기본 개념과 그것이 현재 우리의 삶과 얼마나 밀접하게 연관되어 있는지에 대해 깊이 이해할 수 있었다. 이번 기회를 통해 대략적으로만 알고 있던 용어들을 검색하며 확실히 개념을 정리할 수 있었고, 그중에서도 몸을 가진 인공지능(Embodied AI)에 대해 특히 흥미를 느꼈다.
  • 이는 AI가 사람처럼 세상을 이해하고 상호작용하려면 물리적인 몸이나 감각 인터페이스가 필요하다는 주장으로, 어린아이가 물건을 던지며 중력과 충격을 학습하듯 AI도 물리적 법칙을 직관적으로 이해하기 위해 물리적 경험이 필요하다는 점이 인상적이었다.
  • 즉, 강화 학습을 통해 AI가 '당근과 채찍' 같은 피드백을 바탕으로 환경에 적응하고 동작을 개선할 수 있는 점이 중요하게 다가왔다. 이는 AI가 보다 인간적이고 자연스러우며 직관적인 시스템으로 발전하기 위한 핵심 열쇠가 될 것이라 생각한다.

 

1. 맥락 인터페이스, RAG

맥락 인터페이스는 사용자와 시스템 간의 상호작용에서 컨텍스트(문맥)를 효과적으로 유지하고 활용하는 기술

RAG는 전통적인 생성 모델과는 달리, 먼저 데이터베이스나 문서 집합에서 관련 정보를 검색하고, 검색한 정보를 바탕으로 텍스트 생성

 

RAG란? - 검색 증강 생성 AI 설명 - AWS

시맨틱 검색은 방대한 외부 지식 소스를 LLM 애플리케이션에 추가하려는 조직의 RAG 결과를 향상시킵니다. 오늘날의 기업은 매뉴얼, FAQ, 연구 보고서, 고객 서비스 가이드, 인사 관리 문서 리포지

aws.amazon.com

 

RAG의 검색 결과와 맥락 인터페이스를 통합한다면?

사용자가 질문을 하면, RAG가 관련 정보를 검색하고 맥락 인터페이스는 이를 사용해 질문의 의도를 분석하고 적절히 응답한다.

즉, 맥락 인터페이스는 RAG가 제공한 정보를 사용자 의도와 대화의 맥락에 맞게 최적화한다.

 

RAG가 제공한 검색 결과를 포함해 대화의 흐름과 사용자의 의도를 반영하여 응답의 일관성과 적합성 보장

 

 

2. 할루시네이션

'할루시네이션(Hallucination, 환각)에 대해서는 주의가 필요합니다.'

 

환각이란 거대언어모델이 내뱉은 지어낸 말, 사실과 다른 말이라는 뜻이다.

LLM은 훈련 데이터에서 학습한 단어와 문장 구조의 확률적 패턴을 기반으로 응답을 생성

⇒ 정확한 사실이 아니라 가장 그럴듯한 답변을 만들어낼 때가 있음

 

모델은 훈련 데이터에 포함된 정보만 알고 있음

⇒ 훈련 데이터에 없는 질문을 받으면, 빈틈을 채우기 위해 새롭게 정보를 만들어내는 경향이 생김

 

3. 개인 인공지능 비서

데이터의 양이 작아짐에 따라 속도 빨라짐, 클라우드에 내 데이터를 올릴 일이 없음 → 개인정보 샐 염려 없음 → 개인화가 쉬워짐 ⇒ 나만의 에이전트 가능

인공지능이 더 보편화될 것이라고 예상

 

4. 전이 학습

전이 학습: 이미 알고 있는 것을 활용해서 새로 배우는 시간과 노력을 줄이는 방법

예시) 언어 모델(예: GPT)은 인터넷 텍스트를 학습해 언어의 기본 구조를 이해함

→ 이후, 특정 도메인(법률, 의료)에 맞게 세부적인 추가 학습만 하면 됨

 

전이 학습, 파인 튜닝:

전이 학습은 기존 모델을 재활용하는 큰 틀

파인튜닝은 그 모델을 새로운 작업에 맞게 조정하는 세부 과정 (즉, 전이 학습의 한 부분)

 

전이 학습: 이미지를 분류하는 데 사용되는 ResNet을 가져와, 일반적인 물체 인식에 활용. 기존 모델의 구조와 지식을 그대로 사용.

파인튜닝: ResNet을 가져와, 새로운 데이터셋(예: 특정 동물만 포함된 사진)으로 마지막 몇 개 층을 재학습하여 동물 분류에 특화된 모델로 만듦.

 

5. Embodied AI

몸을 가진 인공지능 - 인공지능이 제대로 지능이 되기 위해서는 몸을 가지고 있어야 한다 → 그래야 세계에 관한 모델을 가질 수 있음

우리의 사고와 학습은 추상적인 계산으로만 이루어지는 것이 아니라, 몸으로 느끼고 경험하며 환경을 탐색하는 과정에서 발전

하지만, 현재 대부분의 AI는 텍스트, 이미지, 비디오 등의 정적 데이터로 학습

728x90

'독서' 카테고리의 다른 글

[독서] 왜 그 사람이 말하면 사고 싶을까?  (0) 2022.11.16