AI

[AI] 현대 AI 기술의 핵심 개념

EveryDay.DevUp 2025. 5. 25. 16:33

 

현대 AI 기술의 핵심 개념

인공지능, 머신러닝, 딥러닝의 체계적 이해

AI vs ML vs DL

현대 인공지능 기술을 이해하기 위해서는 먼저 AI, 머신러닝, 딥러닝의 관계를 명확히 파악해야 합니다. 이들은 서로 다른 범위와 접근 방식을 가지고 있습니다.

AI (인공지능)

인간의 지능을 인공적으로 구현한 기술 전체를 아우르는 가장 광범위한 개념

ML (머신러닝)

데이터를 기반으로 학습하여 AI를 실현하는 구체적인 방법론

DL (딥러닝)

딥 뉴럴 네트워크를 통해 데이터 기반 학습을 수행하는 머신러닝의 하위 개념

규칙 기반 vs 데이터 기반 접근법

전통적인 AI는 사람이 직접 규칙을 구현하는 방식이었습니다. 예를 들어 체스 AI의 경우, 각 상황에 따라 어떤 말을 어떻게 움직일지 규칙을 정의해야 했습니다. 하지만 이런 방식은 모든 경우를 포괄하기 어렵고 예외 상황에 취약하다는 한계가 있었습니다.

반면 데이터 기반 방식은 수많은 체스 데이터를 통해 AI가 스스로 규칙을 찾아내도록 합니다. 이는 복잡한 문제도 효과적으로 해결할 수 있는 강력한 접근법입니다.

 

데이터 기반 학습의 원리

머신러닝과 딥러닝에서 가장 중요한 것은 데이터를 어떻게 숫자로 변환하여 처리하느냐입니다. 컴퓨터는 숫자만 이해하기 때문입니다.

1) 이미지 데이터 처리

5×5 픽셀 이미지의 경우: RGB 채널의 각 픽셀 값을 행렬로 변환하면 3×5×5 형태의 3차원 행렬이 됩니다. 각 채널별로 색상 강도 값이 저장되어 컴퓨터가 이미지를 '이해'할 수 있게 됩니다.

2) 자연어 데이터 처리

텍스트는 숫자가 아니므로 전처리가 필요합니다. 토크나이징 과정을 통해 "저는 강사입니다"를 "저는/강사/입니다"로 나누고, 각 토큰을 고유한 숫자에 대응시킵니다. 이렇게 변환된 숫자 시퀀스를 통해 AI가 언어를 처리할 수 있습니다.

 

머신러닝의 4가지 학습 방법

🎯 지도학습 (Supervised Learning)

정답을 알고 있는 상태에서 학습시키는 방식입니다. 모델이 특정 입력에 대해 어떤 출력을 내야 하는지 명확히 정의된 상태에서 학습을 진행합니다.

레이블 형태에 따른 분류:

  • 회귀: 연속적인 값 예측 (예: 주택 가격 예측)
  • 분류: 이산적인 클래스 분류 (예: 이미지 분류)
🎯 분류 문제의 다양한 응용 분야
위치 추정 (Localization)
이미지 내 객체의 클래스를 판단하고 동시에 그 객체의 정확한 위치를 바운딩 박스로 출력
객체 탐지 (Object Detection)
이미지 내 여러 객체에 대한 분류와 위치 추정을 동시에 수행하는 복합적 기술
분할 (Segmentation)
이미지의 모든 픽셀을 대상으로 각 픽셀이 어떤 클래스에 해당하는지 판단
인스턴스 분할
같은 클래스의 서로 다른 객체도 개별적으로 구분하여 식별
자세 추정 (Pose Estimation)
인간이나 동물의 관절 위치를 추정하여 전체적인 자세를 파악
얼굴 랜드마크 탐지
얼굴의 주요 특징점(눈, 코, 입 등)을 정확히 찾아내는 기술

🔄 자기지도학습 (Self-Supervised Learning)

레이블링 부담을 줄이면서도 높은 성능을 얻기 위한 혁신적인 방법입니다. 두 단계로 구성되어 실제 문제 해결 능력을 체계적으로 구축합니다.

📋 학습 단계별 상세 설명
1단계: 사전 학습 (Pre-training)

실제 풀고자 하는 진짜 문제 대신 '가짜 문제'를 새롭게 정의하여 해결하는 단계입니다. 레이블이 없는 대량의 데이터를 활용하여 모델이 데이터의 기본적인 패턴과 구조를 학습하게 됩니다. 이 과정에서 모델은 데이터에 내재된 일반적인 특성들을 이해하게 됩니다.
2단계: 미세 조정 (Fine-tuning)

사전 학습에서 얻은 지식을 바탕으로, 레이블이 있는 데이터를 이용하여 실제 목표 작업에 맞게 모델을 세밀하게 조정하는 단계입니다. 이미 학습된 기본 지식을 활용하므로 적은 양의 레이블 데이터로도 높은 성능을 달성할 수 있습니다.
📸 이미지 분석 기법
Context Prediction
이미지의 구조와 객체 간 위치 관계를 학습하여 전반적인 구조 파악 능력을 기름
Contrastive Learning
동일 이미지의 변형 쌍은 가깝게, 다른 이미지 쌍은 멀어지게 학습
🤖 자연어처리 응용
ChatGPT와 Gemini가 사용하는 '다음 단어 예측' 방식이 대표적인 예입니다. 인터넷의 방대한 텍스트 데이터를 활용하여 모델을 학습시킬 수 있습니다.

🔍 비지도학습 (Unsupervised Learning)

레이블이 없는 데이터에서 패턴이나 구조를 찾아내는 학습 방법입니다.

군집화 (Clustering)
비슷한 특성을 가진 데이터들을 그룹으로 묶는 방법
차원 축소
중요한 특성은 유지하면서 데이터의 복잡성을 줄이는 방법

🎮 강화학습 (Reinforcement Learning)

특정한 행동을 강화시키는 학습 방법으로, 보상과 처벌을 통해 최적의 행동 전략을 학습합니다.

오목 게임 예시:

AI가 처음에는 랜덤하게 돌을 두다가, 승리했을 때 보상을 받으면서 점차 연속된 5개의 돌을 만드는 전략을 스스로 학습하게 됩니다. 사람이 규칙을 명시적으로 알려주지 않았음에도 AI가 게임의 규칙과 전략을 깨닫게 됩니다.

에이전트 행동을 취하는 주체
액션 에이전트가 취할 수 있는 모든 행동
리워드 행동에 따라 받는 보상
환경 강화학습이 일어나는 무대
스테이트 환경의 현재 상태를 나타내는 개념
행동 가치 함수 Q 특정 상태-행동 쌍의 기대 보상값
에피소드 하나의 완전한 시행
Q-Learning 최적의 행동 가치를 학습하는 방법
Exploration 새로운 방법을 탐색하는 과정
Discount Factor 미래 보상의 현재 가치 할인율
🔍 주요 개념 상세 설명

행동 가치 함수 Q: 특정 스테이트에서 특정 액션을 했을 때 현재와 미래에 얻을 수 있는 보상의 합의 기댓값을 나타냅니다. 이는 어떤 행동이 장기적으로 더 유리한지 판단하는 핵심 지표입니다.

Q-Learning: 에피소드 내에서 수많은 액션을 수행하며 Q 값을 반복적으로 업데이트하여 최적의 행동 가치를 학습하는 방법입니다. 시행착오를 통해 점진적으로 최적 전략을 찾아갑니다.

Exploration vs Exploitation: 기존에 학습하지 않은 새로운 방법을 찾아내는 것(Exploration)과 현재까지 학습한 최적 전략을 활용하는 것(Exploitation) 사이의 균형이 중요합니다. 특정 확률을 통해 일탈의 빈도를 조정합니다.

Discount Factor: Q 값을 현재 시점으로 가져올 때 곱하는 0과 1 사이의 값입니다. 1에 가까울수록 미래의 보상을 중요하게 여기게 되며, 이를 통해 여러 경로 중에서 더 빠르게 보상을 얻을 수 있는 최단 경로를 선택할 수 있게 합니다.

 

마무리

현대 AI 기술은 단순한 규칙 기반 시스템에서 데이터 기반 학습으로 패러다임이 전환되면서 놀라운 발전을 이루었습니다. 지도학습부터 강화학습까지 다양한 학습 방법들이 각각의 고유한 장점을 가지고 있으며, 실제 문제 해결에 적합한 방법을 선택하는 것이 중요합니다.

특히 자기지도학습의 등장으로 대규모 레이블링 작업 없이도 높은 성능을 달성할 수 있게 되었고, 이는 ChatGPT와 같은 대규모 언어 모델의 성공으로 이어졌습니다. 앞으로도 AI 기술은 더욱 정교하고 효율적인 방향으로 발전해 나갈 것으로 예상됩니다.