본문 바로가기
AI/Machine Learning

[ML] 머신러닝(Machine Learning)

by 깨준 2024. 10. 29.

1. 머신러닝이란?

  • 데이터를 기반으로 컴퓨터가 스스로 학습하여 패턴을 찾고 의사결정을 하는 기술
  • 기본용어
    • 특성(Feature): 입력 데이터의 특징/속성
    • 레이블(Label): 예측하고자 하는 목표값
    • 모델(Model): 입력을 출력으로 변환하는 시스템
    • 학습(Training): 데이터로부터 패턴을 찾는 과정

2. 머신러닝 유형

  • 지도학습(Supervised Learning)
    • 입력과 정답이 있는 데이터로 학습 ⇒ 정답 O
    • 예: 분류(Classification), 회귀(Regression)
  • 비지도학습(Unsupervised Learning)
    • 정답 없이 데이터의 패턴을 발견 ⇒ 정답 X
      • 예: 군집화(Clustering), 차원축소
  • 강화학습(Reinforcement Learning)
    • 환경과 상호작용하며 보상을 통해 학습

https://77hjoon.tistory.com/54

 

[ML] 머신러닝의 종류와 분류

1. 머신러닝의 분류와 유형 2. 지도학습입력과 정답이 있는 데이터로 학습 ⇒ 입력 O, 정답 O목표는 입력 데이터를 통해 예측 모델을 학습하여 새로운 데이터에 대한 예측을 하는 것예시: 회귀 (

77hjoon.tistory.com

 

3. 데이터 전처리

  • 머신러닝 모델이 잘 학습할 수 있도록 데이터를 준비하는 과정
  • 데이터 분석을 위해 수집한 데이터를 분석에 적합한 형태로 가공하는 과정
  • 원본 데이터는 보통 결측값, 이상치, 불필요한 정보 등 다양한 문제를 포함하고 있기 때문에 전처리 과정이 필요

4. 주요 알고리즘

  • 기본 알고리즘
    • 선형 회귀(Linear Regression)
      • 연속적인 값을 예측
      • y = wx + b 형태의 직선 찾기
    • 로지스틱 회귀(Logistic Regression)
      • 이진 분류 문제 해결
      • 확률을 기반으로 분류
  • 심화 알고리즘
    • 결정 트리(Decision Tree)
      • 규칙 기반의 의사결정
      • 해석하기 쉬운 모델
    • 서포트 벡터 머신(SVM)
      • 데이터를 가장 잘 구분하는 경계 찾기
    • 신경망(Neural Networks)
      • 뇌의 구조를 모방한 알고리즘
      • 딥러닝의 기초

5. 머신러닝 개발 프로세스

  1. 데이터 수집과 전처리
  2. 모델 선택 및 학습
  3. 모델 평가 및 검증
  4. 모델 배포와 유지보수

6. 프로그래밍 도구

Python 라이브러리

  • NumPy: 수치 계산
  • Pandas: 데이터 처리
  • Scikit-learn: 머신러닝 구현
  • TensorFlow/PyTorch: 딥러닝 구현

'AI > Machine Learning' 카테고리의 다른 글

[ML] 머신러닝의 종류와 분류  (2) 2024.10.29