1. 머신러닝이란?
- 데이터를 기반으로 컴퓨터가 스스로 학습하여 패턴을 찾고 의사결정을 하는 기술
- 기본용어
- 특성(Feature): 입력 데이터의 특징/속성
- 레이블(Label): 예측하고자 하는 목표값
- 모델(Model): 입력을 출력으로 변환하는 시스템
- 학습(Training): 데이터로부터 패턴을 찾는 과정
2. 머신러닝 유형
- 지도학습(Supervised Learning)
- 입력과 정답이 있는 데이터로 학습 ⇒ 정답 O
- 예: 분류(Classification), 회귀(Regression)
- 비지도학습(Unsupervised Learning)
- 정답 없이 데이터의 패턴을 발견 ⇒ 정답 X
- 예: 군집화(Clustering), 차원축소
- 정답 없이 데이터의 패턴을 발견 ⇒ 정답 X
- 강화학습(Reinforcement Learning)
- 환경과 상호작용하며 보상을 통해 학습
https://77hjoon.tistory.com/54
[ML] 머신러닝의 종류와 분류
1. 머신러닝의 분류와 유형 2. 지도학습입력과 정답이 있는 데이터로 학습 ⇒ 입력 O, 정답 O목표는 입력 데이터를 통해 예측 모델을 학습하여 새로운 데이터에 대한 예측을 하는 것예시: 회귀 (
77hjoon.tistory.com
3. 데이터 전처리
- 머신러닝 모델이 잘 학습할 수 있도록 데이터를 준비하는 과정
- 데이터 분석을 위해 수집한 데이터를 분석에 적합한 형태로 가공하는 과정
- 원본 데이터는 보통 결측값, 이상치, 불필요한 정보 등 다양한 문제를 포함하고 있기 때문에 전처리 과정이 필요
4. 주요 알고리즘
- 기본 알고리즘
- 선형 회귀(Linear Regression)
- 연속적인 값을 예측
- y = wx + b 형태의 직선 찾기
- 로지스틱 회귀(Logistic Regression)
- 이진 분류 문제 해결
- 확률을 기반으로 분류
- 선형 회귀(Linear Regression)
- 심화 알고리즘
- 결정 트리(Decision Tree)
- 규칙 기반의 의사결정
- 해석하기 쉬운 모델
- 서포트 벡터 머신(SVM)
- 데이터를 가장 잘 구분하는 경계 찾기
- 신경망(Neural Networks)
- 뇌의 구조를 모방한 알고리즘
- 딥러닝의 기초
- 결정 트리(Decision Tree)
5. 머신러닝 개발 프로세스
- 데이터 수집과 전처리
- 모델 선택 및 학습
- 모델 평가 및 검증
- 모델 배포와 유지보수
6. 프로그래밍 도구
Python 라이브러리
- NumPy: 수치 계산
- Pandas: 데이터 처리
- Scikit-learn: 머신러닝 구현
- TensorFlow/PyTorch: 딥러닝 구현
'AI > Machine Learning' 카테고리의 다른 글
[ML] 머신러닝의 종류와 분류 (2) | 2024.10.29 |
---|