본문 바로가기

AI/Machine Learning4

[Python]머신러닝 용어 정리 supervised, unsupervised 차이점, 종류 머신러닝은 주로 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)으로 나뉜니다. Supervised지도학습(Supervised Learning)은 머신러닝의 한 분야로, 입력 데이터와 그에 대응하는 정답 데이터(레이블)를 사용하여 모델을 학습하는 방법이다. 이 방법은 입력과 출력 사이의 매핑을 학습하여 주어진 입력에 대한 적절한 출력을 예측할 수 있도록 한다.지도학습은 다음과 같은 특징을 가지고 있다:학습 데이터에 레이블이 존재: 지도학습에서는 학습을 위한 데이터에 레이블이 포함되어 있다. 이 레이블은 우리가 원하는 출력값을 나타낸다. 예를 들어, 스팸 메일 필터링을 학습하기 위한 데이터셋에서는 각 이메일이 스팸인지 햄(정상 메일)인지를 나타내는 레이블이.. 2024. 4. 22.
[Python] Logistic Regression 이진 분류, 예측 Logistic Regression 은  주로 이진 분류(binary classification) 문제에 사용되는 머신러닝 알고리즘 중 하나이다. 이 알고리즘은 선형 회귀 모델을 기반으로 하지만, 출력을 범주형 값(0 또는 1)으로 변환하여 확률을 예측하는 데 사용된다. 이메일 클릭을 할 사람과 안할 사람으로 분류할 것이다. 빨간점이 바로 데이터이며, 액션의 0과 1이 바로 레이블이다.레이블이 있다는 것은 수퍼바이저드 러닝 이라는 뜻이다. "슈퍼바이저드 러닝" 은 기계 학습의 한 유형으로, 모델이 입력과 해당 출력 간의 관계를 학습하는 방법이다. 이러한 관계는 레이블된(labelled) 데이터셋에서 관찰된다. 각 입력에는 해당 출력에 대한 "정답"이 제공된다. 이러한 방식으로 모델은 주어진 입력에 대해 .. 2024. 4. 15.
[Python]머신러닝 Machine Learning MSE(평균 제곱 오차,Mean Squared Error ) 를 쓰는 이유 MSEMSE(Mean Squared Error, 평균 제곱 오차 )는 회귀 모델의 성능을 측정하는 데 사용되는 지표 중 하나로, 예측 값과 실제 값 간의 평균 제곱 차이를 측정한다. 이 지표는 예측 모델이 얼마나 잘 작동하는지를 평가하고, 모델의 예측 오차를 수치화하여 제공한다.  간단하고 직관적인 지표: MSE는 예측 값과 실제 값 사이의 차이를 제곱하여 평균한 값으로, 이해하기 쉽고 직관적이다.미분 가능한 손실 함수: MSE는 연속형 변수를 예측하는 회귀 문제에서 많이 사용되는 손실 함수이다. 이 함수는 미분 가능하므로 경사 하강법과 같은 최적화 알고리즘을 사용하여 모델을 학습시킬 수 있다.이상치에 민감하지 않음: MSE는 오차를 제곱하여 계산하므로 이상치(Outlier)에 민감하지 않다. 즉, 이상.. 2024. 4. 12.
[Python]머신러닝 Machine Learning supervised Regression mse(평균 제곱 오차) Machine Learning머신러닝은 컴퓨터 시스템이 데이터에서 학습하고 경험을 통해 자동적으로 개선되는 알고리즘과 기술을 연구하는 인공지능의 한 분야이다. 이는 명시적으로 프로그래밍되지 않은 데이터를 사용하여 작업을 수행하도록 컴퓨터를 학습시키는 과학이다. 머신러닝 알고리즘은 대부분 다음과 같은 과정을 따른다:데이터 수집: 머신러닝 모델을 학습시키기 위해 데이터를 수집한다. 데이터는 입력 변수와 해당 변수에 대한 결과(목표 값 또는 레이블)으로 구성된다.데이터 전처리: 수집된 데이터를 정제하고 준비한다. 이 과정에는 데이터의 결측치 처리, 이상치 제거, 데이터 스케일링 등이 포함될 수 있다.모델 선택: 주어진 작업에 가장 적합한 머신러닝 모델을 선택합니다. 이는 데이터의 유형, 작업의 목적 등에 따라.. 2024. 4. 12.