목록전체 글 (59)
개발하고 싶어요
회귀 트리¶ 사이킷런의 랜덤 포레스트 회귀 트리인 RandomForestRegressor를 이용해 앞의 선형 회귀에서 다룬 보스턴 주택 가격 예측 수행 In [16]: from sklearn.model_selection import cross_val_score from sklearn.ensemble import RandomForestRegressor import pandas as pd import numpy as np import matplotlib.pyplot as plt import warnings warnings.filterwarnings('ignore') # 보스턴 데이터 세트 로드 boston_df = pd.read_csv('./data/BostonHousing.csv') boston_df = ..
로지스틱 회귀¶ 회귀 문제를 약간 비틀어 분류 문제에 적용 가령 종양의 크기에 따라 악성 종양인지(1), 아닌지(0)를 회귀를 이용해 1, 0의 값으로 예측하기 로지스틱 회귀 : 선형 회귀 방식을 기반으로 하되 시그모이드 함수를 이용해 분류를 수행하는 회귀 위스콘시 유방암 데이터 세트 기반에서 로지스틱 회귀로 암 여부를 판단 In [24]: import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_breast_cancer from sklearn.linear_model import LogisticRegression import warnings warnings.filterwarnings('ignore') canc..
규제 선형 모델 - 릿지, 라쏘, 엘라스틱넷¶ 릿지 회귀¶ 앞 예제의 보스턴 주택 가격을 Ridge 클래스를 이용해 다시 예측하고, 예측 성능을 cross_val_score()로 평가 In [1]: # 데이터 불러오기 import numpy as np import matplotlib.pyplot as plt import pandas as pd from scipy import stats import seaborn as sns import warnings warnings.filterwarnings('ignore') # boston 데이터 세트 로드 boston_df = pd.read_csv('./data/BostonHousing.csv') print('boston 데이터 세트 크기 : ', boston_df..
다항 회귀와 과(대)적합/과소적합 이해¶ 다항 회귀 이해¶ 사이킷런은 다항 회귀를 위한 클래스를 명시적으로 제공X -> 대신 다항 회귀 역시 선형 회귀이기 때문에 비선형 함수를 선형 모델에 적용 PolynomialFeatures 클래스를 통해 feature를 Polynomial(다항식) feature로 변환 $ 단항값[x1, x2] -> 2차 다항값[1, x1, x2, x1^{2}, x1x2, x2^{2}] $ In [97]: from sklearn.preprocessing import PolynomialFeatures import numpy as np # 다항식으로 변환한 단항식 생성, [[0. 1], [2, 3]]의 2X2 행렬 생성 X = np.arange(4).reshape(2, 2) print(..