목록머신러닝/선형회귀 (2)
일상 코딩
보스턴 부동산 데이터의 특징들(Features)¶ CRIM: 도시별 범죄발생률 ZN: 25,000평을 넘는 토지의 비율 INDUS: 도시별 비상업 지구의 비유 CHAS: 찰스 강의 더미 변수(1 = 강의 경계, 0 = 나머지) NOX: 일산화질소 농도 RM: 주거할 수 있는 평균 방의개수 AGE: 1940년 이전에 지어진 주택의 비율 DIS: 5개의 고용지원센터까지의 가중치가 고려된 거리 RAD: 고속도로의 접근 용이성에 대한 지표 TAX: 10,000달러당 재산세 비율 PTRATIO: 도시별 교사와 학생의 비율 B: 도시의 흑인 거주 비유 LSTAT: 저소득층의 비율 MEDV: 본인 소유 주택 가격의 중앙값 필요한 라이브러리 임폴트¶ In [ ]: import pandas as pd import mat..
In [ ]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error In [ ]: # read weight-height dataset data = "./weight-height.csv" df_weight_height = pd.read_csv(data) In [ ]: df_weight_height.head() Out[ ]: Gend..