Русские видео

Сейчас в тренде

Иностранные видео


Скачать с ютуб 빅분기 실기 작업형 2유형(회귀) 이 영상 하나로 끝내세요! в хорошем качестве

빅분기 실기 작업형 2유형(회귀) 이 영상 하나로 끝내세요! 12 дней назад


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса savevideohd.ru



빅분기 실기 작업형 2유형(회귀) 이 영상 하나로 끝내세요!

*깃허브* https://github.com/JEunJin/BigData_py... *전체 코드* import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/JEu...) #print(df.info()) #print(df.head()) #데이터 전처리 (결측값, 라벨인코딩) df['fuel_type'].fillna(df['fuel_type'].mode()[0], inplace=True) df['accident'].fillna(df['accident'].mode()[0], inplace=True) df['clean_title'].fillna(df['clean_title'].mode()[0], inplace=True) #print(df.info()) from sklearn.preprocessing import LabelEncoder le = LabelEncoder() df['brand']=le.fit_transform(df['brand']) df['model']=le.fit_transform(df['model']) df['milage']=le.fit_transform(df['milage']) df['fuel_type']=le.fit_transform(df['fuel_type']) df['engine']=le.fit_transform(df['engine']) df['transmission']=le.fit_transform(df['transmission']) df['ext_col']=le.fit_transform(df['ext_col']) df['int_col']=le.fit_transform(df['int_col']) df['accident']=le.fit_transform(df['accident']) df['clean_title']=le.fit_transform(df['clean_title']) #케이스1 (전체적인 흐름 위주로 작업할 경우) #df['price']=le.fit_transform(df['price']) #케이스2 (#목표 변수(price) 문자열 데이터 수치형으로 변환 (기호 제거, 및 데이터 타입 변환)) #★내용 추가★ df['price'] = df['price'].str.replace('$','') # $ 제거 df['price'] = df['price'].str.replace(',','') # , 제거 df = df.astype({'price':'int'}) #데이터 타입 변환 #print(df.info ()) #print(df.head()) #★내용 추가★ #트레인 3800, 테스트 209 train = df.iloc[:3800,:] test = df.iloc[-209:,:] #print(train.info()) #print(test.info()) #데이터 분할 from sklearn.model_selection import train_test_split X = train.drop(columns=['price']) y = train['price'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=10) #모델링 및 학습 from sklearn.ensemble import RandomForestRegressor rfr=RandomForestRegressor(n_estimators=120, max_depth=15, random_state=10) rfr.fit(X_train, y_train) pred1=rfr.predict(X_test) #모델 성능평가 from sklearn.metrics import mean_squared_error import numpy as np mse = mean_squared_error(y_test, pred1) #print('mse:', mse) #mse: 121862.20429051273 / mse: 2139040203.4544616 rmse = np.sqrt(mse) #print('rmse:', rmse) #rmse: 349.0876742173988 / rmse: 46249.75895563632 #최종 결과 예측 test_X_data = test.drop(columns=['price']) pred2 = rfr.predict(test_X_data) #결과 제출 및 확인 pd.DataFrame({'price':pred2}).to_csv('result.csv', index=False) result = pd.read_csv('result.csv') #print(result)

Comments