『비전공자도 이해할 수 있는 챗GPT』,
『비전공자도 이해할 수 있는 AI 지식』
10만 베스트셀러를 기록한
세상에서 가장 이해하기 쉬운 챗GPT 교양서

HOME » WIKI » Scikit Learn

Scikit Learn

개요

  • scikit-learn의 분류기 비교
    랜덤 포레스트는 선형에 가까운 모습을, RBF SVM은 비선형에 가까운 모습을 보여준다. SVM의 정확도가 가장 높다. 의외로 NN이 선형으로 구분되는 모습을 보여주는 점이 특이하다. kNN도 잘 동작하는데 아마 오버피팅이 매우 심할 것 같다.
  • scikit-learn의 적절한 평가기 선택하기
    스무고개 형태로 적절한 평가기를 선택할 수 있는 가이드를 제공한다.

팩키지

데이터 사이언스 스쿨의 Scikit-Learn 패키지 소개와 scikit-learn 공식 홈페이지의 전체 API 레퍼런스

클래스

  • 전처리용 클래스
    • fit(): 학습
    • transform(): 추론할때 사용. 처리된 모델내에서 적용한다.
    • fit_transform(): 학습하면서 결과를 함께 리턴한다. 증분 학습이 되는건 아니다.
  • 머신러닝 모형 클래스
    • fit(): 학습
    • predict(): 예측 또는 추론
    • predict_proba(): 확률 표시
    • score()
  • Pipeline 클래스
    • 복수의 Preprocessor와 Model을 연결하여 하나의 Model처럼 행동
    • Model 클래스가 제공하는 공통 메서드를 모두 제공
    • pipeline 내부에서 Preprocessor에서 자료를 계속 변형한 후 마지막으로 Model에 입력

기타

scikit-learn은 학습 데이타에서 파생된 속성은 맨 뒤에 _를 붙여 사용자가 지정한 파라미터와 구분한다. 예를 들어 LinearRegression에서 coef_, intercept_.

상관 계수correlation coefficient

표준 상관 계수standard correlation coefficientcorr()를 이용해 쉽게 계산할 수 있다.

corr_matrix = housing.corr()

>>> corr_matrix["median_house_value"].sort_values(ascending=False)
median_house_value    1.000000
median_income         0.687170
total_rooms           0.135231
housing_median_age    0.114220
households            0.064702
total_bedrooms        0.047865
population           -0.026699
longitude            -0.047279
latitude             -0.142826
Name: median_house_value, dtype: float64
Last Modified: 2021/06/08 13:03:45
자바 알고리즘 인터뷰 파이썬 알고리즘 인터뷰

카카오 코딩 테스트 출제위원이 직접 집필한,
리트코드(LeetCode) 문제로 풀어보는,
구글, 마이크로소프트, 네이버, 카카오
코딩 테스트 완벽 가이드
『자바 알고리즘 인터뷰』,
『파이썬 알고리즘 인터뷰』

이 사이트의 운영 비용을 후원할 수 있으며, 후원자에게 혜택을 제공할 예정입니다.

© 2000 - Sang Park Except where otherwise noted, content on this site is licensed under a CC BY-NC 4.0.
This site design was brought from Distill. Logo and wiki background image was brought from Bear.