04-1 로지스틱 회귀

Untitled

pandas의 read_csv() 함수로 CSV파일을 데이터프레임으로 변환

head() 함수로 첫 5행 출력

*dataframe이란?

pandas에서 제공하는 표 형식의 주요 데이터 구조이다.

Untitled

여기서 species 열을 타깃으로 만들고, 나머지 5개 열은 입력 데이터로 사용

Untitled

데이터 프레임에서 여러 열을 선택하면 새로운 데이터프레임이 반환된다.

→ 이를 to_numpy()해서 numpy 배열로 바꾼다!

Untitled

StandardScaler 클래스를 이용해 훈련 세트와 테스트 세트의 표준화 전처리 과정을 거친다.

**훈련 세트의 통계 값으로 테스트 세트를 변환해야 한다!

Untitled

훈련을 거친 후 score 출력 → 최근접 이웃 개수인 k를 3으로 지정하기!