[디스플레이센서 이상요인 분석] 2021/7/27 기술통계량 및 요인분석

July 27 2021

오늘 한 것

1.결측치 처리

2.기술 통계량 구하기

  • 연속형 데이터이므로 그에 맞는 기술통계량(평균, 표준편차 등) 같은 것을 구해보기

  • (단, 빈도, 백분율같은 것은 분류형데이터의 기술통계량이므로 구하지 않아도 됨. 연속형 데이터의 기술 통계량만 구할 것!)

3.상관계수 확인

  • 모든 컬럼에 대해 상관계수 구하는 함수 만들기

  • 컬럼의 개수는 841개인데 날짜와 일부 폐기율에 대한 컬럼을 제거하고 진행했습니다.

컬럼의 개수가 워낙 많고 레이블이 아직 어떤 컬럼인지 몰라서 일단 기술 통계량을 하나씩 출력해보며 데이터를 탐색하고 있습니다.

(폐기율에 대한 컬럼에 대해 폐기가 될 확률이 아니라 하루 생산량 중에서 폐기가 발생한 확률이 아닌지 확인하기)

Leave a comment