Skip to content

Latest commit

 

History

History
202 lines (168 loc) · 11.7 KB

README.md

File metadata and controls

202 lines (168 loc) · 11.7 KB

🏭 자동차 생산 공정 데이터 분석을 통한 생산성 개선 방안 도출

구분 설명
프로젝트 명 자동차 생산 공정 데이터 분석을 통한 생산성 개선 방안 도출
제안 배경 공정 데이터 분석 기반 생산성 개선 방안을 찾기 위해 제안되었습니다.
기간 2023.11 ~ 2023.12
주최 전공 프로젝트
요약 target이 주어지지 않은 bottom-up 형식의 과제입니다.
다양한 변수간의 관계, 특징 등을 시각화해서 발견하고 가설을 수립했습니다.
수립한 가설은 통계적 검정을 통해 검정했고 최종 방안을 제안했습니다.
역할 리더/ 프로젝트 일정 수립/ EDA/ 가설검정

1. EDA, 가설수립

생산수량 변수에 대한 시각화 2개, 불량률 1개, 시간가동률 1개를 확인했습니다.

1) 생산수량

[ 생산수량-1 : 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. ] image image
👉 아반떼 모델의 생산수량이 넓게 퍼져있는 것을 확인할 수 있다.

[ 생산수량-2 : LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. ] image image
👉 LINE_A에서 22년 4월 29일~22년 8월 1일 사이 평균 생산수량이 다른 날에 비해 높은 것을 확인할 수 있다.




2) 불량률

[ 불량률-1 : 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. ] image image
👉 근속년수가 낮거나, 높을수록 불량률이 높은 것을 확인할 수 있다.


3) 시간가동률

[ 시간가동률-1 : LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. ] image
👉 생산수량이 375개 아래로 떨어지면 시간가동률이 현저히 낮아지는 것을 확인할 수 있다. (시간가동률 = 가동시간 / 부하시간)

가설 🔻

가설 번호 가설 설명 도표
생산수량-1 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. EDA - 생산수량, 모델
생산수량-2 LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. EDA - 생산수량, 4월 29일 ~ 8월 1일, 설비(LINE_A)
불량률-1 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. EDA - 불량률, 근속년수
시간가동률-1 LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. EDA - 시간가동률, 설비(LINE_C)



2. 가설 검정

[ 생산수량-1 : 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. ]

  1. levene의 등분산검정 : 모델 2개씩 비교
    $H_0$ : $s_{생산수량, 아반떼}^2 = s_{생산수량, model}^2$ for some $models$
    $H_1$ : $s_{생산수량, 아반떼}^2 > s_{생산수량, model}^2$ for some $models$

    모델명 p-value 결과
    아반떼 / 니로 0.05424536 귀무가설 채택 아반떼의 생산수량 분산이 니로의 분산과 유의미한 차이가 없다.
    아반떼 / 소나타 3.786e-06 대립가설 채택 아반떼의 생산수량 분산이 소나타의 분산보다 크다.
    아반떼 / 아이오닉 0.0 대립가설 채택 아반떼의 생산수량 분산이 아이오닉의 분산보다 크다.
    아반떼 / 투싼 0.0 대립가설 채택 아반떼의 생산수량 분산이 투싼의 분산보다 크다.
    아반떼 / 플러그인 투싼 0.0 대립가설 채택 아반떼의 생산수량 분산이 플러그인투싼의 분산보다 크다.

  1. levene의 등분산검정 : 모든 모델 비교
    $H_0$ : $s_{생산수량, 아반떼}^2 = s_{생산수량, model}^2$ for some $models$
    $H_1$ : $s_{생산수량, 아반떼}^2 \neq s_{생산수량, model}^2$ for some $models$

기각역 : 0.05
W-statistic: 58.7177 P-value: 0.0000

결론 : 대립가설 일부 채택

  • 아반떼의 생산수량 분산이 니로를 제외한 다른 모델들의 분산보다 크다.
  • 전체를 한 번에 검정했을 때는 모델별 분산에 차이가 있다는 결과


[ 생산수량-2 : LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. ]
독립표본 t 검정 (단측)

$H_0$ : $\mu_{생산수량, 22.04.29 ~ 22.08.01} = \mu_{생산수량, 그\ 외\ 일자}$
$H_1$ : $\mu_{생산수량, 22.04.29 ~ 22.08.01} > \mu_{생산수량, 그\ 외\ 일자}$

<< 22/04/29~22/08/01 / 다른 날 >> 기각역 : 0.05 P-value: 0.0

결론 : 대립가설 채택 22/04/29~22/08/01때 LINE_A에서의 생산수량 평균이 다른 날의 평균보다 크다.

[ 불량률-1 : 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. ]
독립표본 t 검정 : 2개의 구간화된 근속년수를 비교

  1. 근속년수 : 00-04년
    $H_0 : \mu_{불량률, 00-04년} = \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(25년 이상 제외)
    $H_1$ : $\mu_{불량률, 00-04년} &gt; \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(25년 이상 제외)

    근속년수 p-value 결과
    00-04년 / 05-09년 0.0 대립가설 채택 00-04년의 불량률 평균이 05-09년의 평균보다 크다
    00-04년 / 10-14년 0.0 대립가설 채택 00-04년의 불량률 평균이 10-14년의 평균보다 크다
    00-04년 / 15-19년 0.0 대립가설 채택 00-04년의 불량률 평균이 15-19년의 평균보다 크다
    00-04년 / 20-24년 0.0 대립가설 채택 00-04년의 불량률 평균이 20-24년의 평균보다 크다

  2. 근속년수 : 25년 이상
    $H_0$ : $\mu_{불량률, 25년 이상} = \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(00-04년 제외)
    $H_1$ : $\mu_{불량률, 25년 이상} &gt; \mu_{불량률, bined_\ 근속년수}$ for some 근속년수(00-04년 제외)

    근속년수 p-value 결과
    25 년 이상 / 05-09년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 05-09년의 평균보다 크다.
    25 년 이상 / 10-14년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 10-14년의 평균보다 크다.
    25 년 이상 / 15-19년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 15-19년의 평균보다 크다.
    25 년 이상 / 20-24년 0.0 대립가설 채택 25 년 이상의 불량률 평균이 20-24년의 평균보다 크다.

  3. ANOVA : 모든 구간화된 근속년수를 비교 $H_0$ : $\mu_{불량률, 근속년수} = \mu_{불량률, 근속년수}$ for some $구간화\ 된\ 근속년수$
    $H_1$ : $\mu_{불량률, 근속년수} \neq \mu_{불량률, 근속년수}$ for some $구간화\ 된\ 근속년수$

    기각역 : 0.05 F-statistic: 1385.8033 P-value: 0.0000

결론 : 대립가설 채택 평균적으로 00-04년과 25년 이상 근무한 근무자들의 평균 불량률은 다른 년수보다 높다.

[ 시간가동률-1 : LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. ]
독립표본 t 검정(단측)
$H_0 : \mu_{시간가동률, 생산수량\ 375개\ 이상} = \mu_{시간가동률, 생산수량 \ 375개\ 이하}$
$H_1$ : $\mu_{시간가동률, 생산수량\ 375개\ 미만} &gt; \mu_{시간가동률, 생산수량 \ 375개\ 이하}$

<< 375 이상 / 375 미만 >> 기각역 : 0.05 P-value: 0.0
결론 : 대립가설 채택

  • 생산수량이 375 이상일 때 LINE_C 에서의 시간가동률 평균이 375 미만의 평균보다 크다.
  • 생산수량이 375 미만이면 시간가동률이 0.5미만이 됨 = 조업시간 중 설비가 실제 움직인 시간 관점에서 매우 비효율 적임(정지시간이 많음)


가설 번호 가설 검정방법 결과
생산수량-1 아반떼의 생산수량의 분산이 타 모델들에 비해 높을 것이다. 르빈의 등분산 검정 참(아반떼 / 니로 = 기각)
생산수량-2 LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다. 독립표본 t 검정(단측)
불량률-1 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다. 독립표본 t 검정(단측), 분산분석(ANOVA)
시간가동률-1 LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다. 독립표본 t 검정(단측)


3. 활용방안

1) 생산수량

  1. 생산수량 1 : 아반떼의 생산수량의 분산이 타 모델들에 높을 것이다.
    👉 아반떼의 생산계획 최적화를 통해 적절한(분산이 적게) 생산계획을 수립한다.
    👉 기존 생산계획(분산이 큰)에 맞게 작업자를 유동적으로 배치한다.


  1. 생산수량 2 : LINE_A에서 22년 4월 29일~22년 8월 1일 사이에 평균 생산수량이 다른 날에 비해 높을 것이다.
    👉 생산수량을 적절하게 예측해서 생산의 불균형을 최소화 한다.
    👉 해당 기간에는 작업자의 피로를 분산시키기 위해 더 많은 인력을 투입하거나 복리후생에 신경쓴다.



2) 불량률

  1. 불량률 1 : 근속년수가 00-04년, 25년 이상인 경우 평균 불량률이 다른 년수에 비해 높을 것이다.
    👉 근속년수가 00-04년인 작업자들을 위한 불량 예방을 위한 교육을 기획한다.
    👉 근속년수가 25년 이상인 작업자들은 노하우나 기술을 교육하는 교육의 업무를 맡도록 인력을 재배치한다.



3) 시간가동률

  1. 시간가동률 1 : LINE_C에서 생산수량이 375개 이상일때 시간가동률이 높을 것이다.
    👉 생산수량이 375개 미만이 되면 어떤 정지시간이 발생하는지 파악로스타임을 줄여서 탄력적으로 생산을 수행하도록 한다.