2025‐05‐13 데이터 질문사항 정리, 기획 수정 - devyzz/senior-road-risk-analyzer GitHub Wiki
Todo
강사님에게 가이드라인을 받아봅시다🔷
1. 현재 데이터를 수집한 과정을 설명하고 이런식으로 수집해서 병합하는 게 맞는지 확인할 것
-
2021 ~ 2023 서울특별시 교통사고 데이터
: 기반데이터 -
속도, 차선 수
: 도로명, 월기준으로 평균속도 join속도
: 그 도로의 평균속도.... ㅎ차선 수
: 올림픽대로와 같은 경우 기존 데이터에 6~12로 차선수가 표시되어 있었는데, 해당 사고지점의 정확한 차선수를 파악해서 넣은 게 아니라 중앙값을 넣음...ㅠ
-
교통량
: 사고지점 좌표기준 반경 2km이내 가장 가까운 지점의 연평균 교통량 join -
신호등
: 사고지점 좌표기준 반경 50m 이내 신호등 유무- 사고데이터의 법규 위반 요소가 '신호위반'인 경우, 인근 신호등유무가 다 True로 나와야 맞을 것 같은데 False가 섞여있음.. 왜?
- 이럴 경우 데이터..정제 같은걸 따로 어떤식으로 해야할지...?
-
횡단보도 유무
: 사고시점 좌표기준 반경 10m 이내 신호등 유무- 신호등과 동일
-
인근 보호구역 유무
: 사고지점 좌표기준 반경 300m 이내 보호구역 유무 (TAAS 기준) -
사고다발지역
고령자사고다발지역 유무
: 100m 5건비고령자사고다발지역 유무
: 100m 7건전체 사고다발지 유무
: 50m 5건 ..이렇게 사고다발지 해도 되나욤? ㅎㅎㅎ
2. SHAP 그래프 해석법, 현재 우리가 하고 있는게 맞는지 아니라면 알려주세요.
- 1번 경우
-
종속변수 y : 고령자 사고다발지역여부 (T/F)
-
범위 :
2021 ~ 2023 서울특별시 교통사고 데이터
중 고령운전자 가해사고만 추출 -
해석
- 속도 : 우측(SHAP > 0)에 파란점이 몰림. 고령자사고는 평균속도가 낮은 도로에서 주로 일어남 → 낮은 속도에서 고령운전자 사고가 더 많이 발생한다고 해석해도 되나요..? 왜냐면.. 저건.. 도로의 평균속도니까여...
- 사고 시간대 : 우측에 파란점이 많이보임. 고령자는 사고는 저녁/밤 시간대 보다는 오전/낮 시간대에 집중되있는 걸 알 수 있음...
- 차선 수 : 우측에 붉은점이 많음 → 차선 수가 많을 수록 고령자사고가 많이 일어남, 즉 복잡한 도로일 수록 고령자사고 위험도가 높음
- 도로길이 : 균등분포, 특성이 될 수 없음
- 신호등 : 신호등 인근에서 대부분의 고령자 사고가 발생함 → 선행 연구나 논문 조사시, 고령운전자는 인지능력의 저하로 신호 변환등에 즉각적인 대응을 하지 못해 사고가 많이 난다고 하였음. 이를.. 입증한건가욥 >ㅂ<
- 도로구조 : 우측에 파란점이 몰림 / 1
3 : 교차로, 69 : 단일로 이므로 고령자 사고는 주로 교차로에서 일어난다고 할 수 있음 - 법규 위반 유형 : 우측에 파란점이 몰림 ㅎㅎ / 즉, 교차로운행위반, 보행자보호의무위반, 신호위반등이 고령운전자 특성으로..나오는 거 같은데 위에 조건들과 부합하는 것 같음
- 어린이 보호구역 인근 : 일단 지금 보이기로는 우측에 파란색이 많은 걸로는 보이는데.. 끝자락은 빨강이라 해석이 어려움 선행논문을 봤을 때 고령자 사고는 어린이 보호구역 근처에서 더 많이 일어난다는 연구 결과가 있었는데 결과치가 반대로 나와서 .. 왜일까요?
- 횡단보도 인근 : 붉은 색이 우측에 몰림. 횡단보도가 있는 지역이 고령자 사고다발구역인 것. → 고령운전자는 횡단보도 근처, 즉 보행자 인지가 늦어 사고가 많이난다는 연구가 있는뎀... 그거랑 일치하지 않나? ㅎㅎㅎㅎ
- 도로상태 : 해석불가
-
shap 분석 기법 활용 결과, 고령자의 몇가지 특성을 뽑을 수 있었음.
- 도로 평균 속도가 낮음
- 오전/낮 시간대일수록 사고 다발 구역임
- 교차로이고 신호등이 있고 차선수가 많은 복합한 도로임
- 횡단보도가 있음
(+) dependence plot 해석 어케해요 ? ㅠㅠㅠㅠㅠ
3. 공모전 정책 방향 물어보기 + 디벨롭?방향 물어보기**
(before)
고령자에게 위험한 도로특성을 지표로하여 도로점수화를 하려고 했었음
- 도로점수를 하려면 도로의 특성을 뽑아야함
- ex) 해당 도로의 현재 속도나 통행량을 받아와서 위험한 요소라면 가점을 주려고 하였으나, 지금 갖고 있는 데이터 분석으로는 고령운전자가 그냥 느리게 달리는 게 특성인지, 아니면 빠른 차도에서 느리게 달리다가 뭐 사고가 난건지... 진짜 누구의 특성인지 판별이 불가능해서 도로의 평균속도가 높거나 낮은것에 점수를 부과하는 게 불가능. 교통량도 마찬가지의 이유
정책으로는 복지택시와 자율주행 알고리즘(?) 제안 예정
(after)
- 고령 운전자 사고예방 맞춤 알람 시스템 - 도로위험 요소별 맞춤 경고 알림 (네비게이션에 고령운전자 모드 설정)
- 네비 연동 방식: 네비앱(티맵, 카카오, 현대 오토에버 등)에 고령운전자모드 설정, 해당 모드가 ON일 때만 위험 알람을 송출
고령운전자 모드에서 추가 알람을 줄 요소
근거 : SHAP의 dependence plot 해석시, 0을 기준으로 양수값이 더 높은 척도를 보이는 유형 5가지 추출
- 교차로운행방법위반
- 기타
- 보행자보호 위반
- 신호위반
- 안전거리미확보
이중 이유를 알수 없는 2번과, 도로의 평균속도/운전자 본인의 사고시속도의 동시 비교가 필요한 5번을 제외하고 나머지 3가지 법규위반내용을 도로 특성과 연관지어 해당 도로 특성이 가까워질때 추가 음성 알림 서비스를 제공하기를 기대
- 교차로운행방법위반 → 교차로
- 보행자보호 위반 → 횡단보도
- 신호위반 → 신호등
하지만 모든 교차로나, 모든 횡단보도에 대해 일일이 알람을 줄 수 없으므로, 저 요소 중 특히 고령운전자 사고가 많이나는 요소를 특정지어 보기로함..
- 교차로
- 서울특별시 전체 교차로 좌표데이터를 가져옴.
- 사고데이터와 교차로 데이터의 좌표를 비교하며, 다시 재분석하여 n거리 이상의 교차로 사고율이 높다면 해당 교차로에만 알람 제공
- ex)4거리 이상인 교차로일때만 추가알람제공
- 횡단보도
- 보행자보호의무위반을 위반한경우 알람
- 어떤 횡단보도일 때 알람? → 신호등이 없는데, 횡단보도는 있는경우 추출 -> 신호등이 없는 횡단보도 일 경우 알람
- 보행자 통행량이 많은 횡단보도 일 때 알람 (보행자 통행량을 못 구할 가능성 농후 ㅎㅎㅎ)
- 횡단보도가 없는 교차로라는 게 있나..? 잇찌않음? 없다는데? ㅎ
- 신호등
- 3색등, 4색등 어쩌구 있었는데, 선행논문에서 4색등의 인지가 더 늦다고함. 그래서 ..일단은.. 정 기준이없으면 4색등인 신호등 위주로 알람
- 신호등 신호변환 주기 데이터를 구할 수 있다면,
1,2번 방안에 대해서 1번이 가능하다면 -> 도로점수화수식을 가점을 어떻게주고 중요도를 어떻게 줄지
2번이라면 -> 각 요소에 대해서 고령운전자가 더 위험한요소?를 더분석해야할ㅈㅣ... 어떻게 디벨롭하죠?