Skip to content

sh00-git/Project2-Predict-negative-emotions

Folders and files

NameName
Last commit message
Last commit date

Latest commit

ย 

History

5 Commits
ย 
ย 
ย 
ย 

Repository files navigation

๋ถ€์ •์ ์ธ ๊ฐ์ •(์šฐ์šธ์ฆ ๋ถˆ์•ˆ ์ŠคํŠธ๋ ˆ์Šค) ์ฒ™๋„ ์˜ˆ์ธก

  • ๊ฐœ๋ฐœ๊ธฐ๊ฐ„
    • 2022.07.22 ~ 2022.07.27
  • ์‚ฌ์šฉ ์–ธ์–ด ๋ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ
    • python, pandas, sklearn, matplot, seaborn

๐Ÿ’ก Topic

  • DASS ์„ค๋ฌธ์กฐ์‚ฌ ๊ฒฐ๊ณผ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์„ธ ๊ฐ€์ง€์˜ ๋ถ€์ •์ ์ธ ๊ฐ์ • ์ฒ™๋„๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ์‹œ์Šคํ…œ
  • AI ๋ถ€ํŠธ์บ ํ”„ Section2 Project

โ“ ๋ฌธ์ œ์ •์˜

ํ˜„๋Œ€ ์‚ฌํšŒ์— ์šฐ์šธ์ฆ, ๋ถˆ์•ˆ, ์ŠคํŠธ๋ ˆ์Šค์™€ ๊ฐ™์€ ๋ถ€์ •์ ์ธ ๊ฐ์ •์„ ๊ฐ€์ง€๊ณ  ์‚ด์•„๊ฐ€๋Š” ์‚ฌ๋žŒ๋“ค์ด ๋งŽ๋‹ค. 2020๋…„ ์ƒ๋ฐ˜๊ธฐ 20๋Œ€ ์—ฌ์„ฑ ์šฐ์šธ์ฆ ํ™˜์ž๊ฐ€ 39.5% ์ฆ๊ฐ€ํ•˜์˜€๊ณ , 20๋Œ€ ๋ถˆ์•ˆ ์žฅ์•  ํ™˜์ž๋Š” 86%, ์ŠคํŠธ๋ ˆ์Šค ์žฅ์•  ํ™˜์ž๋Š” 5๋…„ ๊ฐ„ 45.4% ์ฆ๊ฐ€ํ•˜์˜€๋‹ค.

๋ถ€์ •์ ์ธ ๊ฐ์ •์œผ๋กœ ์ธํ•ด ๋”์šฑ ๋ฌด๊ธฐ๋ ฅํ•ด์ง€๊ณ  ํž˜๋“ค์–ด ์ง€๊ฒŒ ๋˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๊ณ ์ž ์ž์‹ ์˜ ๊ฐ์ • ์ƒํƒœ๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ์Šคํ…œ์ด ํ•„์š”ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค.

๐Ÿ” ํ”„๋กœ์ ํŠธ ์ง„ํ–‰๊ณผ์ •

  1. ํ”„๋กœ์ ํŠธ ๊ธฐํš ๋ฐ ๋ฌธ์ œ ์ •์˜
  2. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘
  3. ๋ฐ์ดํ„ฐ ํƒ์ƒ‰ ๋ฐ ์ „์ฒ˜๋ฆฌ
  4. ๋ชจ๋ธ๋ง

๐Ÿ“š ๋ฐ์ดํ„ฐ ์…‹

Depression Anxiety Stress Scales Responses

  • ์šฐ์šธ, ๋ถˆ์•ˆ, ๊ธด์žฅ ๋˜๋Š” ์ŠคํŠธ๋ ˆ์Šค์™€ ๊ด€๋ จ๋œ ๋ถ€์ •์ ์ธ ๊ฐ์ • ์ƒํƒœ๋ฅผ ์ธก์ •ํ•˜๋„๋ก ์„ค๊ณ„๋œ DASS ์„ค๋ฌธ์กฐ์‚ฌ ๊ฒฐ๊ณผ ๋ฐ์ดํ„ฐ
  • DASS์˜ 42๊ฐ€์ง€ ์„ค๋ฌธ, 10๊ฐœ ํ•ญ๋ชฉ์˜ ์„ฑ๊ฒฉ ๋ชฉ๋ก, ์ •์˜๋ฅผ ์•Œ๊ณ  ์žˆ๋‹ค๊ณ  ํ™•์‹ ํ•˜๋Š” ๋‹จ์–ด๋ฅผ ์„ ํƒํ•˜๋Š” ๋ชฉ๋ก, ๊ธฐํƒ€ ๊ฐœ์ธ ์ •๋ณด ๋“ฑ์„ ๋‹ด๊ณ  ์žˆ๋Š” 172๊ฐœ์˜ columns์™€ 39775๊ฐœ์˜ row๋กœ ๊ตฌ์„ฑ๋œ csv ํŒŒ์ผ ๋ฐ์ดํ„ฐ

โœ๐Ÿป ํ”„๋กœ์ ํŠธ ์ˆ˜ํ–‰ ๊ณผ์ • ๋ฐ ๊ฒฐ๊ณผ

  1. Data Description

    • ๋ฐ์ดํ„ฐ์˜ ๊ฐ ํ•ญ๋ชฉ๊ณผ ์ฒ™๋„๊ฐ€ ์˜๋ฏธํ•˜๋Š” ๋ฐ”๋ฅผ ํŒŒ์•…
  2. ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ

    • Data Descripation ๊ณผ์ •์„ ํ†ตํ•ด ํ•„์š”์—†๋‹ค๊ณ  ํŒ๋‹จ๋˜๋Š” ์ปฌ๋Ÿผ์„ ์ œ๊ฑฐ.
    • ๋ชจ๋“  ์ปฌ๋Ÿผ์˜ ๋ฐ์ดํ„ฐํ˜•, ๊ฒฐ์ธก๊ฐ’์„ ํ™•์ธํ•œ ํ›„ ์ปฌ๋Ÿผ ์ด๋ฆ„์„ ์•Œ๊ธฐ ์‰ฝ๊ฒŒ ๋ณ€๊ฒฝ.
    • 42๊ฐ€์ง€์˜ ์„ค๋ฌธ ์ค‘ ์šฐ์šธ, ๋ถˆ์•ˆ, ์ŠคํŠธ๋ ˆ์Šค์— ํ•ด๋‹นํ•˜๋Š” ๋ฌธํ•ญ ๋ฒˆํ˜ธ๋ฅผ dictionary๋กœ ๋งŒ๋“ค์–ด์ฃผ์–ด ์šฐ์šธ, ๋ถˆ์•ˆ, ์ŠคํŠธ๋ ˆ์Šค ๋ฌธํ•ญ์— ๋”ฐ๋ฅธ ์ ์ˆ˜์˜ ํ•ฉ๊ณ„๋ฅผ ์ถ”์ถœ.
    • ์šฐ์šธ, ๋ถˆ์•ˆ, ์ŠคํŠธ๋ ˆ์Šค๋ฅผ Scoreing Guide์— ๋”ฐ๋ผ Normal, Mild, Moderate, Severe, Extremely Severe ์ด 5๊ฐœ์˜ ์ง€ํ‘œ๋กœ ์นดํ…Œ๊ณ ๋ฆฌ ํ•จ.
  3. EDA

    • ์‹œ๊ฐํ™”๋ฅผ ์ง„ํ–‰ํ•˜์—ฌ ๋ฐ์ดํ„ฐ Feature์˜ ๋ถ„ํฌ๋ฅผ ํŒŒ์•…
    • ๋ถ„ํฌ๋ฅผ ๋ณด๋ฉฐ ์ด์ƒ์น˜์˜ ๊ฐ’์„ ๊ฐ€์ง„ Feature๋Š” ๊ธฐ์ค€์„ ๊ฐ€์ง€๊ณ  ์ด์ƒ์น˜๋ฅผ ์ œ๊ฑฐํ•จ.
  4. ๊ฐ€์„ค ๊ฒ€์ฆ

    • ๋ฌธ์ œ๋ฅผ ์ •์˜ํ•˜๋ฉฐ ์„ค์ •ํ•œ 2๊ฐ€์ง€์˜ ๊ฐ€์„ค์„ ๊ฒ€์ฆ

    • ๊ฐ€์„ค 1 : ์—ฐ๋ น๋ณ„ ๋ถ€์ •์ ์ธ ๊ฐ์ •์ด ๋‚˜ํƒ€๋‚˜๋Š” ๋นˆ๋„์— ์ฐจ์ด๊ฐ€ ์žˆ์„ ๊ฒƒ์ด๋‹ค.

      • ์šฐ์šธ์ฆ ์ฒ™๋„๊ฐ€ โ€˜Extremely serveโ€™์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๊ฐ€ โ€˜Moderateโ€™์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๋ณด๋‹ค ํฐ์ง€๋ฅผ ๊ท€๋ฌด๊ฐ€์„ค๊ณผ ๋Œ€๋ฆฝ๊ฐ€์„ค์„ ์„ธ์›Œ ํŒ๋‹จํ•˜๊ณ ์ž ํ•จ.

      ๊ท€๋ฌด๊ฐ€์„ค : ์šฐ์šธ์ฆ ์ฒ™๋„๊ฐ€ โ€˜Extremely serve'์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๋Š” 'Moderate'์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๋ณด๋‹ค ์ž‘๊ฑฐ๋‚˜ ๊ฐ™๋‹ค.
      ๋Œ€๋ฆฝ๊ฐ€์„ค : ์šฐ์šธ์ฆ ์ฒ™๋„๊ฐ€ โ€˜Extremely serve'์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๋Š” 'Moderate'์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๋ณด๋‹ค ํฌ๋‹ค.

      ์™ผ์ชฝ์˜ ํŒŒ๋ž€์ƒ‰ ๋ถ„ํฌ๋Š” ์šฐ์šธ์ฆ ์ฒ™๋„๊ฐ€ โ€˜Extremely Serveโ€™์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด ํ‘œ๋ณธ ๋ถ„ํฌ์ด๊ณ , ์˜ค๋ฅธ์ชฝ์˜ ์ฃผํ™ฉ์ƒ‰ ๋ถ„ํฌ๋Š” ์šฐ์šธ์ฆ ์ฒ™๋„๊ฐ€ โ€˜Moderateโ€™์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด ํ‘œ๋ณธ ๋ถ„ํฌ์ž„. ์šฐ์šธ์ฆ ์ฒ™๋„๊ฐ€ โ€˜Extremely Serveโ€™์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๋Š” ์ฒ™๋„๊ฐ€ โ€˜Moderateโ€™์ธ ์‚ฌ๋žŒ๋“ค์˜ ํ‰๊ท  ๋‚˜์ด๋ณด๋‹ค ์ž‘๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ๊ท€๋ฌด ๊ฐ€์„ค์„ ์ฑ„ํƒํ•จ.

    • ๊ฐ€์„ค 2 : ์šฐ์šธ์ฆ, ๋ถˆ์•ˆ, ์ŠคํŠธ๋ ˆ์Šค์™€ ๊ฐ™์€ ๊ฐ์ •๋“ค์€ ๊ฐ™์ด ์˜ฌ ๊ฒƒ์ด๋‹ค.

      • ๋ฐ์ดํ„ฐ๋“ค์˜ ๋น„์œจ์„ ํ†ตํ•ด ํŒ๋‹จํ•˜๊ณ ์ž ํ•จ.

      ์šฐ์šธ์ฆ๊ณผ ๋ถˆ์•ˆ, ๋ถˆ์•ˆ๊ณผ ์ŠคํŠธ๋ ˆ์Šค, ์šฐ์šธ์ฆ๊ณผ ์ŠคํŠธ๋ ˆ์Šค๊ฐ€ โ€˜Extremely Serveโ€™ํ•œ ๊ฒฝ์šฐ์˜ ๋ฐ์ดํ„ฐ ์ˆ˜๋Š” ์ „์ฒด ๋ฐ์ดํ„ฐ ์ˆ˜์˜ 0.5~0.6%์˜ ๋น„์œจ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Œ. ์šฐ์šธ์ฆ๊ณผ ๋ถˆ์•ˆ์˜ ๊ฐ์ •์€ ๊ฐ™์ด ์˜ฌ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๊ณ , ์šฐ์šธ์ฆ๊ณผ ์ŠคํŠธ๋ ˆ์Šค๋Š” ๊ฒฝ์šฐ์— ๋”ฐ๋ผ ๋‹ค๋ฅด์ง€๋งŒ ์ ˆ๋ฐ˜ ์ด์ƒ์˜ ๋ฐ์ดํ„ฐ์—์„œ ๊ฐ™์ด ์˜ค๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์•„ ์„ธ ๊ฐ์ •์€ ๊ฐ™์ด ์˜ฌ ๊ฒƒ์ด๋ผ ํŒ๋‹จํ•จ.

  5. Target Feature ์„ค์ •

    • ๊ฐ€์„ค ๊ฒ€์ฆ์„ ํ†ตํ•ด ์„ธ ๊ฐ€์ง€ ๊ฐ์ •์ด ๊ฐ™์ด ์˜ฌ ๊ฒƒ์œผ๋กœ ํŒ๋‹จํ•˜์˜€์œผ๋ฏ€๋กœ ์šฐ์šธ, ๋ถˆ์•ˆ, ์ŠคํŠธ๋ ˆ์Šค ์ ์ˆ˜์˜ ํ•ฉ๊ณ„์ธ โ€˜total_countโ€™ ์ปฌ๋Ÿผ์„ ์ƒ์„ฑ.
    • total_count ์ปฌ๋Ÿผ์˜ 4๋ถ„์œ„ ์ˆ˜๋ฅผ ๊ธฐ์ค€์œผ๋กœ 5๊ฐœ์˜ ๋ฒ”์ฃผ๋กœ ์นดํ…Œ๊ณ ๋ฆฌํ™”ํ•˜์—ฌ target feature๋ฅผ ์„ค์ •ํ•จ.
  6. ๋ชจ๋ธ๋ง

    • ํƒ€๊ฒŸ์˜ ๊ฐ’ ์ค‘ ์ตœ๋นˆ๊ฐ’์„ ๊ธฐ์ค€๋ชจ๋ธ๋กœ ์„ค์ •ํ•จ.

    • ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ์™€ XGBoost์˜ ๊ฐœ๋…๊ณผ ์ฐจ์ด์ ์„ ์‚ดํŽด๋ณธ ํ›„ ๋‘ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋น„๊ต

    • ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•œ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์…‹ ์ •ํ™•๋„ 0.750393, XGBoost๋ฅผ ์‚ฌ์šฉํ•œ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์…‹ ์ •ํ™•๋„ 0.822271

    • XGBoost ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ ์…‹ ํ‰๊ฐ€์ง€ํ‘œ

    • XGBoost ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ ์…‹ Confusion Matrix

    • XGBoost๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Test Set Accuracy : 0.820457

    • ํŠน์„ฑ ์ค‘์š”๋„๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์ด ์ค‘์š”ํ•˜๊ฒŒ ๋ณธ ํŠน์„ฑ์„ ํŒŒ์•…ํ•จ

โœจ Learned

  • ๋ฌธ์ œ์— ๋Œ€ํ•ด ๊ฐ€์„ค์„ ์„ธ์šฐ๊ณ  ๊ฒ€์ฆํ•˜๋ฉด์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ตํžˆ๊ฒŒ ๋˜์—ˆ์Œ.
  • ๋ชจ๋ธ์˜ ์ตœ์†Œํ•œ์˜ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ธฐ์ค€์ธ baseline์„ ์„ธ์šฐ๋Š” ๊ฒƒ์˜ ์ค‘์š”์„ฑ์„ ์•Œ๊ฒŒ ๋˜์—ˆ์Œ.
  • ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ์™€ XGBoost ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด๋ณด๋ฉด์„œ ๋‘ ๋ชจ๋ธ์˜ ๊ฐœ๋…์„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์—ˆ์Œ.
  • ๋ชจ๋ธ์˜ ํŠน์„ฑ์ค‘์š”๋„๋ฅผ ์‚ดํŽด๋ณด๋ฉฐ ๋ชจ๋ธ์„ ํ•ด์„ํ•˜๋Š” ๊ณผ์ •์„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์—ˆ์Œ.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors