huginn muninn

[ABAE] Aspect 선정 본문

자연어 처리/ABAE

[ABAE] Aspect 선정

_maddy 2023. 3. 26. 19:18

내가 사용하는 데이터셋은 아고다에서 크롤링한 호텔리뷰.

 

호텔이름과 리뷰로 이루어진 데이터인데 문장 단위로 분리하여 약 2만 개였던 리뷰가 약 6만 개가 되었다. 

test dataset을 만들기 위해 aspect를 미리 선정해놔야한다. aspect 선정을 위해 아고다 말고도 다른 호텔 예약 서비스를 살펴보았다. 

아고다 aspect
야놀자 aspect

여기 어때는 없는 것 같다. 

 

이를 토대로 aspect를 선정한 결과 ⬇️

 

  • : 청결도, 소음, 뷰, 분위기, 룸 안의 물건, 화장실, 감정(ex: 편하다, 무섭다.. 등등)
  • 부대시설 : 조식, 디저트, 수영장, 인피니트풀, 주차장, 찜질방, 사우나, 스파 등
  • 위치 : 위치, 주변 언급 시
  • 서비스 : 직원, 체크인, 체크아웃 등
  • 가성비  : 가성비, 가격 대비 만족도 언급 
  • 목적 : 숙박 목적, 가족여행, 데이트, 어린이날, 비즈니스, 출장 등
  • 기타 : 그 외의 것. 

이렇게 7가지로 선정하였다. 

 

논문에서도 맥주와 레스토랑에 대한 각각의 aspect를 정해놓고 정확도를 판단할 때는 하나의 aspect만 가진 리뷰만 testset으로 사용하였다.  모든 aspect에 대한 정확도를 판단해야 하는 것이 아닌가?라는 의문이 들었는데 정확도가 좋지 않아서 3개만 사용했거나,  3개를 제외한 다른 aspect에 해당하는 리뷰가 적었기 때문에 정확도가 높지 않았을 것이라고 추측했다.. 

 

나도 test 해보고나서 모든 aspect를 정확도 판단에 사용할지 판단해야겠다.