Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
Tags
- 그래프
- ABAE
- leetcode
- NLP
- Bert
- transformer
- dfs
- GPT
- 분산
- 가상환경
- 코딩테스트
- 자연어처리
- MySQL
- 연구
- 머신러닝
- ChatGPT
- gpt1
- Aspect
- LLM
- 논문리뷰
- outer join
- SQL 첫걸음
- 알고리즘
- 프로그래머스
- 백준
- paper review
- 파이썬
- deepseek
- SQL
- join
Archives
- Today
- Total
huginn muninn
[ABAE] Aspect 선정 본문
내가 사용하는 데이터셋은 아고다에서 크롤링한 호텔리뷰.
호텔이름과 리뷰로 이루어진 데이터인데 문장 단위로 분리하여 약 2만 개였던 리뷰가 약 6만 개가 되었다.
test dataset을 만들기 위해 aspect를 미리 선정해놔야한다. aspect 선정을 위해 아고다 말고도 다른 호텔 예약 서비스를 살펴보았다.


여기 어때는 없는 것 같다.
이를 토대로 aspect를 선정한 결과 ⬇️
- 룸 : 청결도, 소음, 뷰, 분위기, 룸 안의 물건, 화장실, 감정(ex: 편하다, 무섭다.. 등등)
- 부대시설 : 조식, 디저트, 수영장, 인피니트풀, 주차장, 찜질방, 사우나, 스파 등
- 위치 : 위치, 주변 언급 시
- 서비스 : 직원, 체크인, 체크아웃 등
- 가성비 : 가성비, 가격 대비 만족도 언급
- 목적 : 숙박 목적, 가족여행, 데이트, 어린이날, 비즈니스, 출장 등
- 기타 : 그 외의 것.
이렇게 7가지로 선정하였다.
논문에서도 맥주와 레스토랑에 대한 각각의 aspect를 정해놓고 정확도를 판단할 때는 하나의 aspect만 가진 리뷰만 testset으로 사용하였다. 모든 aspect에 대한 정확도를 판단해야 하는 것이 아닌가?라는 의문이 들었는데 정확도가 좋지 않아서 3개만 사용했거나, 3개를 제외한 다른 aspect에 해당하는 리뷰가 적었기 때문에 정확도가 높지 않았을 것이라고 추측했다..
나도 test 해보고나서 모든 aspect를 정확도 판단에 사용할지 판단해야겠다.
'자연어 처리 > ABAE' 카테고리의 다른 글
| [ABAE] 1차 실험 결과 및 교수님 Feedback (2) | 2023.03.26 |
|---|---|
| [ABAE] 데이터 전처리 - 단어 수정 (3) | 2023.03.26 |
| [ABAE] 삽질 끝에 에러 해결하기..(final) (0) | 2023.03.09 |
| [ABAE] Conda 가상 환경 만들기 (0) | 2023.03.05 |
| [ABAE] train.py 에러 해결하기(ing 상태), 데이터 전처리 - 1 (0) | 2023.02.27 |