| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- 머신러닝
- 코딩테스트
- 알고리즘
- 자연어처리
- 논문리뷰
- 프로그래머스
- ChatGPT
- transformer
- outer join
- dfs
- Aspect
- ABAE
- 분산
- MySQL
- 연구
- Bert
- SQL
- GPT
- NLP
- leetcode
- 백준
- 파이썬
- paper review
- join
- deepseek
- 가상환경
- LLM
- gpt1
- SQL 첫걸음
- 그래프
- Today
- Total
목록Aspect (3)
huginn muninn
일주일 내내 감기에 시달리는 와중에 실험은 돌림.. 요즘 목감기가 유행인감(;´д`)ゞ 일주일 동안 헤롱헤롱한 상태로 거의 말도 못 하고 살았다.. 그래도 실험은 돌림 train은 10분 정도 걸렸고, aspect 수는 14개. 임베딩은 그냥 word2vec으로 했다. 기존 논문들 참고해보니 word2vec으로 한 게 성능이 가장 좋았다. 그래서 일단은 나도 word2vec으로 임베딩해보고, 성능이 좋지 않으면 다른 방법을 찾아보기로 했다. aspect log Aspect 0: 룸 - 청결도 닿다 호스 녹슬다 시커멓다 천정 덕지덕지 실리콘 수구 모서리 서랍 소변 망가지다 사이사이 뜯다 넘치다 빨갛다 뚜껑 오물 하얗다 방바닥 붉다 수전 문도 찍히다 매트 얇다 화장대다 녹 틈 협탁 놓이다 전등 벗겨지다 자꾸..
내가 사용하는 데이터셋은 아고다에서 크롤링한 호텔리뷰. 호텔이름과 리뷰로 이루어진 데이터인데 문장 단위로 분리하여 약 2만 개였던 리뷰가 약 6만 개가 되었다. test dataset을 만들기 위해 aspect를 미리 선정해놔야한다. aspect 선정을 위해 아고다 말고도 다른 호텔 예약 서비스를 살펴보았다. 여기 어때는 없는 것 같다. 이를 토대로 aspect를 선정한 결과 ⬇️ 룸 : 청결도, 소음, 뷰, 분위기, 룸 안의 물건, 화장실, 감정(ex: 편하다, 무섭다.. 등등) 부대시설 : 조식, 디저트, 수영장, 인피니트풀, 주차장, 찜질방, 사우나, 스파 등 위치 : 위치, 주변 언급 시 서비스 : 직원, 체크인, 체크아웃 등 가성비 : 가성비, 가격 대비 만족도 언급 목적 : 숙박 목적, 가족여..
진짜 일주일 내내 똥 쌌다. 주말에도 연구실가서 코드만 쳐다보고, 스택오버플로우 하루종일 뒤지고 먼지 쌓인 옛날 블로그 글도 읽었다.... 그리고 ChatGPT한테도 엄청 물어봄.. 거의 저 짤 지금 내 상태. 코드 한번 돌릴 때마다 기도 한 번씩 올렸다. 거의 100번은 넘게 기도 올린 것 같은데,, 쨋든 내가 어떻게 에러를 해결했는지 정리해보려고 한다. 고친 코드가 너무너무 많지만... 일단 정리해 보는 걸로.. 내가 사용하려고 하는 코드는 ACL2017에 실린 "An unsupervised neural attention model for aspect extraction" 논문에서 쓰인 코드. 이 분들이 구현하신 코드에서 원하는 환경은 requirements.txt에서 볼 수 있다. keras==1...