일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Machine Learning
- EDA
- matplotlib
- 코로나 사망자
- internship
- 인공지능
- 체스
- pandas
- tictactoe
- React
- seaborn
- python
- 캐글
- minimax
- nltk
- streamlit
- 코로나
- plotly
- 인턴쉽
- 미니맥스
- 스타트업
- 씨본
- Vendor
- Project
- 틱택토
- 시본
- AI Developer
- 파이썬
- resume
- 코로나 확진자
- Today
- Total
대학생 경복궁
유튜브 댓글 분석(feat NLP and streamlit) 본문
들어가며
어느 날 유튜브를 보다가 유튜버들을 위한 서비스가 있으면 참 좋겠다고 생각했다.
유튜브들은 무엇을 기준으로 콘텐츠의 방향을 잡는가? 댓글의 반응을 보고 자신이
영상을 잘 찍었는지 무엇이 부족했는지 콘텐츠에 대한 피드백으로 사용할 수 있을 것이다.
그렇다면 댓글을 감성분석하면 유튜버들이 영상을 구상하고 만드는데 좋은 피드백이 될 수 있지 않을까?라는
생각으로 시작한 프로젝트다.
사용기술
pandas, nltk, plotly, streamlit
내용
이 프로젝트를 처음 시작 할때는 새로 배워야 하는 기술이 많아서 코드의 양에 비해 많은 시간이 걸렸다.
일단 유튜브 댓글을 가져오기 위해 youtube api가 어떻게 돌아가고 어떻게 사용해야 하는지 알아보고
들어보기만 한 감성분석을 알아보고 plotly도 배웠다. 그리고 마지막으로 streamlit을 활용해 사이트를 만들고
배포까지 하였다. 이렇게 많은 것을 체험한 걸 생각하면 사이드 프로젝트를 하는 건 참 가치 있는 것 같다.
예전에는 프로젝트를 하면 처음부터 끝까지 내가 하는걸 보여줘야 한다고 생각했다. 그게 멋진 프로그래머라고
생각했기 때문이다. 그래서 체스 ai를 만들 때도 체스부터 만들었다. 하지만 요즘은 생각이 약간 바뀌었다.
남이 만들걸 잘 쓰는것도 프로그래머의 실력이라는 것을 알게 되었다. 그래서 요번 프로젝트는 그냥 가져다 쓰는
그런 컨셉이다...(사실 변명이고 처음부터 만들 실력이 없었다... ㅎㅎ)
1. 인풋으로 youtube video url을 받고 youtube data api에서 comment 데이터를 받아온다.
2. 그리고 데이터를 nlp알고리즘에 맞게 전처리 한하고 인풋으로 넣어준다.
3. 그럼 결과로 positive, negative, neutral 셋 중 하나가 나온다.
4. 그 카테고리를 가지고 plotly로 시각화 하고 보여준다.
5. 이 과정을 웹으로 구현하기 위해 streamlit을 통해 배포한다.
결과물
처음 시작 페이지를 보면 youtube url과 어떤 감성 카테고리를 볼 것인지 선택할 수 있다.


그리고 검색을 누르면 분석 결과가 나온다.

https://share.streamlit.io/bok-bok/youtube-comment-analyzer
share.streamlit.io
https://github.com/bok-bok/youtube-comment-analyzer
GitHub - bok-bok/youtube-comment-analyzer
Contribute to bok-bok/youtube-comment-analyzer development by creating an account on GitHub.
github.com
느낀 점
이 프로젝트를 하면서 새로운 영역을 시도해 봤다. nltk, plotly, streamlit, youtube api 모두가 처음 사용해보는 도구들 이였다. 예전의 나였다면 아예 처음부터 공부를 하려고 해서 아예 프로젝트를 시작도 하지 못했을 것이다. 하지만 요번에는 내가 목표를 잡고 그 목표만을 위해 필요한 부분만을 공부했다. 그리고 정제된 블로그의 글이나 책이 아닌 해당 library의 docs를 보면서 공부를 하며 내가 한 걸음 더 성장한 프로그래머가 됐다고 느꼈다.
'프로젝트' 카테고리의 다른 글
인공지능 체스 (미니맥스) (0) | 2021.10.26 |
---|