반응형

프로젝트 4

웹툰 승격 확률 예측 시스템 프로젝트 - 감정분석2와 단어구름 [광주인공지능학원]

아래는 제가 쓴 코드에서 필요한 임폴트들인데요. 이거 전부를 임폴트할 필요는 없어요. 제가 사용할때는 전부 다 필요했지만 티스토리에는 시행착오 전부를 적을게 아니라 일부만 적을거기 때문에 중간중간에 sklearn빼고 파이썬 내장라이브러리가 아닌것들은 다운받지 않으셔도 됩니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_files # 파일읽어오기 import KnuSentiLexMaster from KnuSentiLexMaster.knusl import KnuSL # 한국어 사전 임폴트 연습 import tensorflow as tf # 텐서플로우 from ten..

프로젝트 2021.07.11

웹툰 승격 확률 예측 시스템 프로젝트 - kosac사전을 이용한 감정분석 [광주인공지능학원]

웹툰 승격 확률 예측 프로젝트에서 댓글을 가지고 긍정 부정 감정분석을 진행했어요. 먼저 kosac 한국어 감정사전을 이용하여 분석해봤고 긍정 부정 분류가 예상처럼 잘되지 않아서 다음으로는 수기로 긍정부정 라벨링을 달아주고 머신러닝을 돌려봤는데 훈련데이터의 수가 너무 적어서 정확도가 낮게 나오더라구요. 그래서 마지막으로 직접 긍정 부정 단어사전을 만들어서 머신러닝을 진행 했습니다. 티스토리에는 1. kosac 사전 사용 2. 수기 라벨링 3. 직접만든 단어사전 시행 착오를 전부 작성할 예정이고 이 글에서는 1. kosac 사전 사용을 적을 거에요. import numpy as np import pandas as pd 댓글 데이터가 10mb가 넘어서 업로드 할수가 없네요 ㅠㅠ 먼저 데이터를 불러옵니다 저는 ..

프로젝트 2021.07.11

웹툰 승격 확률 예측 시스템 프로젝트 - 크롤링2 [스마트인재개발원]

이번에는 웹툰 제목, 회차별 등록일, 회차별 조회수 ,회차별 별점, 댓글, 댓글 좋아요수, 댓글싫어요수를 크롤링 할거다. 크롤링할때 먼저 정식웹툰만 쭉 크롤링하고, 랜덤함수로 웹툰 몇페이지만 뽑아서 비정식웹툰을 크롤링 할거다. 가져올 데이터 정식웹툰 크롤링 웹툰 제목, 회차별 등록일, 회차별 조회수 ,회차별 별점, 댓글, 댓글 좋아요수, 댓글싫어요수 from selenium import webdriver as wb from selenium.webdriver.common.keys import Keys from bs4 import BeautifulSoup as bs import pandas as pd import time 먼저 위의 라이브러리를 임폴트 해주세요 driver = wb.Chrome() title..

프로젝트 2021.07.04

웹툰 승격 확률 예측 시스템 프로젝트 - 크롤링1 [스마트인재개발원]

프로젝트 소개 웹툰 승격 확률 예측 시스템 프로젝트를 하고 있습니다. 네이버 베도 작품들중 정식웹툰으로 승격된 작품과 승격이 되지 않은 작품들을 비교하여 아직 정식이 되지못한 베도 작품들이 승격될 확률이 얼마나 있는지를 예측해주는 웹사이트를 만들겁니다. 일단 데이터를 수집은 크롤링으로 하고 예측은 머신러닝으로 웹사이트 제작은 자바로 할예정입니다. 역할 분담은 DB, 크롤링, 데이터분석, 머신러닝, 웹디자인, 웹기능구축으로 나뉘는데 저는 크롤링, 데이터분석, 머신러닝 파트를 맡아서 티스토리에는 이 3파트를 정리할 예정입니다. 먼저 데이터를 수집에서 가져올 데이터는 웹툰 제목, 장르, 종합 별점, 종합 좋아요수, 정식연재 유무를 판단하기 위해 정식연재 확정된 작품의 제목, 회차별 조회수, 회차별 제목, 회차..

프로젝트 2021.07.04
반응형