{ "cells": [ { "cell_type": "code", "execution_count": 612, "id": "0c24055a-254f-490c-86d6-5550de080558", "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import numpy as np\n", "from konlpy.tag import Okt\n", "from tensorflow.keras.preprocessing.text import Tokenizer\n", "from tensorflow.keras.preprocessing.sequence import pad_sequences\n", "from keras.utils.np_utils import to_categorical\n", "from keras.models import Sequential\n", "from keras.layers import Embedding, Bidirectional, LSTM, Dense\n", "from keras.callbacks import EarlyStopping, ModelCheckpoint\n", "from sklearn.metrics import f1_score\n", "from sklearn.preprocessing import LabelEncoder\n", "import pandas as pd\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "from sklearn.model_selection import train_test_split\n", "import re\n", "import urllib.request\n", "from konlpy.tag import Komoran\n", "from tqdm import tqdm\n", "from tensorflow.keras.preprocessing.text import Tokenizer\n", "from tensorflow.keras.preprocessing.sequence import pad_sequences\n", "from tensorflow.keras.models import load_model\n", "from sklearn.utils.class_weight import compute_class_weight" ] }, { "cell_type": "code", "execution_count": 613, "id": "1db4b670-2790-4643-ba4c-a4a39630a176", "metadata": {}, "outputs": [], "source": [ "train_data = pd.read_csv(\"test.csv\",encoding='CP949')" ] }, { "cell_type": "code", "execution_count": 614, "id": "cc02a8ea-09e4-422f-86d0-4b0654d55f04", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | KEYWORD_CD | \n", "CONTENT | \n", "LABEL | \n", "DATE | \n", "
---|---|---|---|---|
0 | \n", "필링기 | \n", "제품은 이도 저도 아닌 딱 보통 | \n", "0 | \n", "2022.03.03 | \n", "
1 | \n", "필링기 | \n", "이도저도 아닌 딱 보통 | \n", "0 | \n", "2022.03.03 | \n", "
2 | \n", "필링기 | \n", "그냥 씁니다. | \n", "0 | \n", "2022.03.03 | \n", "
3 | \n", "필링기 | \n", "그냥 사용합시다 | \n", "0 | \n", "2022.03.03 | \n", "
4 | \n", "필링기 | \n", "보통이에요 | \n", "0 | \n", "2022.03.03 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
100 | \n", "필링기 | \n", "쓰레기 제품입니다. | \n", "-1 | \n", "2022.03.05 | \n", "
101 | \n", "필링기 | \n", "좋아요좋아요 | \n", "1 | \n", "2022.03.05 | \n", "
102 | \n", "필링기 | \n", "별롱비니다 | \n", "-1 | \n", "2022.03.05 | \n", "
103 | \n", "필링기 | \n", "쓰레기 제품 | \n", "-1 | \n", "2022.03.05 | \n", "
104 | \n", "필링기 | \n", "이제품은 쓰레기 | \n", "-1 | \n", "2022.03.05 | \n", "
105 rows × 4 columns
\n", "\n", " | KEYWORD_CD | \n", "CONTENT | \n", "LABEL | \n", "DATE | \n", "
---|---|---|---|---|
0 | \n", "필링기 | \n", "제품은 이도 저도 아닌 딱 보통 | \n", "0 | \n", "2022.03.03 | \n", "
1 | \n", "필링기 | \n", "이도저도 아닌 딱 보통 | \n", "0 | \n", "2022.03.03 | \n", "
2 | \n", "필링기 | \n", "그냥 씁니다. | \n", "0 | \n", "2022.03.03 | \n", "
3 | \n", "필링기 | \n", "그냥 사용합시다 | \n", "0 | \n", "2022.03.03 | \n", "
4 | \n", "필링기 | \n", "보통이에요 | \n", "0 | \n", "2022.03.03 | \n", "
5 | \n", "필링기 | \n", "긍정입니다 | \n", "1 | \n", "2022.03.03 | \n", "
6 | \n", "필링기 | \n", "절대 안사용함 | \n", "-1 | \n", "2022.03.03 | \n", "
7 | \n", "필링기 | \n", "좋아요 | \n", "1 | \n", "2022.03.03 | \n", "
8 | \n", "필링기 | \n", "제품 좋아요 | \n", "1 | \n", "2022.03.03 | \n", "
9 | \n", "필링기 | \n", "긍정 긍정 긍정 합니다 | \n", "1 | \n", "2022.03.03 | \n", "
10 | \n", "필링기 | \n", "딱 보통 | \n", "0 | \n", "2022.03.03 | \n", "
11 | \n", "필링기 | \n", "다시는 구매안함 | \n", "-1 | \n", "2022.03.03 | \n", "
12 | \n", "필링기 | \n", "절대적으로 안사용함 | \n", "-1 | \n", "2022.03.03 | \n", "
13 | \n", "필링기 | \n", "보통이에요 | \n", "0 | \n", "2022.03.03 | \n", "
14 | \n", "필링기 | \n", "보통이에요 | \n", "0 | \n", "2022.03.03 | \n", "
15 | \n", "필링기 | \n", "보통이에요 | \n", "0 | \n", "2022.03.03 | \n", "
16 | \n", "필링기 | \n", "많이 달지않코 식어도 계속 빠삭해요.. | \n", "1 | \n", "2022.03.01 | \n", "
17 | \n", "필링기 | \n", "너무 맛있어요 !! 이제 붕세권따윈 의미가 없네요 너무 빠삭하고 맛있어요 !! | \n", "1 | \n", "2022.03.01 | \n", "
18 | \n", "필링기 | \n", "먹고싶을 때마다 에어프라이어에 구워 먹으니 맛나요. | \n", "1 | \n", "2022.03.01 | \n", "
19 | \n", "필링기 | \n", "에어프라이기 180도 10분 돌렸는데 빠삭빠삭 맛있어요???? | \n", "1 | \n", "2022.03.01 | \n", "
20 | \n", "필링기 | \n", "진짜 맛있어요 팥도 많이 달지않고 가득들고 피?는얇아요 에어프라이어 돌리면 파는거보... | \n", "0 | \n", "2022.03.02 | \n", "
21 | \n", "필링기 | \n", "다조은데 아주약간짭아요 ㅋㅋ | \n", "0 | \n", "2022.03.03 | \n", "
22 | \n", "필링기 | \n", "시중에서 파는 맛과 90%정도 일치해요 | \n", "0 | \n", "2022.03.04 | \n", "
23 | \n", "필링기 | \n", "오븐해서 먹으니 파는 붕어빵보다 맛나요. | \n", "1 | \n", "2022.03.05 | \n", "
24 | \n", "필링기 | \n", "쓸만하고 좋아요 | \n", "1 | \n", "2022.03.05 | \n", "
25 | \n", "필링기 | \n", "긍정 | \n", "1 | \n", "2022.03.05 | \n", "
26 | \n", "필링기 | \n", "좋고 긍정입니다 | \n", "1 | \n", "2022.03.05 | \n", "
27 | \n", "필링기 | \n", "좋은데 좋아요 | \n", "1 | \n", "2022.03.05 | \n", "
28 | \n", "필링기 | \n", "재구매 의사 확실히 있음 | \n", "1 | \n", "2022.03.05 | \n", "
29 | \n", "필링기 | \n", "그냥 저럭 | \n", "0 | \n", "2022.03.05 | \n", "
30 | \n", "필링기 | \n", "쓰레기 제품입니다. | \n", "-1 | \n", "2022.03.05 | \n", "
31 | \n", "필링기 | \n", "좋아요좋아요 | \n", "1 | \n", "2022.03.05 | \n", "
32 | \n", "필링기 | \n", "별롱비니다 | \n", "-1 | \n", "2022.03.05 | \n", "
33 | \n", "필링기 | \n", "쓰레기 제품 | \n", "-1 | \n", "2022.03.05 | \n", "
34 | \n", "필링기 | \n", "이제품은 쓰레기 | \n", "-1 | \n", "2022.03.05 | \n", "