-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathmodel.py
68 lines (57 loc) · 1.95 KB
/
model.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
"""
Библиотека для работы с моделью текста.
"""
from collections import Counter
import pickle
def load_model(model_dest):
"""
Загрузка модели из файла
:param model_dest: Расположение файла
:type: str
:return: Модель
:rtype: Counter
"""
with open(model_dest, 'rb') as f:
model = pickle.load(f)
if type(model) is dict:
return Counter(model)
elif type(model) is Counter:
return model
else:
raise TypeError('Не правильный тип модели! Он должен быть '
'словарем или Counter!')
def save_model(model, model_dest):
"""
Сохранение модели в файл
:param model: Модель
:param model_dest: Расположение файла
:type model: Counter
:type model_dest: str
:return: None
"""
with open(model_dest, 'wb') as f:
pickle.dump(model, f)
def train_model(ngramms, model_dest, upd_it):
"""
Главная функция обучения модели
:param ngramms: Генератор n-грамм
:param model_dest: Расположение файла модели
:param upd_it: Флаг обновления модели
:type ngramms: generator
:type model_dest: str
:type upd_it: bool
:return: None
"""
try:
model = load_model(model_dest)
except FileNotFoundError:
model = None
ngramm_tuples = [tuple(i) for i in ngramms]
if upd_it:
# Если пытаемся обновить несуществующую модель, вызываем исключение
if model is None:
raise FileNotFoundError('Нет модели для обновления')
model.update(ngramm_tuples)
else:
model = Counter(ngramm_tuples)
save_model(model, model_dest)