-
Notifications
You must be signed in to change notification settings - Fork 187
/
test_naive_grouper.py
47 lines (38 loc) · 1.38 KB
/
test_naive_grouper.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
import unittest
from data_juicer.core.data import NestedDataset as Dataset
from data_juicer.ops.grouper.naive_grouper import NaiveGrouper
from data_juicer.utils.unittest_utils import DataJuicerTestCaseBase
class NaiveGrouperTest(DataJuicerTestCaseBase):
def _run_helper(self, op, samples, target):
dataset = Dataset.from_list(samples)
new_dataset = op.run(dataset)
for d, t in zip(new_dataset, target):
self.assertEqual(d['text'], t['text'])
def test_naive_group(self):
source = [
{
'text': "Today is Sunday and it's a happy day!"
},
{
'text':
"Sur la plateforme MT4, plusieurs manières d'accéder à \n"
'ces fonctionnalités sont conçues simultanément.'
},
{
'text': '欢迎来到阿里巴巴!'
},
]
target = [
{
'text':[
"Today is Sunday and it's a happy day!",
"Sur la plateforme MT4, plusieurs manières d'accéder à \n"
'ces fonctionnalités sont conçues simultanément.',
'欢迎来到阿里巴巴!'
]
}
]
op = NaiveGrouper()
self._run_helper(op, source, target)
if __name__ == '__main__':
unittest.main()