Skip to content

Latest commit

 

History

History
44 lines (32 loc) · 6.28 KB

miniob-topics.md

File metadata and controls

44 lines (32 loc) · 6.28 KB

背景

本次大赛赛题, 是在一个miniob(mini数据库)库的基础上, 让参数选手实现数据库的非常基础的功能, 功能分为入门(预选赛), 中级(决赛), 高阶(黑客松) 3个阶段。 入门门槛较低, 适合所有参赛选手。 面向的对象主要是在校学生,数据库爱好者, 或者对基础技术有一定兴趣的爱好者, 并且考题对诸多模块做了简化,比如不考虑并发操作, 事务比较简单。 目标是让不熟悉数据库设计和实现的同学能够快速的了解与深入学习数据库内核,期望通过miniob相关训练之后,能够对各个数据库内核模块的功能与它们之间的关联有所了解,并能够在使用时,设计出高效的SQL, 并帮助降低学习OceanBase 内核的学习门槛。

比赛分为三个阶段:预选赛、决赛和黑客松48小时极限挑战赛。

预选赛

预选赛,题目分为两类,一类必做题,一类选做题。选做题按照实现的功能计分。

必做题

名称 描述 测试用例示例
优化buffer pool 必做。实现LRU淘汰算法或其它淘汰算法
drop table 必做。删除表。清除表相关的资源。 create table t(id int, age int);
create table t(id int, name char);
drop table t;
create table t(id int, name char);
实现update功能 必做。update单个字段即可。 update t set age =100 where id=2;
update set age=20 where id>100;
增加date字段 必做。date测试不会超过2038年2月。注意处理非法的date输入。 create table t(id int, birthday date);
insert into t values(1, '2020-09-10');
insert into t values(2, '2021-1-2');
select * from t;
查询元数据校验 必做。查询语句中存在不存在的列名、表名等,需要返回失败。需要检查代码,判断是否需要返回错误的地方都返回错误了。 create table t(id int, age int);
select * from t where name='a';
select address from t where id=1;
select * from t_1000;
多表查询 必做。支持多张表的笛卡尔积关联查询。需要实现select * from t1,t2; select t1.,t2. from t1,t2;以及select t1.id,t2.id from t1,t2;查询可能会带条件。查询结果展示格式参考单表查询。每一列必须带有表信息,比如:
t1.id | t2.id
1 | 1
select * from t1,t2;
select * from t1,t2 where t1.id=t2.id and t1.age > 10;
select * from t1,t2,t3;
聚合运算 需要实现max/min/count/avg.
包含聚合字段时,只会出现聚合字段。聚合函数中的参数不会是表达式,比如age +1
select max(age) from t1; select count(*) from t1; select count(1) from t1; select count(id) from t1;

选做题

名称 分值 描述 测试用例示例
多表join操作 20 INNER JOIN。需要支持join多张表。需要考虑大表问题,不要直接使用笛卡尔积再过滤 select * from t1 inner join t2 on t1.id=t2.id;
select * from t1 inner join t2 on t1.id=t2.id inner join t3 on t1.id=t3.id;
selec * from t1 inner join t2 on t1.id=t2.id and t2.age>10 where t1.name >='a';
一次插入多条数据 10 一次插入的数据要同时成功或失败。 insert into t1 values(1,1),(2,2),(3,3);
唯一索引 10 唯一索引:create unique index create unique index i_id on t1(id);
insert into t1 values(1,1);
insert into t1 values(1,2); -- failed
支持NULL类型 10 包括但不限于建表、查询和插入。默认情况不允许为NULL,使用nullable关键字表示字段允许为NULL。
Null不区分大小写
create table t1 (id int not null, age int not null, address nullable); create table t1 (id int, age int, address char nullable); insert into t1 values(1,1, null);
简单子查询 10 支持简单的IN(NOT IN)语句;
支持与子查询结果做比较运算;
支持子查询中带聚合函数。
子查询中不会与主查询做关联。
select * from t1 where name in(select name from t2);
select * from t1 where t1.age >(select max(t2.age) from t2);
select * from t1 where t1.age > (select avg(t2.age) from t2) and t1.age > 20.0;
NOTE: 表达式中可能存在不同类型值比较
多列索引 20 单个索引关联了多个字段 create index i_id on t1(id, age);
超长字段 20 超长字段的长度可能超出一页,比如常见的text,blob等。这里仅要求实现text(text 长度固定4096字节),可以当做字符串实现。
注意:当前的查询,只能支持一次返回少量数据,需要扩展
create table t(id int, age int, info text);
insert into t(1,1, 'a very very long string');
select * from t where id=1;
查询条件支持表达式 20 查询条件中支持运算表达式,这里的运算表达式包括 +-*/。
仅支持基本数据的运算即可,不对date字段做考察。
运算出现异常,按照NULL规则处理。
只需要考虑select。
select * from t1,t2 where t1.age +10 > t2.age *2 + 3-(t1.age +10)/3;
select t1.col1+t2.col2 from t1,t2 where t1.age +10 > t2.age *2 + 3-(t1.age +10)/3;
复杂子查询 20 子查询在WHERE条件中,子查询语句支持多张表与AND条件表达式,查询条件支持max/min等 select * from t1 where age in (select id from t2 where t2.name in (select name from t3))
排序 10 支持oder by功能。不指定排序顺序默认为升序(asc)。
不需要支持oder by字段为数字的情况,比如select * from t order by 1;
select * from t,t1 where t.id=t1.id order by t.id asc,t1.score desc;
分组 20 支持group by功能。group by中的聚合函数也不要求支持表达式 select t.id, t.name, avg(t.score),avg(t2.age) from t,t2 where t.id=t2.id group by t.id;

决赛

敬请期待 ...