Skip to content

Latest commit

 

History

History
175 lines (137 loc) · 5.08 KB

File metadata and controls

175 lines (137 loc) · 5.08 KB
comments difficulty edit_url tags
true
中等
数据库

English Version

题目描述

表:EmployeeShifts

+------------------+---------+
| Column Name      | Type    |
+------------------+---------+
| employee_id      | int     |
| start_time       | time    |
| end_time         | time    |
+------------------+---------+
(employee_id, start_time) 是此表的唯一主键。
这张表包含员工的排班工作,包括特定日期的开始和结束时间。

编写一个解决方案来为每个员工计算 重叠排班 的数量。如果一个排班的 end_time 比另一个排班的 start_time 更晚 则认为两个排班重叠。

返回结果表以 employee_id 升序 排序。

查询结果格式如下所示。

 

示例:

输入:

EmployeeShifts 表:

+-------------+------------+----------+
| employee_id | start_time | end_time |
+-------------+------------+----------+
| 1           | 08:00:00   | 12:00:00 |
| 1           | 11:00:00   | 15:00:00 |
| 1           | 14:00:00   | 18:00:00 |
| 2           | 09:00:00   | 17:00:00 |
| 2           | 16:00:00   | 20:00:00 |
| 3           | 10:00:00   | 12:00:00 |
| 3           | 13:00:00   | 15:00:00 |
| 3           | 16:00:00   | 18:00:00 |
| 4           | 08:00:00   | 10:00:00 |
| 4           | 09:00:00   | 11:00:00 |
+-------------+------------+----------+

输出:

+-------------+--------------------+
| employee_id | overlapping_shifts |
+-------------+--------------------+
| 1           | 2                  |
| 2           | 1                  |
| 4           | 1                  |
+-------------+--------------------+

解释:

  • 员工 1 有 3 个排班:
    • 08:00:00 到 12:00:00
    • 11:00:00 到 15:00:00
    • 14:00:00 到 18:00:00
    第一个排班与第二个排班重叠,第二个排班与第三个排班重叠,因此有 2 个重叠排班。
  • 员工 2 有 2 个排班:
    • 09:00:00 到 17:00:00
    • 16:00:00 到 20:00:00
    这些排班彼此重叠,因此有 1 个重叠排班。
  • 员工 3 有 3 个排班:
    • 10:00:00 到 12:00:00
    • 13:00:00 到 15:00:00
    • 16:00:00 到 18:00:00
    这些排班没有重叠,所以员工 3 不包含在输出中。
  • 员工 4 有 2 个排班:
    • 08:00:00 到 10:00:00
    • 09:00:00 到 11:00:00
    这些排班彼此重叠,因此有 1 个重叠排班。

输出展示了 employee_id 和至少有一个重叠排班的员工的重叠排班的数量,以 employee_id 升序排序。

解法

方法一:自连接 + 分组计数

我们首先使用自连接,将 EmployeeShifts 表连接自身。通过连接条件,确保只比较同一个员工的班次,并且检查班次之间是否存在重叠。

  1. t1.start_time < t1.start_time:确保第一个班次的开始时间早于第二个班次的结束时间。
  2. t1.end_time > t2.start_time:确保第一个班次的结束时间晚于第二个班次的开始时间。

接下来,我们对数据按照 employee_id 进行分组,统计每个员工的重叠班次数量。

最后,我们筛选出重叠班次数量大于 $0$ 的员工,并按照 employee_id 进行升序排序。

MySQL

SELECT
    t1.employee_id,
    COUNT(*) AS overlapping_shifts
FROM
    EmployeeShifts t1
    JOIN EmployeeShifts t2
        ON t1.employee_id = t2.employee_id
        AND t1.start_time < t2.start_time
        AND t1.end_time > t2.start_time
GROUP BY 1
HAVING overlapping_shifts > 0
ORDER BY 1;

Pandas

import pandas as pd


def find_overlapping_shifts(employee_shifts: pd.DataFrame) -> pd.DataFrame:
    merged_shifts = employee_shifts.merge(
        employee_shifts, on="employee_id", suffixes=("_t1", "_t2")
    )
    overlapping_shifts = merged_shifts[
        (merged_shifts["start_time_t1"] < merged_shifts["start_time_t2"])
        & (merged_shifts["end_time_t1"] > merged_shifts["start_time_t2"])
    ]
    result = (
        overlapping_shifts.groupby("employee_id")
        .size()
        .reset_index(name="overlapping_shifts")
    )
    result = result[result["overlapping_shifts"] > 0]
    result = result.sort_values("employee_id").reset_index(drop=True)
    return result