Skip to content

Commit

Permalink
Update 05.String-Horspool.md
Browse files Browse the repository at this point in the history
  • Loading branch information
itcharge committed Nov 3, 2022
1 parent fa18ee2 commit 059ab18
Showing 1 changed file with 11 additions and 11 deletions.
Original file line number Diff line number Diff line change
@@ -1,8 +1,8 @@
## 1.1 Horspool 算法介绍

**Horspool 算法** 是一种在字符串中查找子串的算法,它是由 Nigel Horspool 教授于 1980 年出版的,是首个对 Boyer Moore 算法进行简化的算法。

> **Horspool 算法思想**:对于给定文本串 `T` 与模式串 `p`,先对模式串 `p` 进行预处理。然后在匹配的过程中,当发现文本串 `T` 的某个字符与模式串 `p` 不匹配的时候,根据启发策略,能够尽可能的跳过一些无法匹配的情况,将模式串多向后滑动几位。
> **Horspool 算法**是一种在字符串中查找子串的算法,它是由 Nigel Horspool 教授于 1980 年出版的,是首个对 Boyer Moore 算法进行简化的算法。
>
> - **Horspool 算法思想**:对于给定文本串 `T` 与模式串 `p`,先对模式串 `p` 进行预处理。然后在匹配的过程中,当发现文本串 `T` 的某个字符与模式串 `p` 不匹配的时候,根据启发策略,能够尽可能的跳过一些无法匹配的情况,将模式串多向后滑动几位。
可以看出,Horspool 算法思想和 Boyer Moore 算法思想是一致的。Horspool 算法是在 Boyer Moore 算法思想基础上改进了「坏字符规则」。当文本串 `T` 中某个字符跟模式串 `p` 的某个字符不匹配时,可以模式串 `p` 快速向右移动。

Expand All @@ -25,14 +25,14 @@

整个 Horspool 算法步骤描述如下:

- 计算出文本串 `T` 的长度为 `n`,模式串 `p` 的长度为 `m`
- 先对模式串 `p` 进行预处理,生成后移位数表 `bc_table`
- 将模式串 `p` 的头部与文本串 `T` 对齐,将 `i` 指向文本串开始位置,即 `i = 0``j` 指向模式串末尾位置,即 `j = m - 1`,然后从模式串末尾位置开始比较。
- 如果文本串对应位置的字符 `T[i + j]` 与模式串对应字符 `p[j]` 相同,则继续比较前一位字符。
- 如果模式串全部匹配完毕,则返回模式串 `p` 在文本串中的开始位置 `i`
- 如果文本串对应位置的字符 `T[i + j]` 与模式串对应字符 `p[j]` 不同,则:
- 根据后移位数表 `bc_table` 和模式串末尾位置对应的文本串上的字符 `T[i + m - 1]` ,计算出可移动距离 `bc_table[T[i + m - 1]]`,然后将模式串进行后移。
- 如果移动到末尾也没有找到匹配情况,则返回 `-1`
1. 计算出文本串 `T` 的长度为 `n`,模式串 `p` 的长度为 `m`
2. 先对模式串 `p` 进行预处理,生成后移位数表 `bc_table`
3. 将模式串 `p` 的头部与文本串 `T` 对齐,将 `i` 指向文本串开始位置,即 `i = 0``j` 指向模式串末尾位置,即 `j = m - 1`,然后从模式串末尾位置开始比较。
1. 如果文本串对应位置的字符 `T[i + j]` 与模式串对应字符 `p[j]` 相同,则继续比较前一位字符。
1. 如果模式串全部匹配完毕,则返回模式串 `p` 在文本串中的开始位置 `i`
2. 如果文本串对应位置的字符 `T[i + j]` 与模式串对应字符 `p[j]` 不同,则:
1. 根据后移位数表 `bc_table` 和模式串末尾位置对应的文本串上的字符 `T[i + m - 1]` ,计算出可移动距离 `bc_table[T[i + m - 1]]`,然后将模式串进行后移。
4. 如果移动到末尾也没有找到匹配情况,则返回 `-1`

## 3. Horspool 算法代码实现

Expand Down

0 comments on commit 059ab18

Please sign in to comment.