Explaination of normalization and orthogonal unit vector generation in Paper "Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts"

1. Normalization

1.1 L2 Norm

$$ \mu = \frac{\nu}{|\nu|_2} $$

1.2 z-score normalization

$$\mu = \frac{\nu-mean(\nu)}{std(\nu)}$$ $$\mu = \frac{\mu}{sqrt(n)}, n=len(\mu)$$ The step 1 completes z-score normalization, and step 2 finishes the unit process.
Prove

$$std(\nu)=\sqrt{\frac{1}{n}\times\sum_{i}\left(\nu_{i}-mean(\nu)\right)^{2}}$$ replace std with eq.3 in eq.1，and get $$\mu = \sqrt{n}\times\frac{\nu-mean(\nu)}{\sqrt{\sum_{i}\left(\nu_{i}-mean(\nu)\right)^{2}}}$$ the right part $\frac{\nu-mean(\nu)}{\sqrt{\sum_{i}\left(\nu_{i}-mean(\nu)\right)^{2}}}$ is one normalized vector with L2 norm. Above process is z-score normalization. Obviously, $\mu$ in eq.1 is a normalization vector with coefficient. Therefore, the final $\mu$ in eq.2 is obtained by deviding $\sqrt{n}$

Orthogonal vector generation

m1 is a random vector, m2 is a unit vector. How to transform m1 into a vector orthogonal to m2?
process

$$ m1 = m1 - dot(m1, m2) * m2 $$

prove

$dot(m1, m2)$ means the projection length of m1 in the m2 direction. Because m2 is a unit vector, we can know that dot(m1, m2) * m2 is one projection vector in m2 direction easily. Lastly, $m1 = m1 - dot(m1, m2) * m2$ is a vector orthogonal to m2.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
imgs		imgs
readme.md		readme.md
synthetic_demo.py		synthetic_demo.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Explaination of normalization and orthogonal unit vector generation in Paper "Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts"

1. Normalization

1.1 L2 Norm

1.2 z-score normalization

Orthogonal vector generation

About

Releases

Packages

Languages

HIT-LiuChen/synthetic_vector

Folders and files

Latest commit

History

Repository files navigation

Explaination of normalization and orthogonal unit vector generation in Paper "Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts"

1. Normalization

1.1 L2 Norm

1.2 z-score normalization

Orthogonal vector generation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages