scale dot product attention pattern分析 - yuanlehome/Hackathon GitHub Wiki

分析一下对于scale dot product attention 八种可能的pattern,下面画图展示

llama pattern drawio

llama pattern2 drawio

llama pattern3 drawio

llama pattern4 drawio