注意力机制

  • Q查询K[k1,k2,kn],得到相似度向量s
  • s查询V,得到新的向量、这个向量就会包含查询信息。