Challenge: Implementing Scaled Dot-Product Attention
Desliza para mostrar el menú
Task
You now have all the pieces to implement scaled dot-product attention from scratch. Using the formula from the previous chapter, write a function scaled_dot_product_attention that:
- Takes
Q,K,Vtensors of shape(batch_size, seq_len, d_k)as input; - Accepts an optional
masktensor of shape(batch_size, seq_len_q, seq_len_k)— when provided, positions wheremask == 0should be set to-infbefore softmax; - Returns the output tensor and the attention weights.
Implement the function locally.
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 1. Capítulo 3
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Sección 1. Capítulo 3