Challenge: Implementing Scaled Dot-Product Attention
Swipe um das Menü anzuzeigen
Task
You now have all the pieces to implement scaled dot-product attention from scratch. Using the formula from the previous chapter, write a function scaled_dot_product_attention that:
- Takes
Q,K,Vtensors of shape(batch_size, seq_len, d_k)as input; - Accepts an optional
masktensor of shape(batch_size, seq_len_q, seq_len_k)— when provided, positions wheremask == 0should be set to-infbefore softmax; - Returns the output tensor and the attention weights.
Implement the function locally.
War alles klar?
Danke für Ihr Feedback!
Abschnitt 1. Kapitel 3
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Abschnitt 1. Kapitel 3