fix: ci test

Bruce-Lee-LY · Bruce-Lee-LY · commit 1d392d31e644 · 2025-11-29T22:41:16.000+08:00
diff --git a/rtp_llm/cpp/devices/rocm_impl/ROCmAttentionOp.cc b/rtp_llm/cpp/devices/rocm_impl/ROCmAttentionOp.cc
@@ -778,42 +778,44 @@ AttentionModuleOutput ROCmDevice::contextAttention(const AttentionModuleParams&
             }
             check_cuda_error();
         } else {
-            DISPATCH_CUDA_FUNCTION_DATA_TYPE(datatype,
-                                             invokeAddFusedQKVBiasTranspose,
-                                             nullptr,
-                                             q_output->data(),
-                                             k_output->data(),
-                                             v_output->data(),
-                                             &prefix_prompt_param,
-                                             params.input.data(),
+            DISPATCH_CUDA_FUNCTION_DATA_TYPE(
+                datatype,
+                invokeAddFusedQKVBiasTranspose,
+                nullptr,
+                q_output->data(),
+                k_output->data(),
+                v_output->data(),
+                &prefix_prompt_param,
+                params.input.data(),
+                nullptr,
+                params.common.position_ids ? params.common.position_ids->dataWithOffset<int>(
+                                                 decoder_batch_size * params.configs.rope_config.index_factor) :
                                              nullptr,
-                                             params.common.position_ids ?
-                                                 params.common.position_ids->dataWithOffset<int>(
-                                                     decoder_batch_size * params.configs.rope_config.index_factor) :
-                                                 nullptr,
-                                             params.configs.fuse_qkv_add_bias && params.weights.qkv_weight->bias ?
-                                                 params.weights.qkv_weight->bias->data() :
-                                                 nullptr,
-                                             params.common.padding_offset->data<int>(),
-                                             params.common.cu_seqlens->data<int>(),
-                                             params.common.cu_seqlens_without_prefix->data<int>(),
-                                             batch_size,
-                                             seq_len,
-                                             token_num,
-                                             head_num,
-                                             kv_head_num,
-                                             size_per_head,
-                                             params.configs.rope_config,
-                                             params.configs.use_logn_attn,
-                                             scale_out_ptr,
-                                             int8_mode,
-                                             false,
-                                             store_qkv,
-                                             false,
-                                             store_q,
-                                             store_kv,
-                                             store_cache,
-                                             stream_);
+                params.configs.fuse_qkv_add_bias && params.weights.qkv_weight->bias ?
+                    params.weights.qkv_weight->bias->data() :
+                    nullptr,
+                params.common.padding_offset->data<int>(),
+                params.common.cu_seqlens->data<int>(),
+                params.common.cu_seqlens_without_prefix->data<int>(),
+                use_rope_cache_,
+                use_rope_cache_ && rope_cache_.defined() ? rope_cache_.data_ptr<float>() : nullptr,
+                batch_size,
+                seq_len,
+                token_num,
+                head_num,
+                kv_head_num,
+                size_per_head,
+                params.configs.rope_config,
+                params.configs.use_logn_attn,
+                scale_out_ptr,
+                int8_mode,
+                false,
+                store_qkv,
+                false,
+                store_q,
+                store_kv,
+                store_cache,
+                stream_);
             check_cuda_error();
         }
         writeCacheStore(params);