test gemm oom (#6429)

nihui · web-flow · commit 44b88e4f164f · 2025-11-28T19:09:31.000+08:00
diff --git a/src/layer/arm/gemm_arm.cpp b/src/layer/arm/gemm_arm.cpp
@@ -4357,6 +4357,8 @@ int Gemm_arm::create_pipeline(const Option& opt)
         {
             int C_elempack = constantM % 4 == 0 ? 4 : 1;
             convert_packing(C_data, CT_data, C_elempack, opt);
+            if (CT_data.empty())
+                return -100;
         }
 #endif // __ARM_NEON
 
@@ -4365,6 +4367,8 @@ int Gemm_arm::create_pipeline(const Option& opt)
         {
             Mat C2;
             C2.create_like(CT_data);
+            if (C2.empty())
+                return -100;
 
             const int size = CT_data.total() * CT_data.elempack;
             for (int i = 0; i < size; i++)
@@ -4513,6 +4517,8 @@ int Gemm_arm::forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& to
             {
                 Mat CT_data;
                 CT_data.create_like(C, opt.workspace_allocator);
+                if (CT_data.empty())
+                    return -100;
 
                 const int size = C.total() * C.elempack;
                 for (int i = 0; i < size; i++)
@@ -5079,6 +5085,8 @@ int Gemm_arm::create_pipeline_bf16s(const Option& opt)
         {
             int C_elempack = constantM % 4 == 0 ? 4 : 1;
             convert_packing(C_data, CT_data, C_elempack, opt);
+            if (CT_data.empty())
+                return -100;
         }
 #endif // __ARM_NEON
 
@@ -5087,6 +5095,8 @@ int Gemm_arm::create_pipeline_bf16s(const Option& opt)
         {
             Mat C2;
             C2.create_like(CT_data);
+            if (C2.empty())
+                return -100;
 
             const int size = CT_data.total() * CT_data.elempack;
             for (int i = 0; i < size; i++)
@@ -5210,6 +5220,8 @@ int Gemm_arm::forward_bf16s(const std::vector<Mat>& bottom_blobs, std::vector<Ma
             {
                 Mat CT_data;
                 CT_data.create_like(C, opt.workspace_allocator);
+                if (CT_data.empty())
+                    return -100;
 
                 const int size = C.total() * C.elempack;
                 for (int i = 0; i < size; i++)
diff --git a/src/layer/arm/gemm_arm_asimdhp.cpp b/src/layer/arm/gemm_arm_asimdhp.cpp
@@ -2801,13 +2801,17 @@ int Gemm_arm::create_pipeline_fp16sa(const Option& opt)
     if (constantC && constant_broadcast_type_C != -1)
     {
         cast_float32_to_float16(C_data, CT_data, opt);
+        if (CT_data.empty())
+            return -100;
 
         if (constant_broadcast_type_C == 3 && opt.use_packing_layout)
         {
             int C_elempack = constantM % 8 == 0 ? 8 : constantM % 4 == 0 ? 4 : 1;
             Mat tmp;
             convert_packing(CT_data, tmp, C_elempack, opt);
             CT_data = tmp;
+            if (CT_data.empty())
+                return -100;
         }
 
         // pre-multiply C with beta
diff --git a/src/layer/arm/gemm_arm_vfpv4.cpp b/src/layer/arm/gemm_arm_vfpv4.cpp
@@ -498,6 +498,8 @@ int Gemm_arm::create_pipeline_fp16s(const Option& opt)
         {
             int C_elempack = constantM % 4 == 0 ? 4 : 1;
             convert_packing(C_data, CT_data, C_elempack, opt);
+            if (CT_data.empty())
+                return -100;
         }
 #endif // __ARM_NEON
 
@@ -506,6 +508,8 @@ int Gemm_arm::create_pipeline_fp16s(const Option& opt)
         {
             Mat C2;
             C2.create_like(CT_data);
+            if (C2.empty())
+                return -100;
 
             const int size = CT_data.total() * CT_data.elempack;
             for (int i = 0; i < size; i++)
@@ -622,13 +626,17 @@ int Gemm_arm::forward_fp16s(const std::vector<Mat>& bottom_blobs, std::vector<Ma
                 Mat CT_data;
                 cast_float16_to_float32(C, CT_data);
                 C = CT_data;
+                if (C.empty())
+                    return -100;
             }
 
             // pre-multiply C with beta
             if (beta != 1.f)
             {
                 Mat CT_data;
                 CT_data.create_like(C, opt.workspace_allocator);
+                if (CT_data.empty())
+                    return -100;
 
                 const int size = C.total() * C.elempack;
                 for (int i = 0; i < size; i++)
diff --git a/src/layer/gemm.cpp b/src/layer/gemm.cpp
@@ -305,6 +305,8 @@ int Gemm::forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& top_bl
     {
         // transpose A to row-major
         A.create((A0.dims == 3 ? A0.c : A0.h), A0.w, elemsize, opt.workspace_allocator);
+        if (A.empty())
+            return -100;
 
         const size_t A0_hstep = A0.dims == 3 ? A0.cstep : (size_t)A0.w;
 
@@ -323,6 +325,8 @@ int Gemm::forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& top_bl
     {
         // transpose B to col-major
         BT.create((B0.dims == 3 ? B0.c : B0.h), B0.w, elemsize, opt.workspace_allocator);
+        if (BT.empty())
+            return -100;
 
         const size_t B0_hstep = B0.dims == 3 ? B0.cstep : (size_t)B0.w;
 
@@ -441,6 +445,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t
         if (A0.elemsize == 1)
         {
             A.create(A0.h, A0.w, (size_t)1u, 1, opt.workspace_allocator);
+            if (A.empty())
+                return -100;
 
             for (int i = 0; i < A.h; i++)
             {
@@ -454,6 +460,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t
         else
         {
             A.create(A0.dims == 3 ? A0.c : A0.h, A0.w, (size_t)4u, 1, opt.workspace_allocator);
+            if (A.empty())
+                return -100;
 
             for (int i = 0; i < A.h; i++)
             {
@@ -472,7 +480,11 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t
     if (A_int8.elemsize != 1)
     {
         A_int8.create(A.w, A.dims == 3 ? A.c : A.h, (size_t)1u, 1, opt.workspace_allocator);
+        if (A_int8.empty())
+            return -100;
         A_int8_scales.create(A_int8.h, (size_t)4u, 1, opt.workspace_allocator);
+        if (A_int8_scales.empty())
+            return -100;
 
         for (int i = 0; i < A_int8.h; i++)
         {
@@ -503,6 +515,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t
     if (B0_int8.elemsize != 1)
     {
         B0_int8.create(B0.w, B0.dims == 3 ? B0.c : B0.h, (size_t)1u, 1, opt.workspace_allocator);
+        if (B0_int8.empty())
+            return -100;
 
         float absmax = 0.f;
         for (int i = 0; i < B0_int8.h; i++)
@@ -537,6 +551,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t
     {
         // transpose B to col-major
         BT_int8.create(B0_int8.h, B0_int8.w, (size_t)1u, 1, opt.workspace_allocator);
+        if (BT_int8.empty())
+            return -100;
 
         for (int i = 0; i < BT_int8.h; i++)
         {
diff --git a/src/layer/riscv/gemm_riscv.cpp b/src/layer/riscv/gemm_riscv.cpp
@@ -1503,7 +1503,11 @@ static int gemm_riscv(const Mat& A, const Mat& B, const Mat& C, Mat& top_blob, i
     int nn_K = (K + TILE_K - 1) / TILE_K;
 
     Mat ATX(TILE_K * TILE_M, (K + TILE_K - 1) / TILE_K, nT, 4u, opt.workspace_allocator);
+    if (ATX.empty())
+        return -100;
     Mat BT(TILE_K * TILE_N, (K + TILE_K - 1) / TILE_K, (N + TILE_N - 1) / TILE_N, 4u, opt.workspace_allocator);
+    if (BT.empty())
+        return -100;
 
     const int nn_NK = nn_N * nn_K;
 
@@ -1537,7 +1541,11 @@ static int gemm_riscv(const Mat& A, const Mat& B, const Mat& C, Mat& top_blob, i
 
     Mat topT;
     if (K > TILE_K || broadcast_type_C == 3 || output_transpose)
+    {
         topT.create(TILE_N * TILE_M, 1, nT, 4u, opt.workspace_allocator);
+        if (topT.empty())
+            return -100;
+    }
 
     #pragma omp parallel for num_threads(nT)
     for (int ppi = 0; ppi < nn_M; ppi++)
@@ -1617,6 +1625,8 @@ static int gemm_AT_riscv(const Mat& AT, const Mat& B, const Mat& C, Mat& top_blo
     int nn_K = (K + TILE_K - 1) / TILE_K;
 
     Mat BT(TILE_K * TILE_N, (K + TILE_K - 1) / TILE_K, (N + TILE_N - 1) / TILE_N, 4u, opt.workspace_allocator);
+    if (BT.empty())
+        return -100;
 
     const int nn_NK = nn_N * nn_K;
 
@@ -1647,7 +1657,11 @@ static int gemm_AT_riscv(const Mat& AT, const Mat& B, const Mat& C, Mat& top_blo
 
     Mat topT;
     if (K > TILE_K || broadcast_type_C == 3 || output_transpose)
+    {
         topT.create(TILE_N * TILE_M, 1, nT, 4u, opt.workspace_allocator);
+        if (topT.empty())
+            return -100;
+    }
 
     #pragma omp parallel for num_threads(nT)
     for (int ppi = 0; ppi < nn_M; ppi++)
@@ -1708,10 +1722,16 @@ static int gemm_BT_riscv(const Mat& A, const Mat& BT, const Mat& C, Mat& top_blo
     // int nn_N = (N + TILE_N - 1) / TILE_N;
 
     Mat ATX(TILE_K * TILE_M, (K + TILE_K - 1) / TILE_K, nT, 4u, opt.workspace_allocator);
+    if (ATX.empty())
+        return -100;
 
     Mat topT;
     if (K > TILE_K || broadcast_type_C == 3 || output_transpose)
+    {
         topT.create(TILE_N * TILE_M, 1, nT, 4u, opt.workspace_allocator);
+        if (topT.empty())
+            return -100;
+    }
 
     #pragma omp parallel for num_threads(nT)
     for (int ppi = 0; ppi < nn_M; ppi++)
@@ -1790,7 +1810,11 @@ static int gemm_AT_BT_riscv(const Mat& AT, const Mat& BT, const Mat& C, Mat& top
 
     Mat topT;
     if (K > TILE_K || broadcast_type_C == 3 || output_transpose)
+    {
         topT.create(TILE_N * TILE_M, 1, nT, 4u, opt.workspace_allocator);
+        if (topT.empty())
+            return -100;
+    }
 
     #pragma omp parallel for num_threads(nT)
     for (int ppi = 0; ppi < nn_M; ppi++)
@@ -1951,6 +1975,8 @@ int Gemm_riscv::create_pipeline(const Option& opt)
         {
             int C_elempack = constantM % packn == 0 ? packn : 1;
             convert_packing(C_data, CT_data, C_elempack, opt);
+            if (CT_data.empty())
+                return -100;
         }
 #endif // __riscv_vector
 
@@ -1959,6 +1985,8 @@ int Gemm_riscv::create_pipeline(const Option& opt)
         {
             Mat C2;
             C2.create_like(CT_data);
+            if (C2.empty())
+                return -100;
 
             const int size = CT_data.total() * CT_data.elempack;
             for (int i = 0; i < size; i++)
@@ -2082,6 +2110,8 @@ int Gemm_riscv::forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>&
             {
                 Mat CT_data;
                 CT_data.create_like(C, opt.workspace_allocator);
+                if (CT_data.empty())
+                    return -100;
 
                 const int size = C.total() * C.elempack;
                 for (int i = 0; i < size; i++)
diff --git a/src/layer/x86/gemm_x86.cpp b/src/layer/x86/gemm_x86.cpp
@@ -7500,6 +7500,8 @@ int Gemm_x86::create_pipeline(const Option& opt)
             int C_elempack = constantM % 4 == 0 ? 4 : 1;
 #endif
             convert_packing(C_data, CT_data, C_elempack, opt);
+            if (CT_data.empty())
+                return -100;
         }
 #endif // __SSE2__
 
@@ -7508,6 +7510,8 @@ int Gemm_x86::create_pipeline(const Option& opt)
         {
             Mat C2;
             C2.create_like(CT_data);
+            if (C2.empty())
+                return -100;
 
             const int size = CT_data.total() * CT_data.elempack;
             for (int i = 0; i < size; i++)
diff --git a/tests/test_gemm_oom.cpp b/tests/test_gemm_oom.cpp

Original file line number	Diff line number	Diff line change
`@@ -4357,6 +4357,8 @@ int Gemm_arm::create_pipeline(const Option& opt)`
`4357`	`4357`	`{`
`4358`	`4358`	`int C_elempack = constantM % 4 == 0 ? 4 : 1;`
`4359`	`4359`	`convert_packing(C_data, CT_data, C_elempack, opt);`
	`4360`	`+ if (CT_data.empty())`
	`4361`	`+ return -100;`
`4360`	`4362`	`}`
`4361`	`4363`	`#endif // __ARM_NEON`
`4362`	`4364`
`@@ -4365,6 +4367,8 @@ int Gemm_arm::create_pipeline(const Option& opt)`
`4365`	`4367`	`{`
`4366`	`4368`	`Mat C2;`
`4367`	`4369`	`C2.create_like(CT_data);`
	`4370`	`+ if (C2.empty())`
	`4371`	`+ return -100;`
`4368`	`4372`
`4369`	`4373`	`const int size = CT_data.total() * CT_data.elempack;`
`4370`	`4374`	`for (int i = 0; i < size; i++)`
`@@ -4513,6 +4517,8 @@ int Gemm_arm::forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& to`
`4513`	`4517`	`{`
`4514`	`4518`	`Mat CT_data;`
`4515`	`4519`	`CT_data.create_like(C, opt.workspace_allocator);`
	`4520`	`+ if (CT_data.empty())`
	`4521`	`+ return -100;`
`4516`	`4522`
`4517`	`4523`	`const int size = C.total() * C.elempack;`
`4518`	`4524`	`for (int i = 0; i < size; i++)`
`@@ -5079,6 +5085,8 @@ int Gemm_arm::create_pipeline_bf16s(const Option& opt)`
`5079`	`5085`	`{`
`5080`	`5086`	`int C_elempack = constantM % 4 == 0 ? 4 : 1;`
`5081`	`5087`	`convert_packing(C_data, CT_data, C_elempack, opt);`
	`5088`	`+ if (CT_data.empty())`
	`5089`	`+ return -100;`
`5082`	`5090`	`}`
`5083`	`5091`	`#endif // __ARM_NEON`
`5084`	`5092`
`@@ -5087,6 +5095,8 @@ int Gemm_arm::create_pipeline_bf16s(const Option& opt)`
`5087`	`5095`	`{`
`5088`	`5096`	`Mat C2;`
`5089`	`5097`	`C2.create_like(CT_data);`
	`5098`	`+ if (C2.empty())`
	`5099`	`+ return -100;`
`5090`	`5100`
`5091`	`5101`	`const int size = CT_data.total() * CT_data.elempack;`
`5092`	`5102`	`for (int i = 0; i < size; i++)`
`@@ -5210,6 +5220,8 @@ int Gemm_arm::forward_bf16s(const std::vector<Mat>& bottom_blobs, std::vector<Ma`
`5210`	`5220`	`{`
`5211`	`5221`	`Mat CT_data;`
`5212`	`5222`	`CT_data.create_like(C, opt.workspace_allocator);`
	`5223`	`+ if (CT_data.empty())`
	`5224`	`+ return -100;`
`5213`	`5225`
`5214`	`5226`	`const int size = C.total() * C.elempack;`
`5215`	`5227`	`for (int i = 0; i < size; i++)`
Original file line number	Diff line number	Diff line change
`@@ -2801,13 +2801,17 @@ int Gemm_arm::create_pipeline_fp16sa(const Option& opt)`
`2801`	`2801`	`if (constantC && constant_broadcast_type_C != -1)`
`2802`	`2802`	`{`
`2803`	`2803`	`cast_float32_to_float16(C_data, CT_data, opt);`
	`2804`	`+ if (CT_data.empty())`
	`2805`	`+ return -100;`
`2804`	`2806`
`2805`	`2807`	`if (constant_broadcast_type_C == 3 && opt.use_packing_layout)`
`2806`	`2808`	`{`
`2807`	`2809`	`int C_elempack = constantM % 8 == 0 ? 8 : constantM % 4 == 0 ? 4 : 1;`
`2808`	`2810`	`Mat tmp;`
`2809`	`2811`	`convert_packing(CT_data, tmp, C_elempack, opt);`
`2810`	`2812`	`CT_data = tmp;`
	`2813`	`+ if (CT_data.empty())`
	`2814`	`+ return -100;`
`2811`	`2815`	`}`
`2812`	`2816`
`2813`	`2817`	`// pre-multiply C with beta`
Original file line number	Diff line number	Diff line change
`@@ -305,6 +305,8 @@ int Gemm::forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& top_bl`
`305`	`305`	`{`
`306`	`306`	`// transpose A to row-major`
`307`	`307`	`A.create((A0.dims == 3 ? A0.c : A0.h), A0.w, elemsize, opt.workspace_allocator);`
	`308`	`+ if (A.empty())`
	`309`	`+ return -100;`
`308`	`310`
`309`	`311`	`const size_t A0_hstep = A0.dims == 3 ? A0.cstep : (size_t)A0.w;`
`310`	`312`
`@@ -323,6 +325,8 @@ int Gemm::forward(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& top_bl`
`323`	`325`	`{`
`324`	`326`	`// transpose B to col-major`
`325`	`327`	`BT.create((B0.dims == 3 ? B0.c : B0.h), B0.w, elemsize, opt.workspace_allocator);`
	`328`	`+ if (BT.empty())`
	`329`	`+ return -100;`
`326`	`330`
`327`	`331`	`const size_t B0_hstep = B0.dims == 3 ? B0.cstep : (size_t)B0.w;`
`328`	`332`
`@@ -441,6 +445,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t`
`441`	`445`	`if (A0.elemsize == 1)`
`442`	`446`	`{`
`443`	`447`	`A.create(A0.h, A0.w, (size_t)1u, 1, opt.workspace_allocator);`
	`448`	`+ if (A.empty())`
	`449`	`+ return -100;`
`444`	`450`
`445`	`451`	`for (int i = 0; i < A.h; i++)`
`446`	`452`	`{`
`@@ -454,6 +460,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t`
`454`	`460`	`else`
`455`	`461`	`{`
`456`	`462`	`A.create(A0.dims == 3 ? A0.c : A0.h, A0.w, (size_t)4u, 1, opt.workspace_allocator);`
	`463`	`+ if (A.empty())`
	`464`	`+ return -100;`
`457`	`465`
`458`	`466`	`for (int i = 0; i < A.h; i++)`
`459`	`467`	`{`
`@@ -472,7 +480,11 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t`
`472`	`480`	`if (A_int8.elemsize != 1)`
`473`	`481`	`{`
`474`	`482`	`A_int8.create(A.w, A.dims == 3 ? A.c : A.h, (size_t)1u, 1, opt.workspace_allocator);`
	`483`	`+ if (A_int8.empty())`
	`484`	`+ return -100;`
`475`	`485`	`A_int8_scales.create(A_int8.h, (size_t)4u, 1, opt.workspace_allocator);`
	`486`	`+ if (A_int8_scales.empty())`
	`487`	`+ return -100;`
`476`	`488`
`477`	`489`	`for (int i = 0; i < A_int8.h; i++)`
`478`	`490`	`{`
`@@ -503,6 +515,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t`
`503`	`515`	`if (B0_int8.elemsize != 1)`
`504`	`516`	`{`
`505`	`517`	`B0_int8.create(B0.w, B0.dims == 3 ? B0.c : B0.h, (size_t)1u, 1, opt.workspace_allocator);`
	`518`	`+ if (B0_int8.empty())`
	`519`	`+ return -100;`
`506`	`520`
`507`	`521`	`float absmax = 0.f;`
`508`	`522`	`for (int i = 0; i < B0_int8.h; i++)`
`@@ -537,6 +551,8 @@ int Gemm::forward_int8(const std::vector<Mat>& bottom_blobs, std::vector<Mat>& t`
`537`	`551`	`{`
`538`	`552`	`// transpose B to col-major`
`539`	`553`	`BT_int8.create(B0_int8.h, B0_int8.w, (size_t)1u, 1, opt.workspace_allocator);`
	`554`	`+ if (BT_int8.empty())`
	`555`	`+ return -100;`
`540`	`556`
`541`	`557`	`for (int i = 0; i < BT_int8.h; i++)`
`542`	`558`	`{`