; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 3 ; RUN: llc -mtriple=riscv64 -mattr=+v,+f,+m,+zfh,+zvfh \ ; RUN: < %s | FileCheck %s declare <16 x i8> @llvm.vector.extract.v16i8.nxv8i8(, i64 immarg) declare @llvm.vector.insert.nxv8i8.v16i8(, <16 x i8>, i64 immarg) declare @llvm.riscv.vslideup.nxv8i8.i64(, , i64, i64, i64 immarg) declare @llvm.vector.insert.nxv2i32.v4i32(, <4 x i32>, i64 immarg) define void @foo( %0) { ; CHECK-LABEL: foo: ; CHECK: # %bb.0: ; CHECK-NEXT: addi sp, sp, -32 ; CHECK-NEXT: .cfi_def_cfa_offset 32 ; CHECK-NEXT: sd ra, 24(sp) # 8-byte Folded Spill ; CHECK-NEXT: sd s0, 16(sp) # 8-byte Folded Spill ; CHECK-NEXT: sd s1, 8(sp) # 8-byte Folded Spill ; CHECK-NEXT: .cfi_offset ra, -8 ; CHECK-NEXT: .cfi_offset s0, -16 ; CHECK-NEXT: .cfi_offset s1, -24 ; CHECK-NEXT: vsetvli a0, zero, e8, m1, ta, ma ; CHECK-NEXT: vmv.v.i v9, 0 ; CHECK-NEXT: vsetivli zero, 0, e8, m1, tu, ma ; CHECK-NEXT: vslideup.vi v9, v10, 0 ; CHECK-NEXT: vsetvli zero, zero, e64, m8, ta, ma ; CHECK-NEXT: vmv.x.s s0, v9 ; CHECK-NEXT: vsetvli zero, zero, e8, m1, tu, ma ; CHECK-NEXT: vslideup.vi v8, v9, 0 ; CHECK-NEXT: vsetvli zero, zero, e64, m8, ta, ma ; CHECK-NEXT: vmv.x.s s1, v8 ; CHECK-NEXT: .LBB0_1: # =>This Inner Loop Header: Depth=1 ; CHECK-NEXT: li a1, 0 ; CHECK-NEXT: mv a0, s0 ; CHECK-NEXT: mv a2, s1 ; CHECK-NEXT: li a3, 0 ; CHECK-NEXT: li a4, 0 ; CHECK-NEXT: li a5, 0 ; CHECK-NEXT: jalr a1 ; CHECK-NEXT: j .LBB0_1 %2 = tail call @llvm.vector.insert.nxv8i8.v16i8( undef, <16 x i8> undef, i64 0) %3 = tail call @llvm.vector.insert.nxv8i8.v16i8( undef, <16 x i8> poison, i64 0) br label %4 4: ; preds = %4, %1 %5 = tail call @llvm.riscv.vslideup.nxv8i8.i64( zeroinitializer, %2, i64 0, i64 0, i64 0) %6 = tail call <16 x i8> @llvm.vector.extract.v16i8.nxv8i8( %5, i64 0) %7 = bitcast <16 x i8> %6 to <2 x i64> %8 = extractelement <2 x i64> %7, i64 0 %9 = insertvalue [2 x i64] zeroinitializer, i64 %8, 0 %10 = tail call @llvm.riscv.vslideup.nxv8i8.i64( %0, %3, i64 0, i64 0, i64 0) %11 = tail call <16 x i8> @llvm.vector.extract.v16i8.nxv8i8( %10, i64 0) %12 = bitcast <16 x i8> %11 to <2 x i64> %13 = extractelement <2 x i64> %12, i64 0 %14 = insertvalue [2 x i64] zeroinitializer, i64 %13, 0 %15 = tail call fastcc [2 x i64] null([2 x i64] %9, [2 x i64] %14, [2 x i64] zeroinitializer) br label %4 }