; RUN: opt -S -passes=instcombine < %s | FileCheck %s target triple = "aarch64-unknown-linux-gnu" ; DUPQ b8 define @dupq_b_0() #0 { ; CHECK-LABEL: @dupq_b_0( ; CHECK: ret zeroinitializer %1 = tail call @llvm.aarch64.sve.ptrue.nxv16i1(i32 31) %2 = tail call @llvm.vector.insert.nxv16i8.v16i8( undef, <16 x i8> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv16i8( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv16i8( %1, %3, %4) ret %5 } define @dupq_b_d() #0 { ; CHECK-LABEL: @dupq_b_d( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) ; CHECK-NEXT: %2 = call @llvm.aarch64.sve.convert.to.svbool.nxv2i1( %1) ; CHECK-NEXT: ret %2 %1 = tail call @llvm.aarch64.sve.ptrue.nxv16i1(i32 31) %2 = tail call @llvm.vector.insert.nxv16i8.v16i8( undef, <16 x i8> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv16i8( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv16i8( %1, %3, %4) ret %5 } define @dupq_b_w() #0 { ; CHECK-LABEL: @dupq_b_w( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) ; CHECK-NEXT: %2 = call @llvm.aarch64.sve.convert.to.svbool.nxv4i1( %1) ; CHECK-NEXT: ret %2 %1 = tail call @llvm.aarch64.sve.ptrue.nxv16i1(i32 31) %2 = tail call @llvm.vector.insert.nxv16i8.v16i8( undef, <16 x i8> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv16i8( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv16i8( %1, %3, %4) ret %5 } define @dupq_b_h() #0 { ; CHECK-LABEL: @dupq_b_h( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv8i1(i32 31) ; CHECK-NEXT: %2 = call @llvm.aarch64.sve.convert.to.svbool.nxv8i1( %1) ; CHECK-NEXT: ret %2 %1 = tail call @llvm.aarch64.sve.ptrue.nxv16i1(i32 31) %2 = tail call @llvm.vector.insert.nxv16i8.v16i8( undef, <16 x i8> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv16i8( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv16i8( %1, %3, %4) ret %5 } define @dupq_b_b() #0 { ; CHECK-LABEL: @dupq_b_b( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv16i1(i32 31) ; CHECK-NEXT: ret %1 %1 = tail call @llvm.aarch64.sve.ptrue.nxv16i1(i32 31) %2 = tail call @llvm.vector.insert.nxv16i8.v16i8( undef, <16 x i8> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv16i8( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv16i8( %1, %3, %4) ret %5 } ; DUPQ b16 define @dupq_h_0() #0 { ; CHECK-LABEL: @dupq_h_0( ; CHECK: ret zeroinitializer %1 = tail call @llvm.aarch64.sve.ptrue.nxv8i1(i32 31) %2 = tail call @llvm.vector.insert.nxv8i16.v8i16( undef, <8 x i16> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv8i16( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv8i16( %1, %3, %4) ret %5 } define @dupq_h_d() #0 { ; CHECK-LABEL: @dupq_h_d( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) ; CHECK-NEXT: %2 = call @llvm.aarch64.sve.convert.to.svbool.nxv2i1( %1) ; CHECK-NEXT: %3 = call @llvm.aarch64.sve.convert.from.svbool.nxv8i1( %2) ; CHECK-NEXT: ret %3 %1 = tail call @llvm.aarch64.sve.ptrue.nxv8i1(i32 31) %2 = tail call @llvm.vector.insert.nxv8i16.v8i16( undef, <8 x i16> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv8i16( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv8i16( %1, %3, %4) ret %5 } define @dupq_h_w() #0 { ; CHECK-LABEL: @dupq_h_w( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) ; CHECK-NEXT: %2 = call @llvm.aarch64.sve.convert.to.svbool.nxv4i1( %1) ; CHECK-NEXT: %3 = call @llvm.aarch64.sve.convert.from.svbool.nxv8i1( %2) ; CHECK-NEXT: ret %3 %1 = tail call @llvm.aarch64.sve.ptrue.nxv8i1(i32 31) %2 = tail call @llvm.vector.insert.nxv8i16.v8i16( undef, <8 x i16> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv8i16( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv8i16( %1, %3, %4) ret %5 } define @dupq_h_h() #0 { ; CHECK-LABEL: @dupq_h_h( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv8i1(i32 31) ; CHECK-NEXT: ret %1 %1 = tail call @llvm.aarch64.sve.ptrue.nxv8i1(i32 31) %2 = tail call @llvm.vector.insert.nxv8i16.v8i16( undef, <8 x i16> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv8i16( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv8i16( %1, %3, %4) ret %5 } ; DUPQ b32 define @dupq_w_0() #0 { ; CHECK-LABEL: @dupq_w_0( ; CHECK: ret zeroinitializer %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %3, %4) ret %5 } define @dupq_w_d() #0 { ; CHECK-LABEL: @dupq_w_d( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) ; CHECK-NEXT: %2 = call @llvm.aarch64.sve.convert.to.svbool.nxv2i1( %1) ; CHECK-NEXT: %3 = call @llvm.aarch64.sve.convert.from.svbool.nxv4i1( %2) ; CHECK-NEXT: ret %3 %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %3, %4) ret %5 } define @dupq_w_w() #0 { ; CHECK-LABEL: @dupq_w_w( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) ; CHECK-NEXT: ret %1 %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %3, %4) ret %5 } ; DUPQ b64 define @dupq_d_0() #0 { ; CHECK-LABEL: @dupq_d_0( ; CHECK: ret zeroinitializer %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } define @dupq_d_d() #0 { ; CHECK-LABEL: @dupq_d_d( ; CHECK: %1 = call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) ; CHECK-NEXT: ret %1 %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } ; Cases that cannot be converted define @dupq_neg1() #0 { ; CHECK-LABEL: @dupq_neg1( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } define @dupq_neg2() #0 { ; CHECK-LABEL: @dupq_neg2( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %3, %4) ret %5 } define @dupq_neg3() #0 { ; CHECK-LABEL: @dupq_neg3( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %3, %4) ret %5 } define @dupq_neg4() #0 { ; CHECK-LABEL: @dupq_neg4( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %3, %4) ret %5 } define @dupq_neg5() #0 { ; CHECK-LABEL: @dupq_neg5( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %3, %4) ret %5 } define @dupq_neg6(i1 %a) #0 { ; CHECK-LABEL: @dupq_neg6( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv4i1(i32 31) %2 = zext i1 %a to i32 %3 = insertelement <4 x i32> , i32 %2, i32 3 %4 = tail call @llvm.vector.insert.nxv4i32.v4i32( undef, <4 x i32> %3, i64 0) %5 = tail call @llvm.aarch64.sve.dupq.lane.nxv4i32( %4 , i64 0) %6 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %7 = tail call @llvm.aarch64.sve.cmpne.wide.nxv4i32( %1, %5, %6) ret %7 } define @dupq_neg7() #0 { ; CHECK-LABEL: @dupq_neg7( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 2) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } define @dupq_neg8() #0 { ; CHECK-LABEL: @dupq_neg8( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 1) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } define @dupq_neg9( %x) #0 { ; CHECK-LABEL: @dupq_neg9( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( %x, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } define @dupq_neg10() #0 { ; CHECK-LABEL: @dupq_neg10( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 1) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } define @dupq_neg11( %pg) #0 { ; CHECK-LABEL: @dupq_neg11( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %2 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %1 , i64 0) %3 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %4 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %pg, %2, %3) ret %4 } define @dupq_neg12() #0 { ; CHECK-LABEL: @dupq_neg12( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 15) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.dup.x.nxv2i64(i64 0) %5 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %4) ret %5 } define @dupq_neg13( %x) #0 { ; CHECK-LABEL: @dupq_neg13( ; CHECK: cmpne ; CHECK-NEXT: ret %1 = tail call @llvm.aarch64.sve.ptrue.nxv2i1(i32 31) %2 = tail call @llvm.vector.insert.nxv2i64.v2i64( undef, <2 x i64> , i64 0) %3 = tail call @llvm.aarch64.sve.dupq.lane.nxv2i64( %2 , i64 0) %4 = tail call @llvm.aarch64.sve.cmpne.nxv2i64( %1, %3, %x) ret %4 } declare @llvm.aarch64.sve.ptrue.nxv16i1(i32) declare @llvm.aarch64.sve.ptrue.nxv8i1(i32) declare @llvm.aarch64.sve.ptrue.nxv4i1(i32) declare @llvm.aarch64.sve.ptrue.nxv2i1(i32) declare @llvm.vector.insert.nxv16i8.v16i8(, <16 x i8>, i64) declare