bolt/deps/llvm-18.1.8/llvm/test/CodeGen/ARM/vecreduce-minmax.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=armv7-none-eabi -float-abi=hard -mattr=+neon -verify-machineinstrs | FileCheck %s

define i8 @test_umin_v8i8(<8 x i8> %x) {
; CHECK-LABEL: test_umin_v8i8:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.u8 d16, d0, d0
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vmov.u8 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i8 @llvm.vector.reduce.umin.v8i8(<8 x i8> %x)
  ret i8 %z
}

define i8 @test_smin_v8i8(<8 x i8> %x) {
; CHECK-LABEL: test_smin_v8i8:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.s8 d16, d0, d0
; CHECK-NEXT:    vpmin.s8 d16, d16, d16
; CHECK-NEXT:    vpmin.s8 d16, d16, d16
; CHECK-NEXT:    vmov.s8 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i8 @llvm.vector.reduce.smin.v8i8(<8 x i8> %x)
  ret i8 %z
}

define i8 @test_umax_v8i8(<8 x i8> %x) {
; CHECK-LABEL: test_umax_v8i8:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmax.u8 d16, d0, d0
; CHECK-NEXT:    vpmax.u8 d16, d16, d16
; CHECK-NEXT:    vpmax.u8 d16, d16, d16
; CHECK-NEXT:    vmov.u8 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i8 @llvm.vector.reduce.umax.v8i8(<8 x i8> %x)
  ret i8 %z
}

define i8 @test_smax_v8i8(<8 x i8> %x) {
; CHECK-LABEL: test_smax_v8i8:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmax.s8 d16, d0, d0
; CHECK-NEXT:    vpmax.s8 d16, d16, d16
; CHECK-NEXT:    vpmax.s8 d16, d16, d16
; CHECK-NEXT:    vmov.s8 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i8 @llvm.vector.reduce.smax.v8i8(<8 x i8> %x)
  ret i8 %z
}

define i16 @test_umin_v4i16(<4 x i16> %x) {
; CHECK-LABEL: test_umin_v4i16:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.u16 d16, d0, d0
; CHECK-NEXT:    vpmin.u16 d16, d16, d16
; CHECK-NEXT:    vmov.u16 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %x)
  ret i16 %z
}

define i16 @test_smin_v4i16(<4 x i16> %x) {
; CHECK-LABEL: test_smin_v4i16:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.s16 d16, d0, d0
; CHECK-NEXT:    vpmin.s16 d16, d16, d16
; CHECK-NEXT:    vmov.s16 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i16 @llvm.vector.reduce.smin.v4i16(<4 x i16> %x)
  ret i16 %z
}

define i16 @test_umax_v4i16(<4 x i16> %x) {
; CHECK-LABEL: test_umax_v4i16:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmax.u16 d16, d0, d0
; CHECK-NEXT:    vpmax.u16 d16, d16, d16
; CHECK-NEXT:    vmov.u16 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i16 @llvm.vector.reduce.umax.v4i16(<4 x i16> %x)
  ret i16 %z
}

define i16 @test_smax_v4i16(<4 x i16> %x) {
; CHECK-LABEL: test_smax_v4i16:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmax.s16 d16, d0, d0
; CHECK-NEXT:    vpmax.s16 d16, d16, d16
; CHECK-NEXT:    vmov.s16 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i16 @llvm.vector.reduce.smax.v4i16(<4 x i16> %x)
  ret i16 %z
}

define i32 @test_umin_v2i32(<2 x i32> %x) {
; CHECK-LABEL: test_umin_v2i32:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.u32 d16, d0, d0
; CHECK-NEXT:    vmov.32 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i32 @llvm.vector.reduce.umin.v2i32(<2 x i32> %x)
  ret i32 %z
}

define i32 @test_smin_v2i32(<2 x i32> %x) {
; CHECK-LABEL: test_smin_v2i32:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.s32 d16, d0, d0
; CHECK-NEXT:    vmov.32 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i32 @llvm.vector.reduce.smin.v2i32(<2 x i32> %x)
  ret i32 %z
}

define i32 @test_umax_v2i32(<2 x i32> %x) {
; CHECK-LABEL: test_umax_v2i32:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmax.u32 d16, d0, d0
; CHECK-NEXT:    vmov.32 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i32 @llvm.vector.reduce.umax.v2i32(<2 x i32> %x)
  ret i32 %z
}

define i32 @test_smax_v2i32(<2 x i32> %x) {
; CHECK-LABEL: test_smax_v2i32:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmax.s32 d16, d0, d0
; CHECK-NEXT:    vmov.32 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i32 @llvm.vector.reduce.smax.v2i32(<2 x i32> %x)
  ret i32 %z
}

define i8 @test_umin_v16i8(<16 x i8> %x) {
; CHECK-LABEL: test_umin_v16i8:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.u8 d16, d0, d1
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vmov.u8 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i8 @llvm.vector.reduce.umin.v16i8(<16 x i8> %x)
  ret i8 %z
}

define i16 @test_smin_v8i16(<8 x i16> %x) {
; CHECK-LABEL: test_smin_v8i16:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmin.s16 d16, d0, d1
; CHECK-NEXT:    vpmin.s16 d16, d16, d16
; CHECK-NEXT:    vpmin.s16 d16, d16, d16
; CHECK-NEXT:    vmov.s16 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i16 @llvm.vector.reduce.smin.v8i16(<8 x i16> %x)
  ret i16 %z
}

define i32 @test_umax_v4i32(<4 x i32> %x) {
; CHECK-LABEL: test_umax_v4i32:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vpmax.u32 d16, d0, d1
; CHECK-NEXT:    vpmax.u32 d16, d16, d16
; CHECK-NEXT:    vmov.32 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i32 @llvm.vector.reduce.umax.v4i32(<4 x i32> %x)
  ret i32 %z
}

define i8 @test_umin_v32i8(<32 x i8> %x) {
; CHECK-LABEL: test_umin_v32i8:
; CHECK:       @ %bb.0: @ %entry
; CHECK-NEXT:    vmin.u8 q8, q0, q1
; CHECK-NEXT:    vpmin.u8 d16, d16, d17
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vpmin.u8 d16, d16, d16
; CHECK-NEXT:    vmov.u8 r0, d16[0]
; CHECK-NEXT:    bx lr
entry:
  %z = call i8 @llvm.vector.reduce.umin.v32i8(<32 x i8> %x)
  ret i8 %z
}

declare i8 @llvm.vector.reduce.umin.v8i8(<8 x i8>)
declare i8 @llvm.vector.reduce.smin.v8i8(<8 x i8>)
declare i8 @llvm.vector.reduce.umax.v8i8(<8 x i8>)
declare i8 @llvm.vector.reduce.smax.v8i8(<8 x i8>)
declare i16 @llvm.vector.reduce.umin.v4i16(<4 x i16>)
declare i16 @llvm.vector.reduce.smin.v4i16(<4 x i16>)
declare i16 @llvm.vector.reduce.umax.v4i16(<4 x i16>)
declare i16 @llvm.vector.reduce.smax.v4i16(<4 x i16>)
declare i32 @llvm.vector.reduce.umin.v2i32(<2 x i32>)
declare i32 @llvm.vector.reduce.smin.v2i32(<2 x i32>)
declare i32 @llvm.vector.reduce.umax.v2i32(<2 x i32>)
declare i32 @llvm.vector.reduce.smax.v2i32(<2 x i32>)

declare i8 @llvm.vector.reduce.umin.v16i8(<16 x i8>)
declare i16 @llvm.vector.reduce.smin.v8i16(<8 x i16>)
declare i32 @llvm.vector.reduce.umax.v4i32(<4 x i32>)

declare i8 @llvm.vector.reduce.umin.v32i8(<32 x i8>)
Embed LLVM 18.1.8 2025-02-14 19:21:04 +01:00			`; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py`
			`; RUN: llc < %s -mtriple=armv7-none-eabi -float-abi=hard -mattr=+neon -verify-machineinstrs \| FileCheck %s`

			`define i8 @test_umin_v8i8(<8 x i8> %x) {`
			`; CHECK-LABEL: test_umin_v8i8:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.u8 d16, d0, d0`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vmov.u8 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i8 @llvm.vector.reduce.umin.v8i8(<8 x i8> %x)`
			`ret i8 %z`
			`}`

			`define i8 @test_smin_v8i8(<8 x i8> %x) {`
			`; CHECK-LABEL: test_smin_v8i8:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.s8 d16, d0, d0`
			`; CHECK-NEXT: vpmin.s8 d16, d16, d16`
			`; CHECK-NEXT: vpmin.s8 d16, d16, d16`
			`; CHECK-NEXT: vmov.s8 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i8 @llvm.vector.reduce.smin.v8i8(<8 x i8> %x)`
			`ret i8 %z`
			`}`

			`define i8 @test_umax_v8i8(<8 x i8> %x) {`
			`; CHECK-LABEL: test_umax_v8i8:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmax.u8 d16, d0, d0`
			`; CHECK-NEXT: vpmax.u8 d16, d16, d16`
			`; CHECK-NEXT: vpmax.u8 d16, d16, d16`
			`; CHECK-NEXT: vmov.u8 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i8 @llvm.vector.reduce.umax.v8i8(<8 x i8> %x)`
			`ret i8 %z`
			`}`

			`define i8 @test_smax_v8i8(<8 x i8> %x) {`
			`; CHECK-LABEL: test_smax_v8i8:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmax.s8 d16, d0, d0`
			`; CHECK-NEXT: vpmax.s8 d16, d16, d16`
			`; CHECK-NEXT: vpmax.s8 d16, d16, d16`
			`; CHECK-NEXT: vmov.s8 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i8 @llvm.vector.reduce.smax.v8i8(<8 x i8> %x)`
			`ret i8 %z`
			`}`

			`define i16 @test_umin_v4i16(<4 x i16> %x) {`
			`; CHECK-LABEL: test_umin_v4i16:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.u16 d16, d0, d0`
			`; CHECK-NEXT: vpmin.u16 d16, d16, d16`
			`; CHECK-NEXT: vmov.u16 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %x)`
			`ret i16 %z`
			`}`

			`define i16 @test_smin_v4i16(<4 x i16> %x) {`
			`; CHECK-LABEL: test_smin_v4i16:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.s16 d16, d0, d0`
			`; CHECK-NEXT: vpmin.s16 d16, d16, d16`
			`; CHECK-NEXT: vmov.s16 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i16 @llvm.vector.reduce.smin.v4i16(<4 x i16> %x)`
			`ret i16 %z`
			`}`

			`define i16 @test_umax_v4i16(<4 x i16> %x) {`
			`; CHECK-LABEL: test_umax_v4i16:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmax.u16 d16, d0, d0`
			`; CHECK-NEXT: vpmax.u16 d16, d16, d16`
			`; CHECK-NEXT: vmov.u16 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i16 @llvm.vector.reduce.umax.v4i16(<4 x i16> %x)`
			`ret i16 %z`
			`}`

			`define i16 @test_smax_v4i16(<4 x i16> %x) {`
			`; CHECK-LABEL: test_smax_v4i16:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmax.s16 d16, d0, d0`
			`; CHECK-NEXT: vpmax.s16 d16, d16, d16`
			`; CHECK-NEXT: vmov.s16 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i16 @llvm.vector.reduce.smax.v4i16(<4 x i16> %x)`
			`ret i16 %z`
			`}`

			`define i32 @test_umin_v2i32(<2 x i32> %x) {`
			`; CHECK-LABEL: test_umin_v2i32:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.u32 d16, d0, d0`
			`; CHECK-NEXT: vmov.32 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i32 @llvm.vector.reduce.umin.v2i32(<2 x i32> %x)`
			`ret i32 %z`
			`}`

			`define i32 @test_smin_v2i32(<2 x i32> %x) {`
			`; CHECK-LABEL: test_smin_v2i32:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.s32 d16, d0, d0`
			`; CHECK-NEXT: vmov.32 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i32 @llvm.vector.reduce.smin.v2i32(<2 x i32> %x)`
			`ret i32 %z`
			`}`

			`define i32 @test_umax_v2i32(<2 x i32> %x) {`
			`; CHECK-LABEL: test_umax_v2i32:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmax.u32 d16, d0, d0`
			`; CHECK-NEXT: vmov.32 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i32 @llvm.vector.reduce.umax.v2i32(<2 x i32> %x)`
			`ret i32 %z`
			`}`

			`define i32 @test_smax_v2i32(<2 x i32> %x) {`
			`; CHECK-LABEL: test_smax_v2i32:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmax.s32 d16, d0, d0`
			`; CHECK-NEXT: vmov.32 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i32 @llvm.vector.reduce.smax.v2i32(<2 x i32> %x)`
			`ret i32 %z`
			`}`

			`define i8 @test_umin_v16i8(<16 x i8> %x) {`
			`; CHECK-LABEL: test_umin_v16i8:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.u8 d16, d0, d1`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vmov.u8 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i8 @llvm.vector.reduce.umin.v16i8(<16 x i8> %x)`
			`ret i8 %z`
			`}`

			`define i16 @test_smin_v8i16(<8 x i16> %x) {`
			`; CHECK-LABEL: test_smin_v8i16:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmin.s16 d16, d0, d1`
			`; CHECK-NEXT: vpmin.s16 d16, d16, d16`
			`; CHECK-NEXT: vpmin.s16 d16, d16, d16`
			`; CHECK-NEXT: vmov.s16 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i16 @llvm.vector.reduce.smin.v8i16(<8 x i16> %x)`
			`ret i16 %z`
			`}`

			`define i32 @test_umax_v4i32(<4 x i32> %x) {`
			`; CHECK-LABEL: test_umax_v4i32:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vpmax.u32 d16, d0, d1`
			`; CHECK-NEXT: vpmax.u32 d16, d16, d16`
			`; CHECK-NEXT: vmov.32 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i32 @llvm.vector.reduce.umax.v4i32(<4 x i32> %x)`
			`ret i32 %z`
			`}`

			`define i8 @test_umin_v32i8(<32 x i8> %x) {`
			`; CHECK-LABEL: test_umin_v32i8:`
			`; CHECK: @ %bb.0: @ %entry`
			`; CHECK-NEXT: vmin.u8 q8, q0, q1`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d17`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vpmin.u8 d16, d16, d16`
			`; CHECK-NEXT: vmov.u8 r0, d16[0]`
			`; CHECK-NEXT: bx lr`
			`entry:`
			`%z = call i8 @llvm.vector.reduce.umin.v32i8(<32 x i8> %x)`
			`ret i8 %z`
			`}`

			`declare i8 @llvm.vector.reduce.umin.v8i8(<8 x i8>)`
			`declare i8 @llvm.vector.reduce.smin.v8i8(<8 x i8>)`
			`declare i8 @llvm.vector.reduce.umax.v8i8(<8 x i8>)`
			`declare i8 @llvm.vector.reduce.smax.v8i8(<8 x i8>)`
			`declare i16 @llvm.vector.reduce.umin.v4i16(<4 x i16>)`
			`declare i16 @llvm.vector.reduce.smin.v4i16(<4 x i16>)`
			`declare i16 @llvm.vector.reduce.umax.v4i16(<4 x i16>)`
			`declare i16 @llvm.vector.reduce.smax.v4i16(<4 x i16>)`
			`declare i32 @llvm.vector.reduce.umin.v2i32(<2 x i32>)`
			`declare i32 @llvm.vector.reduce.smin.v2i32(<2 x i32>)`
			`declare i32 @llvm.vector.reduce.umax.v2i32(<2 x i32>)`
			`declare i32 @llvm.vector.reduce.smax.v2i32(<2 x i32>)`

			`declare i8 @llvm.vector.reduce.umin.v16i8(<16 x i8>)`
			`declare i16 @llvm.vector.reduce.smin.v8i16(<8 x i16>)`
			`declare i32 @llvm.vector.reduce.umax.v4i32(<4 x i32>)`

			`declare i8 @llvm.vector.reduce.umin.v32i8(<32 x i8>)`