bolt/deps/llvm-18.1.8/llvm/test/CodeGen/AMDGPU/minimummaximum.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=amdgcn -mcpu=gfx1200 -verify-machineinstrs < %s | FileCheck -check-prefixes=GFX12,SDAG %s
; RUN: llc -global-isel -mtriple=amdgcn -mcpu=gfx1200 -verify-machineinstrs < %s | FileCheck -check-prefixes=GFX12,GISEL %s

define amdgpu_ps float @test_minmax_f32(float %a, float %b, float %c) {
; GFX12-LABEL: test_minmax_f32:
; GFX12:       ; %bb.0:
; GFX12-NEXT:    v_maximumminimum_f32 v0, v0, v1, v2
; GFX12-NEXT:    ; return to shader part epilog
  %max = call float @llvm.maximum.f32(float %a, float %b)
  %minmax = call float @llvm.minimum.f32(float %max, float %c)
  ret float %minmax
}

define amdgpu_ps void @s_test_minmax_f32(float inreg %a, float inreg %b, float inreg %c, ptr addrspace(1) inreg %out) {
; SDAG-LABEL: s_test_minmax_f32:
; SDAG:       ; %bb.0:
; SDAG-NEXT:    s_maximum_f32 s0, s0, s1
; SDAG-NEXT:    s_mov_b32 s5, s4
; SDAG-NEXT:    s_mov_b32 s4, s3
; SDAG-NEXT:    s_delay_alu instid0(SALU_CYCLE_1) | instskip(NEXT) | instid1(SALU_CYCLE_3)
; SDAG-NEXT:    s_minimum_f32 s0, s0, s2
; SDAG-NEXT:    v_dual_mov_b32 v0, 0 :: v_dual_mov_b32 v1, s0
; SDAG-NEXT:    global_store_b32 v0, v1, s[4:5]
; SDAG-NEXT:    s_nop 0
; SDAG-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
; SDAG-NEXT:    s_endpgm
;
; GISEL-LABEL: s_test_minmax_f32:
; GISEL:       ; %bb.0:
; GISEL-NEXT:    s_maximum_f32 s0, s0, s1
; GISEL-NEXT:    s_mov_b32 s6, s3
; GISEL-NEXT:    s_mov_b32 s7, s4
; GISEL-NEXT:    v_mov_b32_e32 v1, 0
; GISEL-NEXT:    s_minimum_f32 s0, s0, s2
; GISEL-NEXT:    s_delay_alu instid0(SALU_CYCLE_3)
; GISEL-NEXT:    v_mov_b32_e32 v0, s0
; GISEL-NEXT:    global_store_b32 v1, v0, s[6:7]
; GISEL-NEXT:    s_nop 0
; GISEL-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
; GISEL-NEXT:    s_endpgm
  %smax = call float @llvm.maximum.f32(float %a, float %b)
  %sminmax = call float @llvm.minimum.f32(float %smax, float %c)
  store float %sminmax, ptr addrspace(1) %out
  ret void
}

define amdgpu_ps float @test_minmax_commuted_f32(float %a, float %b, float %c) {
; GFX12-LABEL: test_minmax_commuted_f32:
; GFX12:       ; %bb.0:
; GFX12-NEXT:    v_maximumminimum_f32 v0, v0, v1, v2
; GFX12-NEXT:    ; return to shader part epilog
  %max = call float @llvm.maximum.f32(float %a, float %b)
  %minmax = call float @llvm.minimum.f32(float %c, float %max)
  ret float %minmax
}

define amdgpu_ps float @test_maxmin_f32(float %a, float %b, float %c) {
; GFX12-LABEL: test_maxmin_f32:
; GFX12:       ; %bb.0:
; GFX12-NEXT:    v_minimummaximum_f32 v0, v0, v1, v2
; GFX12-NEXT:    ; return to shader part epilog
  %min = call float @llvm.minimum.f32(float %a, float %b)
  %maxmin = call float @llvm.maximum.f32(float %min, float %c)
  ret float %maxmin
}

define amdgpu_ps float @test_maxmin_commuted_f32(float %a, float %b, float %c) {
; GFX12-LABEL: test_maxmin_commuted_f32:
; GFX12:       ; %bb.0:
; GFX12-NEXT:    v_minimummaximum_f32 v0, v0, v1, v2
; GFX12-NEXT:    ; return to shader part epilog
  %min = call float @llvm.minimum.f32(float %a, float %b)
  %maxmin = call float @llvm.maximum.f32(float %c, float %min)
  ret float %maxmin
}

define amdgpu_ps half @test_minmax_f16(half %a, half %b, half %c) {
; GFX12-LABEL: test_minmax_f16:
; GFX12:       ; %bb.0:
; GFX12-NEXT:    v_maximumminimum_f16 v0, v0, v1, v2
; GFX12-NEXT:    ; return to shader part epilog
  %max = call half @llvm.maximum.f16(half %a, half %b)
  %minmax = call half @llvm.minimum.f16(half %max, half %c)
  ret half %minmax
}

define amdgpu_ps half @test_minmax_commuted_f16(half %a, half %b, half %c) {
; GFX12-LABEL: test_minmax_commuted_f16:
; GFX12:       ; %bb.0:
; GFX12-NEXT:    v_maximumminimum_f16 v0, v0, v1, v2
; GFX12-NEXT:    ; return to shader part epilog
  %max = call half @llvm.maximum.f16(half %a, half %b)
  %minmax = call half @llvm.minimum.f16(half %c, half %max)
  ret half %minmax
}

define amdgpu_ps half @test_maxmin_commuted_f16(half %a, half %b, half %c) {
; GFX12-LABEL: test_maxmin_commuted_f16:
; GFX12:       ; %bb.0:
; GFX12-NEXT:    v_minimummaximum_f16 v0, v0, v1, v2
; GFX12-NEXT:    ; return to shader part epilog
  %min = call half @llvm.minimum.f16(half %a, half %b)
  %maxmin = call half @llvm.maximum.f16(half %c, half %min)
  ret half %maxmin
}

define amdgpu_ps void @s_test_minmax_f16(half inreg %a, half inreg %b, half inreg %c, ptr addrspace(1) inreg %out) {
; SDAG-LABEL: s_test_minmax_f16:
; SDAG:       ; %bb.0:
; SDAG-NEXT:    s_maximum_f16 s0, s0, s1
; SDAG-NEXT:    s_mov_b32 s5, s4
; SDAG-NEXT:    s_mov_b32 s4, s3
; SDAG-NEXT:    s_delay_alu instid0(SALU_CYCLE_1) | instskip(NEXT) | instid1(SALU_CYCLE_3)
; SDAG-NEXT:    s_minimum_f16 s0, s0, s2
; SDAG-NEXT:    v_dual_mov_b32 v0, 0 :: v_dual_mov_b32 v1, s0
; SDAG-NEXT:    global_store_b16 v0, v1, s[4:5]
; SDAG-NEXT:    s_nop 0
; SDAG-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
; SDAG-NEXT:    s_endpgm
;
; GISEL-LABEL: s_test_minmax_f16:
; GISEL:       ; %bb.0:
; GISEL-NEXT:    s_maximum_f16 s0, s0, s1
; GISEL-NEXT:    s_mov_b32 s6, s3
; GISEL-NEXT:    s_mov_b32 s7, s4
; GISEL-NEXT:    v_mov_b32_e32 v1, 0
; GISEL-NEXT:    s_minimum_f16 s0, s0, s2
; GISEL-NEXT:    s_delay_alu instid0(SALU_CYCLE_3)
; GISEL-NEXT:    v_mov_b32_e32 v0, s0
; GISEL-NEXT:    global_store_b16 v1, v0, s[6:7]
; GISEL-NEXT:    s_nop 0
; GISEL-NEXT:    s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
; GISEL-NEXT:    s_endpgm
  %smax = call half @llvm.maximum.f16(half %a, half %b)
  %sminmax = call half @llvm.minimum.f16(half %smax, half %c)
  store half %sminmax, ptr addrspace(1) %out
  ret void
}

declare half @llvm.minimum.f16(half, half)
declare half @llvm.maximum.f16(half, half)
declare float @llvm.minimum.f32(float, float)
declare float @llvm.maximum.f32(float, float)
Embed LLVM 18.1.8 2025-02-14 19:21:04 +01:00			`; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py`
			`; RUN: llc -mtriple=amdgcn -mcpu=gfx1200 -verify-machineinstrs < %s \| FileCheck -check-prefixes=GFX12,SDAG %s`
			`; RUN: llc -global-isel -mtriple=amdgcn -mcpu=gfx1200 -verify-machineinstrs < %s \| FileCheck -check-prefixes=GFX12,GISEL %s`

			`define amdgpu_ps float @test_minmax_f32(float %a, float %b, float %c) {`
			`; GFX12-LABEL: test_minmax_f32:`
			`; GFX12: ; %bb.0:`
			`; GFX12-NEXT: v_maximumminimum_f32 v0, v0, v1, v2`
			`; GFX12-NEXT: ; return to shader part epilog`
			`%max = call float @llvm.maximum.f32(float %a, float %b)`
			`%minmax = call float @llvm.minimum.f32(float %max, float %c)`
			`ret float %minmax`
			`}`

			`define amdgpu_ps void @s_test_minmax_f32(float inreg %a, float inreg %b, float inreg %c, ptr addrspace(1) inreg %out) {`
			`; SDAG-LABEL: s_test_minmax_f32:`
			`; SDAG: ; %bb.0:`
			`; SDAG-NEXT: s_maximum_f32 s0, s0, s1`
			`; SDAG-NEXT: s_mov_b32 s5, s4`
			`; SDAG-NEXT: s_mov_b32 s4, s3`
			`; SDAG-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_3)`
			`; SDAG-NEXT: s_minimum_f32 s0, s0, s2`
			`; SDAG-NEXT: v_dual_mov_b32 v0, 0 :: v_dual_mov_b32 v1, s0`
			`; SDAG-NEXT: global_store_b32 v0, v1, s[4:5]`
			`; SDAG-NEXT: s_nop 0`
			`; SDAG-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)`
			`; SDAG-NEXT: s_endpgm`
			`;`
			`; GISEL-LABEL: s_test_minmax_f32:`
			`; GISEL: ; %bb.0:`
			`; GISEL-NEXT: s_maximum_f32 s0, s0, s1`
			`; GISEL-NEXT: s_mov_b32 s6, s3`
			`; GISEL-NEXT: s_mov_b32 s7, s4`
			`; GISEL-NEXT: v_mov_b32_e32 v1, 0`
			`; GISEL-NEXT: s_minimum_f32 s0, s0, s2`
			`; GISEL-NEXT: s_delay_alu instid0(SALU_CYCLE_3)`
			`; GISEL-NEXT: v_mov_b32_e32 v0, s0`
			`; GISEL-NEXT: global_store_b32 v1, v0, s[6:7]`
			`; GISEL-NEXT: s_nop 0`
			`; GISEL-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)`
			`; GISEL-NEXT: s_endpgm`
			`%smax = call float @llvm.maximum.f32(float %a, float %b)`
			`%sminmax = call float @llvm.minimum.f32(float %smax, float %c)`
			`store float %sminmax, ptr addrspace(1) %out`
			`ret void`
			`}`

			`define amdgpu_ps float @test_minmax_commuted_f32(float %a, float %b, float %c) {`
			`; GFX12-LABEL: test_minmax_commuted_f32:`
			`; GFX12: ; %bb.0:`
			`; GFX12-NEXT: v_maximumminimum_f32 v0, v0, v1, v2`
			`; GFX12-NEXT: ; return to shader part epilog`
			`%max = call float @llvm.maximum.f32(float %a, float %b)`
			`%minmax = call float @llvm.minimum.f32(float %c, float %max)`
			`ret float %minmax`
			`}`

			`define amdgpu_ps float @test_maxmin_f32(float %a, float %b, float %c) {`
			`; GFX12-LABEL: test_maxmin_f32:`
			`; GFX12: ; %bb.0:`
			`; GFX12-NEXT: v_minimummaximum_f32 v0, v0, v1, v2`
			`; GFX12-NEXT: ; return to shader part epilog`
			`%min = call float @llvm.minimum.f32(float %a, float %b)`
			`%maxmin = call float @llvm.maximum.f32(float %min, float %c)`
			`ret float %maxmin`
			`}`

			`define amdgpu_ps float @test_maxmin_commuted_f32(float %a, float %b, float %c) {`
			`; GFX12-LABEL: test_maxmin_commuted_f32:`
			`; GFX12: ; %bb.0:`
			`; GFX12-NEXT: v_minimummaximum_f32 v0, v0, v1, v2`
			`; GFX12-NEXT: ; return to shader part epilog`
			`%min = call float @llvm.minimum.f32(float %a, float %b)`
			`%maxmin = call float @llvm.maximum.f32(float %c, float %min)`
			`ret float %maxmin`
			`}`

			`define amdgpu_ps half @test_minmax_f16(half %a, half %b, half %c) {`
			`; GFX12-LABEL: test_minmax_f16:`
			`; GFX12: ; %bb.0:`
			`; GFX12-NEXT: v_maximumminimum_f16 v0, v0, v1, v2`
			`; GFX12-NEXT: ; return to shader part epilog`
			`%max = call half @llvm.maximum.f16(half %a, half %b)`
			`%minmax = call half @llvm.minimum.f16(half %max, half %c)`
			`ret half %minmax`
			`}`

			`define amdgpu_ps half @test_minmax_commuted_f16(half %a, half %b, half %c) {`
			`; GFX12-LABEL: test_minmax_commuted_f16:`
			`; GFX12: ; %bb.0:`
			`; GFX12-NEXT: v_maximumminimum_f16 v0, v0, v1, v2`
			`; GFX12-NEXT: ; return to shader part epilog`
			`%max = call half @llvm.maximum.f16(half %a, half %b)`
			`%minmax = call half @llvm.minimum.f16(half %c, half %max)`
			`ret half %minmax`
			`}`

			`define amdgpu_ps half @test_maxmin_commuted_f16(half %a, half %b, half %c) {`
			`; GFX12-LABEL: test_maxmin_commuted_f16:`
			`; GFX12: ; %bb.0:`
			`; GFX12-NEXT: v_minimummaximum_f16 v0, v0, v1, v2`
			`; GFX12-NEXT: ; return to shader part epilog`
			`%min = call half @llvm.minimum.f16(half %a, half %b)`
			`%maxmin = call half @llvm.maximum.f16(half %c, half %min)`
			`ret half %maxmin`
			`}`

			`define amdgpu_ps void @s_test_minmax_f16(half inreg %a, half inreg %b, half inreg %c, ptr addrspace(1) inreg %out) {`
			`; SDAG-LABEL: s_test_minmax_f16:`
			`; SDAG: ; %bb.0:`
			`; SDAG-NEXT: s_maximum_f16 s0, s0, s1`
			`; SDAG-NEXT: s_mov_b32 s5, s4`
			`; SDAG-NEXT: s_mov_b32 s4, s3`
			`; SDAG-NEXT: s_delay_alu instid0(SALU_CYCLE_1) \| instskip(NEXT) \| instid1(SALU_CYCLE_3)`
			`; SDAG-NEXT: s_minimum_f16 s0, s0, s2`
			`; SDAG-NEXT: v_dual_mov_b32 v0, 0 :: v_dual_mov_b32 v1, s0`
			`; SDAG-NEXT: global_store_b16 v0, v1, s[4:5]`
			`; SDAG-NEXT: s_nop 0`
			`; SDAG-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)`
			`; SDAG-NEXT: s_endpgm`
			`;`
			`; GISEL-LABEL: s_test_minmax_f16:`
			`; GISEL: ; %bb.0:`
			`; GISEL-NEXT: s_maximum_f16 s0, s0, s1`
			`; GISEL-NEXT: s_mov_b32 s6, s3`
			`; GISEL-NEXT: s_mov_b32 s7, s4`
			`; GISEL-NEXT: v_mov_b32_e32 v1, 0`
			`; GISEL-NEXT: s_minimum_f16 s0, s0, s2`
			`; GISEL-NEXT: s_delay_alu instid0(SALU_CYCLE_3)`
			`; GISEL-NEXT: v_mov_b32_e32 v0, s0`
			`; GISEL-NEXT: global_store_b16 v1, v0, s[6:7]`
			`; GISEL-NEXT: s_nop 0`
			`; GISEL-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)`
			`; GISEL-NEXT: s_endpgm`
			`%smax = call half @llvm.maximum.f16(half %a, half %b)`
			`%sminmax = call half @llvm.minimum.f16(half %smax, half %c)`
			`store half %sminmax, ptr addrspace(1) %out`
			`ret void`
			`}`

			`declare half @llvm.minimum.f16(half, half)`
			`declare half @llvm.maximum.f16(half, half)`
			`declare float @llvm.minimum.f32(float, float)`
			`declare float @llvm.maximum.f32(float, float)`