; NOTE: Assertions have been autogenerated by utils/update_test_checks.py ; RUN: opt -S -passes=instcombine < %s | FileCheck %s target triple = "aarch64-unknown-linux-gnu" ; fadd(a, fmul(b, c)) -> fmla(a, b, c) define @combine_fmuladd_1( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_1( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmla.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.nxv8f16( %p, %a, %1) ret %2 } ; fadd(a, fmul_u(b, c)) -> fmla(a, b, c) define @combine_fmuladd_2( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_2( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmla.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.nxv8f16( %p, %a, %1) ret %2 } ; fadd_u(a, fmul_u(b, c)) -> fmla_u(a, b, c) define @combine_fmuladd_3( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_3( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmla.u.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.u.nxv8f16( %p, %a, %1) ret %2 } ; TODO: Missing combine! ; fadd_u(a, fmul(b, c)) -> fmla_u(a, b, c) define @combine_fmuladd_4( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_4( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmla.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.u.nxv8f16( %p, %a, %1) ret %2 } ; fadd(fmul(b, c), a) -> fmad(b, c, a) define @combine_fmuladd_5( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_5( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmad.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.nxv8f16( %p, %1, %a) ret %2 } ; TODO: Missing combine! ; fadd(fmul_u(b, c), a) -> fmla_u(a, b, c) define @combine_fmuladd_6( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_6( ; CHECK-NEXT: [[TMP1:%.*]] = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: [[TMP2:%.*]] = tail call fast @llvm.aarch64.sve.fadd.nxv8f16( [[P]], [[TMP1]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP2]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.nxv8f16( %p, %1, %a) ret %2 } ; TODO: Missing combine! ; fadd_u(fmul_u(b, c), a) -> fmla_u(a, b, c) define @combine_fmuladd_7( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_7( ; CHECK-NEXT: [[TMP1:%.*]] = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: [[TMP2:%.*]] = tail call fast @llvm.aarch64.sve.fadd.u.nxv8f16( [[P]], [[TMP1]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP2]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.u.nxv8f16( %p, %1, %a) ret %2 } ; TODO: Missing combine! ; fadd_u(fmul(b, c), a) -> fmla_u(a, b, c) define @combine_fmuladd_8( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmuladd_8( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmad.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fadd.u.nxv8f16( %p, %1, %a) ret %2 } ; fsub(a, fmul(b, c)) -> fmls(a, b, c) define @combine_fmulsub_1( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_1( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmls.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.nxv8f16( %p, %a, %1) ret %2 } define @combine_fmulsub_2( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_2( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmls.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.nxv8f16( %p, %a, %1) ret %2 } ; fsub_u(a, fmul_u(b, c)) -> fmls_u(a, b, c) define @combine_fmulsub_3( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_3( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmls.u.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.u.nxv8f16( %p, %a, %1) ret %2 } ; TODO: Missing combine! ; fsub_u(a, fmul(b, c)) -> fmls_u(a, b, c) define @combine_fmulsub_4( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_4( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fmls.nxv8f16( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.u.nxv8f16( %p, %a, %1) ret %2 } ; fsub(mul(b, c), a) -> fnmsb(b, c, a) define @combine_fmulsub_5( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_5( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fnmsb.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.nxv8f16( %p, %1, %a) ret %2 } ; TODO: Missing combine! ; fsub(fmul_u(b, c), a) -> fnmls_u(a, b, c) define @combine_fmulsub_6( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_6( ; CHECK-NEXT: [[TMP1:%.*]] = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: [[TMP2:%.*]] = tail call fast @llvm.aarch64.sve.fsub.nxv8f16( [[P]], [[TMP1]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP2]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.nxv8f16( %p, %1, %a) ret %2 } ; TODO: Missing combine! ; fsub_u(fmul_u(b, c), a) -> fnmls_u(a, b, c) define @combine_fmulsub_7( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_7( ; CHECK-NEXT: [[TMP1:%.*]] = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: [[TMP2:%.*]] = tail call fast @llvm.aarch64.sve.fsub.u.nxv8f16( [[P]], [[TMP1]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP2]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.u.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.u.nxv8f16( %p, %1, %a) ret %2 } ; TODO: Missing combine! ; fsub_u(fmul(b, c), a) -> fnmls_u(a, b, c) define @combine_fmulsub_8( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_fmulsub_8( ; CHECK-NEXT: [[TMP1:%.*]] = call fast @llvm.aarch64.sve.fnmsb.nxv8f16( [[P:%.*]], [[B:%.*]], [[C:%.*]], [[A:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call fast @llvm.aarch64.sve.fmul.nxv8f16( %p, %b, %c) %2 = tail call fast @llvm.aarch64.sve.fsub.u.nxv8f16( %p, %1, %a) ret %2 } ; add(a, mul(b, c)) -> mla(a, b, c) define @combine_muladd_1( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_muladd_1( ; CHECK-NEXT: [[TMP1:%.*]] = call @llvm.aarch64.sve.mla.nxv16i8( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call @llvm.aarch64.sve.mul.nxv16i8( %p, %b, %c) %2 = tail call @llvm.aarch64.sve.add.nxv16i8( %p, %a, %1) ret %2 } ; TODO: Missing combine! ; add(a, mul_u(b, c)) -> mla(a, b, c) define @combine_muladd_2( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_muladd_2( ; CHECK-NEXT: [[TMP1:%.*]] = tail call @llvm.aarch64.sve.mul.u.nxv16i8( [[P:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: [[TMP2:%.*]] = tail call @llvm.aarch64.sve.add.nxv16i8( [[P]], [[A:%.*]], [[TMP1]]) ; CHECK-NEXT: ret [[TMP2]] ; %1 = tail call @llvm.aarch64.sve.mul.u.nxv16i8( %p, %b, %c) %2 = tail call @llvm.aarch64.sve.add.nxv16i8( %p, %a, %1) ret %2 } ; add_u(a, mul_u(b, c)) -> mla_u(a, b, c) define @combine_muladd_3( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_muladd_3( ; CHECK-NEXT: [[TMP1:%.*]] = call @llvm.aarch64.sve.mla.u.nxv16i8( [[P:%.*]], [[A:%.*]], [[B:%.*]], [[C:%.*]]) ; CHECK-NEXT: ret [[TMP1]] ; %1 = tail call @llvm.aarch64.sve.mul.u.nxv16i8( %p, %b, %c) %2 = tail call @llvm.aarch64.sve.add.u.nxv16i8( %p, %a, %1) ret %2 } ; TODO: Missing combine! ; add_u(a, mul(b, c)) -> mla_u(a, b, c) define @combine_muladd_4( %p, %a, %b, %c) #0 { ; CHECK-LABEL: @combine_muladd_4( ; CHECK-NEXT: [[TMP1:%.*]] = tail call