12700k HPC+OpenCL AVX512 performance profiling

Intel Core i7-12700K testing with a MSI PRO Z690-A DDR4(MS-7D25) v1.0 (1.15 BIOS) and Gigabyte AMD Radeon RX 5600 OEM/5600 XT / 5700/5700 6GB on Pop 21.04 via the Phoronix Test Suite.

HTML result view exported from: https://openbenchmarking.org/result/2112125-TJ-12700KHPC62&grr&sro.

RELION

Test: Basic - Device: CPU

Caffe

Model: GoogleNet - Acceleration: CPU - Iterations: 1000

OpenFOAM

Input: Motorbike 60M

HPL Linpack

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Max SP Flops

LeelaChessZero

Backend: BLAS

Caffe

Model: AlexNet - Acceleration: CPU - Iterations: 1000

Caffe

Model: GoogleNet - Acceleration: CPU - Iterations: 100

FFTW

Build: Float + SSE - Size: 2D FFT Size 4096

Parboil

Test: OpenMP MRI Gridding

GROMACS

Implementation: MPI CPU - Input: water_GMX50_bare

Caffe

Model: GoogleNet - Acceleration: CPU - Iterations: 200

OpenFOAM

Input: Motorbike 30M

oneDNN

Harness: Recurrent Neural Network Inference - Data Type: f32 - Engine: CPU

CP2K Molecular Dynamics

Input: Fayalite-FIST

Numpy Benchmark

Parboil

Test: OpenMP LBM

FFTW

Build: Stock - Size: 2D FFT Size 4096

TensorFlow Lite

Model: Inception V4

Intel MPI Benchmarks

Test: IMB-MPI1 Exchange

Intel MPI Benchmarks

Test: IMB-MPI1 Exchange

TensorFlow Lite

Model: Inception ResNet V2

oneDNN

Harness: Deconvolution Batch shapes_1d - Data Type: f32 - Engine: CPU

Timed HMMer Search

Pfam Database Search

oneDNN

Harness: Recurrent Neural Network Training - Data Type: u8s8f32 - Engine: CPU

oneDNN

Harness: Recurrent Neural Network Training - Data Type: bf16bf16bf16 - Engine: CPU

oneDNN

Harness: Recurrent Neural Network Training - Data Type: f32 - Engine: CPU

oneDNN

Harness: Recurrent Neural Network Inference - Data Type: u8s8f32 - Engine: CPU

oneDNN

Harness: Recurrent Neural Network Inference - Data Type: bf16bf16bf16 - Engine: CPU

Timed MrBayes Analysis

Primate Phylogeny Analysis

Pennant

Test: sedovbig

ASKAP

Test: tConvolve MT - Degridding

ASKAP

Test: tConvolve MT - Gridding

NAMD

ATPase Simulation - 327,506 Atoms

TensorFlow Lite

Model: Mobilenet Quant

TensorFlow Lite

Model: SqueezeNet

TensorFlow Lite

Model: NASNet Mobile

TensorFlow Lite

Model: Mobilenet Float

Darmstadt Automotive Parallel Heterogeneous Suite

Backend: OpenMP - Kernel: Points2Image

Himeno Benchmark

Poisson Pressure Solver

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: S3D

QMCPACK

Input: simple-H2O

Pennant

Test: leblancbig

Caffe

Model: AlexNet - Acceleration: CPU - Iterations: 200

ACES DGEMM

Sustained Floating-Point Rate

miniFE

Problem Size: Small

R Benchmark

DeepSpeech

Acceleration: CPU

ASKAP

Test: tConvolve MPI - Gridding

ASKAP

Test: tConvolve MPI - Degridding

oneDNN

Harness: IP Shapes 3D - Data Type: f32 - Engine: CPU

Caffe

Model: AlexNet - Acceleration: CPU - Iterations: 100

oneDNN

Harness: Deconvolution Batch shapes_1d - Data Type: bf16bf16bf16 - Engine: CPU

oneDNN

Harness: Deconvolution Batch shapes_1d - Data Type: u8s8f32 - Engine: CPU

Intel MPI Benchmarks

Test: IMB-MPI1 PingPong

oneDNN

Harness: IP Shapes 1D - Data Type: bf16bf16bf16 - Engine: CPU

oneDNN

Harness: IP Shapes 3D - Data Type: bf16bf16bf16 - Engine: CPU

oneDNN

Harness: Matrix Multiply Batch Shapes Transformer - Data Type: u8s8f32 - Engine: CPU

Darmstadt Automotive Parallel Heterogeneous Suite

Backend: OpenMP - Kernel: NDT Mapping

Intel MPI Benchmarks

Test: IMB-MPI1 Sendrecv

Intel MPI Benchmarks

Test: IMB-MPI1 Sendrecv

RNNoise

Intel MPI Benchmarks

Test: IMB-P2P PingPong

Parboil

Test: OpenMP Stencil

ArrayFire

Test: BLAS CPU

oneDNN

Harness: Deconvolution Batch shapes_3d - Data Type: bf16bf16bf16 - Engine: CPU

oneDNN

Harness: IP Shapes 1D - Data Type: f32 - Engine: CPU

oneDNN

Harness: IP Shapes 1D - Data Type: u8s8f32 - Engine: CPU

Algebraic Multi-Grid Benchmark

oneDNN

Harness: Deconvolution Batch shapes_3d - Data Type: u8s8f32 - Engine: CPU

Darmstadt Automotive Parallel Heterogeneous Suite

Backend: OpenMP - Kernel: Euclidean Cluster

ASKAP

Test: Hogbom Clean OpenMP

oneDNN

Harness: Matrix Multiply Batch Shapes Transformer - Data Type: f32 - Engine: CPU

oneDNN

Harness: Matrix Multiply Batch Shapes Transformer - Data Type: bf16bf16bf16 - Engine: CPU

LULESH

oneDNN

Harness: IP Shapes 3D - Data Type: u8s8f32 - Engine: CPU

oneDNN

Harness: Deconvolution Batch shapes_3d - Data Type: f32 - Engine: CPU

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Texture Read Bandwidth

ASKAP

Test: tConvolve OpenMP - Degridding

ASKAP

Test: tConvolve OpenMP - Gridding

GNU Octave Benchmark

Timed MAFFT Alignment

Multiple Sequence Alignment - LSU RNA

FFTW

Build: Float + SSE - Size: 1D FFT Size 4096

cl-mem

Benchmark: Copy

cl-mem

Benchmark: Read

cl-mem

Benchmark: Write

oneDNN

Harness: Convolution Batch Shapes Auto - Data Type: f32 - Engine: CPU

oneDNN

Harness: Convolution Batch Shapes Auto - Data Type: u8s8f32 - Engine: CPU

oneDNN

Harness: Convolution Batch Shapes Auto - Data Type: bf16bf16bf16 - Engine: CPU

Darktable

Test: Boat - Acceleration: OpenCL

Darktable

Test: Masskrug - Acceleration: OpenCL

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: GEMM SGEMM_N

Darktable

Test: Server Room - Acceleration: OpenCL

FFTW

Build: Stock - Size: 1D FFT Size 4096

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Bus Speed Readback

FFTW

Build: Stock - Size: 2D FFT Size 32

FFTW

Build: Stock - Size: 1D FFT Size 32

Parboil

Test: OpenMP CUTCP

FFTW

Build: Float + SSE - Size: 1D FFT Size 32

FFTW

Build: Float + SSE - Size: 2D FFT Size 32

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Triad

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: MD5 Hash

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Reduction

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: FFT SP

Darktable

Test: Server Rack - Acceleration: OpenCL

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Bus Speed Download

Phoronix Test Suite v10.8.5