Projects | Open Source Science

Scientific Software

Updated 6 months ago

libCEED — Peer-reviewed • Rank 18.8 • Science 100%

libCEED: Fast algebra for high-order element-based discretizations - Published in JOSS (2021)

api ceed cuda ecp exascale-computing gpu high-order high-performance-computing hpc julia linear-algebra

Economics (40%)

Scientific Software · Peer-reviewed

Scientific Software

Updated 6 months ago

New developments in PySDM and PySDM-examples v2 — Peer-reviewed • Rank 18.2 • Science 95%

New developments in PySDM and PySDM-examples v2: collisional breakup, immersion freezing, dry aerosol initialization, and adaptive time-stepping - Published in JOSS (2023)

atmospheric-modelling atmospheric-physics cuda gpu gpu-computing monte-carlo-simulation numba nvrtc particle-system physics-simulation pint pypi-package python research simulation thrust

Mathematics Chemistry

Scientific Software · Peer-reviewed

Scientific Software

Updated 6 months ago

Triumvirate — Peer-reviewed • Rank 9.9 • Science 98%

Triumvirate: A Python/C++ package for three-point clustering measurements - Published in JOSS (2023)

clustering-statistics cpp cuda cython hip large-scale-structure-cosmology python

Scientific Software · Peer-reviewed

Scientific Software

Updated 6 months ago

GPUE — Peer-reviewed • Rank 6.0 • Science 95%

GPUE: Graphics Processing Unit Gross--Pitaevskii Equation solver - Published in JOSS (2018)

cuda fft gpu numerical-calculations physics quantum-mechanics research simulation superfluid

Materials Science

Scientific Software · Peer-reviewed

Scientific Software

Updated 6 months ago

Disimpy — Peer-reviewed • Rank 7.5 • Science 93%

Disimpy: A massively parallel Monte Carlo simulator for generating diffusion-weighted MRI data in Python - Published in JOSS (2020)

cuda diffusion-mri gpu-computing monte-carlo-simulation

Mathematics

Scientific Software · Peer-reviewed

Scientific Software

Updated 6 months ago

Open Source Optical Coherence Tomography Software — Peer-reviewed • Rank 5.9 • Science 93%

Open Source Optical Coherence Tomography Software - Published in JOSS (2020)

cuda dsp gpu-processing medical-image-processing mhz-oct nvidia-jetson-nano oct optical-coherence-tomography optics qt visualization

Scientific Software · Peer-reviewed

Updated 6 months ago

deepmd-kit • Rank 21.7 • Science 77%

A deep learning package for many-body potential energy representation and molecular dynamics

ase c computational-chemistry cpp cuda deep-learning deepmd ipi jax lammps machine-learning-potential materials-science molecular-dynamics nodejs paddle potential-energy python pytorch rocm tensorflow

Updated 6 months ago

pykeen • Rank 21.2 • Science 77%

🤖 A Python library for learning and evaluating knowledge graph embeddings

cuda deep-learning knowledge-base-completion knowledge-graph-embeddings knowledge-graphs link-prediction machine-learning pykeen python torch

Updated 6 months ago

CUDA • Rank 21.1 • Science 77%

CUDA programming in Julia.

cuda gpu hacktoberfest julia

Scientific Software

Updated 6 months ago

sboxgates — Peer-reviewed • Rank 4.4 • Science 93%

sboxgates: A program for finding low gate count implementations of S-boxes - Published in JOSS (2021)

cryptanalysis cuda logic-circuit mpi

Earth and Environmental Sciences (40%)

Scientific Software · Peer-reviewed

Scientific Software

Updated 6 months ago

ACHR.cu — Peer-reviewed • Rank 1.6 • Science 93%

ACHR.cu: GPU-accelerated sampling of metabolic networks - Published in JOSS (2019)

cuda metabolic-network parallel-computing sampling

Scientific Software · Peer-reviewed

Updated 6 months ago

kernel-tuner • Rank 14.6 • Science 77%

Kernel Tuner

auto-tuning autotuning c cplusplus cuda cuda-kernels gpu gpu-computing kernel-tuner machine-learning opencl opencl-kernels optimization python software-development testing

Updated 6 months ago

dace • Rank 19.1 • Science 72%

DaCe - Data Centric Parallel Programming

cuda fpga high-level-synthesis high-performance-computing programming-language vivado-hls

Updated 6 months ago

torchao • Rank 25.9 • Science 64%

PyTorch native quantization and sparsity for training and inference

brrr cuda dtypes float8 inference llama mx offloading optimizer pytorch quantization sparsity training transformer

Updated 6 months ago

pycuda • Rank 23.1 • Science 64%

CUDA integration for Python, plus shiny features

array cuda gpu gpu-computing multidimensional-arrays pycuda python scientific-computing

Updated 6 months ago

gunrock • Rank 10.0 • Science 77%

Programmable CUDA/C++ GPU Graph Analytics

algorithm algorithms cpp cuda cxx essentials gnn gpu graph graph-algorithms graph-analytics graph-engine graph-neural-networks graph-primitives graph-processing gunrock hpc parallel-computing sparse-matrix

Updated 6 months ago

pyopencl • Rank 23.0 • Science 64%

OpenCL integration for Python, plus shiny features

amd array cuda gpu heterogeneous-parallel-programming multidimensional-arrays nvidia opencl opengl parallel-algorithm parallel-computing performance prefix-sum pyopencl python reduction scientific-computing shared-memory sorting

Updated 6 months ago

pennylane-lightning • Rank 21.8 • Science 64%

The Lightning plugin ecosystem provides fast quantum state-vector and tensor network simulators written in C++ for use with PennyLane.

cuda distributed-computing gpu hpc mpi openmp parallel quantum-computing quantum-machine-learning rocm

Updated 6 months ago

flamegpu2 • Rank 8.2 • Science 77%

FLAME GPU 2 is a GPU accelerated agent based modelling framework for CUDA C++ and Python

agent-based-modelling agent-based-simulation c-plus-plus cmake complex-systems cuda flamegpu flamegpu2 gpu modelling-agents simulation spatial-models

Updated 6 months ago

octotiger • Rank 7.7 • Science 77%

Astrophysics program simulating the evolution of star systems based on the fast multipole method on adaptive Octrees

astrophysics cuda cuda-kernels hpx kokkos simd stellar-mergers sycl

Updated 6 months ago

cupy • Rank 30.6 • Science 54%

NumPy & SciPy for GPU

cublas cuda cudnn cupy curand cusolver cusparse cusparselt cutensor gpu nccl numpy nvrtc nvtx python rocm scipy tensor

Updated 6 months ago

aluminum • Rank 8.4 • Science 72%

High-performance, GPU-aware communication library

cpp cuda gpu hpc mpi

Updated 6 months ago

tutorial-multi-gpu • Rank 8.1 • Science 72%

Efficient Distributed GPU Programming for Exascale, an SC/ISC Tutorial

cuda exascale-computing gpu hpc isc22 isc23 isc24 mpi multi-gpu nccl nvshmem sc21 sc22 sc23 supercomputing

Updated 5 months ago

iree-base-compiler • Rank 25.0 • Science 54%

A retargetable MLIR-based machine learning compiler and runtime toolkit.

compiler cuda jax machine-learning mlir onnx pytorch runtime spirv tensorflow vulkan

Updated 6 months ago

cuvec • Rank 11.7 • Science 67%

Unifying Python/C++/CUDA memory: Python buffered array ↔️ `std::vector` ↔️ CUDA managed memory

array buffer c cpp cpu cpython cpython-api cpython-extensions cuda cxx gpu hacktoberfest pybind11 python swig vector

Updated 6 months ago

daceml • Rank 6.6 • Science 72%

A Data-Centric Compiler for Machine Learning

compiler cuda deep-learning fpga high-performance-computing machine-learning pytorch

Updated 6 months ago

cutlass • Rank 24.1 • Science 54%

CUDA Templates for Linear Algebra Subroutines

cpp cuda deep-learning deep-learning-library gpu nvidia

Updated 6 months ago

babelstream • Rank 10.7 • Science 67%

STREAM, for lots of devices written in many programming models

benchmark cuda gpgpu gpu hpc kokkos memory-bandwidth openacc opencl openmp parallel-processing raja sycl

Updated 6 months ago

cuquantum • Rank 20.7 • Science 57%

Home for cuQuantum Python & NVIDIA cuQuantum SDK C++ samples

cuda cuquantum custatevec cutensornet nvidia quantum-computing

Updated 6 months ago

loopy • Rank 18.3 • Science 59%

A code generator for array-based code on CPUs and GPUs

array code-generation code-generator code-optimization code-transformation cuda ispc loop-optimization multidimensional-arrays opencl performance performance-analysis prefix-sum python reduction scan scientific-computing

Updated 6 months ago

tiny-cuda-nn • Rank 11.8 • Science 64%

Lightning fast C++/CUDA neural network framework

cuda deep-learning gpu mlp nerf neural-network pytorch real-time rendering

Updated 6 months ago

cresset • Rank 8.0 • Science 67%

Template repository to build PyTorch projects from source on any version of PyTorch/CUDA/cuDNN.

build cuda deep-learning deep-learning-tutorial docker docker-compose machine-learning makefile mlops mlops-template python pytorch source source-python template template-repository wheel

Updated 6 months ago

gemmkernels.jl • Rank 7.8 • Science 67%

Flexible and performant GEMM kernels in Julia

cuda gpu julia

Updated 6 months ago

numcu • Rank 6.6 • Science 67%

Numerical CUDA-based Python library

array buffer c cpp cpython cpython-api cpython-extensions cuda cxx hacktoberfest numpy python vector

Updated 6 months ago

accelerated-scan • Rank 6.3 • Science 67%

Accelerated First Order Parallel Associative Scan

cuda cumulative-sum recurrent-neural-networks state-space-model torch

Updated 5 months ago

RadonKA • Rank 5.2 • Science 67%

A simple yet sufficiently fast (attenuated) Radon and backproject implementation using KernelAbstractions.jl. Runs on CPU, CUDA, ...

automatic-differentiation computed-tomography ct cuda gpu julia julia-language optimization radon radon-transform tomography x-ray

Updated 6 months ago

abmgpu • Rank 4.2 • Science 67%

Agent Based Model on GPU using CUDA 12.2.1 and OpenGL 4.5 (CUDA OpenGL interop) on Windows/Linux

agent-based-modeling agent-based-simulation cuda glfw3 interops opengl

Updated 6 months ago

arbor • Rank 17.2 • Science 54%

The Arbor multi-compartment neural network simulation library.

cuda gpu hip hpc modern-cpp mpi neuroscience

Updated 6 months ago

cccl • Rank 17.2 • Science 54%

CUDA Core Compute Libraries

accelerated-computing cpp cpp-programming cuda cuda-cpp cuda-kernels cuda-library cuda-programming gpu gpu-acceleration gpu-computing gpu-programming hpc modern-cpp nvidia nvidia-gpu parallel-algorithm parallel-computing parallel-programming

Updated 6 months ago

alpaka • Rank 11.1 • Science 59%

Abstraction Library for Parallel Kernel Acceleration :llama:

cpp cpp17 cuda gpu header-only heterogeneous-parallel-programming hip hpc openacc openmp rocm tbb

Updated 6 months ago

burn • Rank 33.9 • Science 36%

Burn is a next generation Deep Learning Framework that doesn't compromise on flexibility, efficiency and portability.

autodiff cross-platform cuda deep-learning kernel-fusion machine-learning metal ndarray neural-network onnx pytorch rocm rust scientific-computing tensor vulkan wasm webgpu

Updated 6 months ago

celeritas • Rank 9.1 • Science 59%

Celeritas is a new Monte Carlo transport code designed to accelerate scientific discovery in high energy physics by improving detector simulation throughput and energy efficiency using GPUs.

computational-physics cuda detector-simulation gpu hep high-energy-physics hip monte-carlo particle-transport

Updated 6 months ago

nimpa • Rank 8.8 • Science 59%

NiftyPET: Neuro-Image Manipulation, Processing and Analysis

analysis cuda gpu medical-imaging mr pet processing python

Updated 5 months ago

pika • Rank 8.3 • Science 59%

pika is a C++ tasking library built on std::execution with fibers, CUDA, HIP, and MPI support.

concurrency cplusplus cpp cuda gpu hip mpi p2300 parallelism rocm stdexec

Updated 6 months ago

lc0 • Rank 12.7 • Science 54%

Open source neural network chess engine with GPU acceleration and broad hardware support.

alphazero alphazero-inspired chess chess-ai chess-engine cuda deep-learning deep-reinforcement-learning gpu leela-chess-zero neural-networks uci

Updated 6 months ago

glasses-detector • Rank 15.9 • Science 49%

Glasses detection, classification and segmentation

classification computer-vision cuda detection detector eyeglasses eyes frames glasses gpu lenses mps pytorch segmentation sunglasses

Updated 6 months ago

arborx • Rank 9.8 • Science 54%

Performance-portable geometric search library

bounding-volume-hierarchy c-plus-plus clustering cpp cuda dbscan distributed gpu hdbscan high-performance-computing hpc knn-search kokkos mpi nearest-neighbors parallel

Updated 6 months ago

necsim-rust • Rank 4.7 • Science 59%

Spatially explicit biodiversity simulations using a parallel library written in Rust

biodiversity cuda mpi necsim rust simulation

Updated 6 months ago

onediff • Rank 19.2 • Science 44%

OneDiff: An out-of-the-box acceleration library for diffusion models.

aigc-serving comfyui comfyui-workflow cuda diffusers diffusion-models inference-engine lcm lcm-lora lora performance-optimization pytorch sd-webui sdxl sdxl-turbo stable-diffusion stable-video-diffusion

Updated 5 months ago

https://github.com/rapidsai/cudf • Rank 26.6 • Science 36%

cuDF - GPU DataFrame Library

arrow cpp cuda cudf dask data-analysis data-science dataframe gpu pandas pydata python rapids

Updated 5 months ago

tmu • Rank 13.3 • Science 49%

Implements the Tsetlin Machine, Coalesced Tsetlin Machine, Convolutional Tsetlin Machine, Regression Tsetlin Machine, and Weighted Tsetlin Machine, with support for continuous features, drop clause, Type III Feedback, focused negative sampling, multi-task classifier, autoencoder, literal budget, and one-vs-one multi-class classifier. TMU is written in Python with wrappers for C and CUDA-based clause evaluation and updating.

absorbing-states autoencoder convolution cuda gpu incremental incremental-computation multi-output pattern-recognition propositional-logic regression relational-logic sparse tsetlin-machine

Updated 6 months ago

nvgraph.sh • Rank 5.1 • Science 54%

CLI for nvGraph, which is a GPU-based graph analytics library written by NVIDIA, using CUDA.

analytics cli console cuda gpu graph nvgraph nvidia pagerank terminal

Updated 6 months ago

librapid • Rank 14.6 • Science 44%

A highly optimised C++ library for mathematical applications and neural networks.

array cpp cpp20 cpp23 cuda gpu high-performance-computing library matrix multidimensional-arrays multithreading parallel-programming pypy pypy3 python python3 simd

Updated 6 months ago

torchpq • Rank 14.4 • Science 44%

Approximate nearest neighbor search with product quantization on GPU in pytorch and cuda

cuda nearest-neighbor-search pytorch

Updated 6 months ago

cunessie.jl • Rank 0.7 • Science 57%

CUDA-accelerated Nonlocal Electrostatics in Structured Solvents

bioinformatics boundary-element-method cuda electrostatics gpu-computing julia proteins

Updated 5 months ago

https://github.com/amypad/miutil • Rank 11.3 • Science 46%

Basic functionality needed for AMYPAD

cuda matlab medical-imaging python

Updated 5 months ago

https://github.com/uncomplicate/neanderthal • Rank 19.1 • Science 36%

Fast Clojure Matrix Library

api clojure clojure-library cuda gpgpu gpu gpu-computing high-performance-computing java matrix matrix-calculations matrix-factorization matrix-functions matrix-multiplication opencl vectorization

Updated 6 months ago

matx • Rank 10.7 • Science 44%

An efficient C++17 GPU numerical computing library with Python-like syntax

cuda gpgpu gpu gpu-computing hpc

Updated 5 months ago

cog • Rank 28.5 • Science 26%

Containers for machine learning

ai containers cuda deep-learning docker machine-learning pytorch tensorflow

Updated 5 months ago

https://github.com/cvxgrp/pymde • Rank 18.2 • Science 36%

Minimum-distortion embedding with PyTorch

cuda dimensionality-reduction embedding feature-vectors gpu graph-embedding machine-learning pytorch visualization

Updated 6 months ago

icicle-core • Rank 18.0 • Science 36%

A hardware acceleration library for compute intensive cryptography :ice_cube:

cpu cryptography cuda golang msm ntt rust zero-knowledge

Updated 6 months ago

quokka • Rank 7.8 • Science 46%

Two-moment AMR radiation hydrodynamics (with self-gravity, particles, and chemistry) on CPUs/GPUs for astrophysics

adaptive-mesh-refinement amrex astrochemistry astrophysics cuda gpu hydrodynamics particles rocm self-gravity

Updated 5 months ago

scikit-cuda • Rank 20.2 • Science 33%

Python interface to GPU-powered libraries

blas cublas cuda cufft cusolver gpu lapack numerical pycuda python

Updated 5 months ago

https://github.com/heavyai/heavydb • Rank 13.9 • Science 36%

HeavyDB (formerly MapD/OmniSciDB)

cuda database gpu heavyai interactive llvm machine-learning mapd olap omnisci real-time sql visualization

Updated 6 months ago

pararealgpu.jl • Rank 1.8 • Science 44%

A distributed and GPU-based implementation of the Parareal algorithm for parallel-in-time integration of equations of motion.

accelerator computational-physics computational-science cuda differential-equation-solvers distributed-computing gpu-computing high-performance-computing julialang ode ordinary-differential-equations parallel-computing parallel-in-time-integration parareal partial-differential-equation pde simulation

Updated 5 months ago

https://github.com/bytedance/flux • Rank 9.0 • Science 36%

A fast communication-overlapping library for tensor/expert parallelism on GPUs.

cuda cutlass gpu pytorch

Updated 5 months ago

https://github.com/openmm/nnpops • Rank 7.1 • Science 36%

High-performance operations for neural network potentials

cuda gpu machine-learning molecular-dynamics molecular-modeling

Updated 5 months ago

thundersvm • Rank 17.5 • Science 23%

ThunderSVM: A Fast SVM Library on GPUs and CPUs

c-plus-plus classification cuda gpu libsvm one-class-learning regression

Updated 5 months ago

h2o4gpu • Rank 15.6 • Science 23%

H2Oai GPU Edition

c-plus-plus cpu cuda elastic-net glm gpu lasso machine-learning pca python r rstats svd

Updated 5 months ago

QPT • Rank 8.5 • Science 26%

[内测中]QPT - 致力于让开源项目更好通往互联网世界的Python to EXE工具（Python打包）。

cuda deep-learning dml gpu noavx paddlepaddle pypi python qpt

Updated 5 months ago

https://github.com/cair/pytsetlinmachinecuda • Rank 8.3 • Science 23%

Massively Parallel and Asynchronous Architecture for Logic-based AI

classification convolution cuda gpu learning-automata logic-based-artificial-intelligence regression tsetlin-machine

Scientific Software

Updated 6 months ago

SPbLA — Peer-reviewed • Rank 3.9 • Science 26%

SPbLA: The Library of GPGPU-powered Sparse Boolean Linear Algebra Operations - Published in JOSS (2022)

boolean-algebra cplusplus cuda graph-algorithms graphblas opencl python sparse-matrix suitesparse

Scientific Software · Peer-reviewed

Updated 5 months ago

https://github.com/bytedance/lightseq • Rank 18.7 • Science 10%

LightSeq: A High Performance Library for Sequence Processing and Generation

accelerate bart beam-search bert cuda diverse-decoding gpt inference multilingual-nmt sampling training transformer

Updated 6 months ago

pytorch-cuda-2.7.1 • Rank 0.7 • Science 26%

Clone of PyTorch: Tensors and Dynamic neural networks in Python and C++ with strong GPU acceleration.

cuda fedora pytorch

Updated 5 months ago

https://github.com/SepKfr/Coarse-and-Fine-Grained-Forecasting-Via-GP-Blurring-Effect • Rank 0.7 • Science 20%

Forecast-blur-denoise forecasting model with PyTorch

cuda deep-learning gaussian-processes neural-networks optuna pytorch time-series time-series-forecasting uncertainty

Updated 5 months ago

https://github.com/bytedance/abq-llm • Rank 7.1 • Science 13%

An acceleration library that supports arbitrary bit-width combinatorial quantization operations

cuda llm-inference mlsys quantized-networks research

Updated 5 months ago

https://github.com/dbraun/pytorchtop • Rank 5.1 • Science 13%

GPU PyTorch TOP in TouchDesigner with CUDA-enabled OpenCV

cuda libtorch opencv pytorch touchdesigner

Updated 5 months ago

https://github.com/conradsnicta/bandicoot-code • Rank 4.1 • Science 13%

Bandicoot: C++ library for GPU linear algebra & scientific computing - https://coot.sourceforge.io

armadillo c-plus-plus clblas cublas cuda cuda-kernels cusolver gpu gpu-accelerated-library gpu-acceleration gpu-computing linear-algebra linear-algebra-library machine-learning matrix-functions matrix-library opencl opencl-kernels scientific-computing

Updated 5 months ago

https://github.com/bencardoen/singularity_slurm_cuda • Rank 1.8 • Science 13%

Example on how to get started with Singularity and CUDA on a SLURM cluster

cuda nvidia singularity-container slurm-cluster tensorflow

Updated 5 months ago

https://github.com/arkavo/poissoncuda • Rank 2.3 • Science 10%

NVIDIA CUDA Poisson Solver

cpp cuda physics physics-simulation poisson-equation

Updated 6 months ago

dla-future • Science 67%

DLA-Future

cholesky-decomposition cuda distributed-linear-algebra eigensolver generalized-eigensolver linear-algebra mpi p2300 rocm scalapack stdexec task-based

Updated 6 months ago

kernel_launcher • Science 44%

Using C++ magic to launch/capture CUDA kernels and tune them with Kernel Tuner

cpp cuda gpu kernel-tuner

Updated 6 months ago

micm • Science 85%

A model-independent chemistry module for atmosphere models

atmospheric-chemistry atmospheric-modeling atmospheric-science cuda gpu gpu-acceleration hpc ode-solver

Updated 6 months ago

stnls • Science 54%

Space-Time Attention with a Shifted Non-Local Search

autograd cuda differentiable non-local non-local-search pytorch video

Updated 6 months ago

plus • Science 54%

More versatile and extensible GPU-accelerated micromagnetic simulator

cpp cuda finite-difference-time-domain gpu-computing micromagnetics python scientific-computing

Updated 6 months ago

cuda-accelerated-visual-inertial-odometry-fusion • Science 44%

Harness the power of GPU acceleration for fusing visual odometry and IMU data with an advanced Unscented Kalman Filter (UKF) implementation. Developed in C++ and utilizing CUDA, cuBLAS, and cuSOLVER, this system offers unparalleled real-time performance in state and covariance estimation for robotics and autonomous system applications.

cublas cuda cusolver imu-sensor kalman-filter robotics ros2 sensor-fusion state-estimation unscented-kalman-filter visual-inertial-odometry visual-odometry

Updated 6 months ago

kmm • Science 26%

KMM: parallel dataflow scheduler and efficient memory management for multi-GPU platforms

cuda dag dag-scheduling dataflow gpu gpu-acceleration gpu-programming hip hpc memory memory-management parallel performance scheduler

Updated 5 months ago

https://github.com/beehive-lab/tornadovm • Science 67%

TornadoVM: A practical and efficient heterogeneous programming framework for managed languages

ai cuda gpu-acceleration gpu-computing gpus graalvm java levelzero multi-core opencl parallel-computing parallel-programming spirv

Updated 6 months ago

qudaz • Science 67%

Qompass AI Cuda library for Zig

cuda zig

Updated 6 months ago

qc-cugbasis • Science 39%

High performance CUDA/Python library for computing quantum chemistry density-based descriptors for larger systems using GPUs.

atoms-in-molecules computational-chemistry conceptual-dft cuda electron-density gpu python qtaim quantum quantum-chemistry theoretical-chemistry

Updated 6 months ago

interopunitycuda • Science 67%

Demonstrate interoperability between Unity Engine and CUDA

cpp cuda dx11 gpu gpu-acceleration native-plugin opengl unity unity3d

Updated 6 months ago

kernel_float • Science 26%

CUDA/HIP header-only library for low-precision (16 bit, 8 bit) and vectorized GPU kernel development

bfloat16 cpp cuda floating-point gpu half-precision header-only-library hip kernel-tuner low-precision mixed-precision performance reduced-precision vectorization

Updated 6 months ago

simulateqcd • Science 49%

SIMULATeQCD is a multi-GPU Lattice QCD framework that makes it easy for physicists to implement lattice QCD formulas while still providing competitive performance.