Projects | Open Source Science

Scientific Software

Updated 10 months ago

Spleeter — Peer-reviewed • Rank 23.5 • Science 95%

Spleeter: a fast and efficient music source separation tool with pre-trained models - Published in JOSS (2020)

audio-processing bass deep-learning deezer drums model pretrained-models python tensorflow vocals

Engineering

Scientific Software · Peer-reviewed

Scientific Software

Updated 10 months ago

Panako — Peer-reviewed • Rank 7.3 • Science 93%

Panako: a scalable audio search system - Published in JOSS (2022)

acoustic-fingerprinting audio-processing duplicate-detection music-information-retrieval

Computer Science (31%)

Scientific Software · Peer-reviewed

Updated 10 months ago

gladia-torchaudio • Rank 30.4 • Science 64%

Data manipulation and transformation for audio signal processing, powered by PyTorch

audio audio-processing io machine-learning python pytorch speech

Updated 10 months ago

pyaca • Rank 11.9 • Science 77%

Python scripts accompanying the book "An Introduction to Audio Content Analysis" (www.AudioContentAnalysis.org)

audio-content-analysis audio-features audio-processing music-informatics music-information-retrieval signal-processing

Updated 10 months ago

qdft • Rank 11.8 • Science 64%

Constant-Q Sliding DFT in C++, Rust and Python

algorithms audio audio-processing constant-q constant-q-transform cpp cqt dft digital-signal-processing dsp fft library python qdft rust sdft signal-processing sliding-dft variable-q vqt

Updated 10 months ago

triton • Rank 7.1 • Science 62%

:whale: Scripps Whale Acoustics Lab :earth_americas: Scripps Acoustic Ecology Lab - Triton with remoras in development

acoustics audio-processing classification detection machine-learning marine-species mbarc scripps sound triton whale

Updated 10 months ago

mbari-pbp • Rank 11.4 • Science 57%

Process ocean audio data archives to daily analysis products of hybrid millidecade spectra using PyPAM.

audio-processing cloud docker hybrid-millidecade-bands notebook pypam soundscape

Updated 10 months ago

ohun • Rank 10.2 • Science 57%

Automatic detection of acoustic signals

audio-processing bioacoustics sound-event-detection spectrogram streamline-analysis

Updated 10 months ago

warbler • Rank 13.3 • Science 49%

streamline acoustic analysis in R

animal-acoustic-signals audio-processing bioacoustics spectrogram streamline-analysis

Updated 10 months ago

dawdreamer • Rank 16.1 • Science 46%

Digital Audio Workstation with Python; VST instruments/effects, parameter automation, FAUST, JAX, Warp Markers, and JUCE processors

ableton audio audio-plugin audio-processing daw faust jax juce midi python synthesizer vst vst-host vst3 vst3-host

Updated 9 months ago

https://github.com/fgnt/nara_wpe • Rank 18.7 • Science 41%

Different implementations of "Weighted Prediction Error" for speech dereverberation

audio audio-processing dereverberation enhancement signal-processing

Updated 10 months ago

callsync • Rank 6.4 • Science 39%

R package to align recordings, detect, assign, trace and analyse vocalisations

alignment audio-processing bioacoustics detection fundamental-frequency r software spectrogram

Updated 10 months ago

https://github.com/bytedance/salmonn • Rank 9.0 • Science 36%

SALMONN family: A suite of advanced multi-modal LLMs

audio audio-processing audio-visual-understanding bytedance iclr2024 icml-2024 large-language-models multi-modal music research speech speech-recognition tsinghua-university video video-understanding

Updated 10 months ago

aifororcas-livesystem • Rank 8.4 • Science 26%

Real-time AI-assisted killer whale notification system (model and moderator portal) :star:

artificial-intelligence audio-analysis audio-processing bioacoustics deep-learning inference machine-learning marine marine-biology neural-network orcas real-time realtime whales

Updated 10 months ago

https://github.com/antonbaumann/lecture-shortener • Rank 2.1 • Science 26%

Lecture Shortener

audio-processing python3 silencedetect video-processing

Updated 10 months ago

https://github.com/akiomik/precountify • Rank 1.1 • Science 26%

A tool for adding pre-count (count-off) click to audio file

audio-processing bpm-detection metronome music-practice

Updated 10 months ago

https://github.com/brucewlee/lama-music-genre-dataset • Rank 1.1 • Science 26%

.wav files, training dataset (MFCC), and graph plots (FFTs, MFCCs, Waveforms) from Latin America, Asia, MiddleEast, and Africa

africa asia audio-processing classification dataset genre genre-classification genre-suggestion genres-classification harvard-dataverse lama mfcc music music-library signal-processing sound

Updated 10 months ago

https://github.com/dbraun/td-faust • Rank 5.5 • Science 13%

FAUST (Functional Audio Stream) for TouchDesigner

audio audio-processing dsp faust touchdesigner

Updated 10 months ago

https://github.com/bkraad47/fat_llama • Science 13%

fat_llama is a Python package for upscaling audio files to FLAC or WAV formats using advanced audio processing techniques. It utilizes CUDA-accelerated calculations to enhance audio quality by upsampling and adding missing frequencies through FFT, resulting in richer and more detailed audio.

audio audio-engineering audio-processing audiophile cuda cufft cupy fft flac hi-res hpc mp3 music nvidia ogg parallel-computing physics upscaling wav

Updated 10 months ago

complex-cnn-deeplab-v3-with-stft-for-audio-denoising • Science 54%

Paper Name: Complex Convolution Neural Network model (Complex DeepLab v3) on STFT time-varying frequency components for audio denoising Creating a Complex Deep Lab v3 model for audio denoising using STFT complex mask Dataset from: https://datashare.is.ed.ac.uk/handle/10283/2791

audio-denoising audio-processing convolutional-neural-networks deep-learning deeplabv3 machine-learning pytorch stft

Updated 10 months ago

zff_vad • Science 57%

Unsupervised Voice Activity Detection by Modeling Source and System Information using Zero Frequency Filtering

audio-processing machine-learning noise-robust signal-processing speech-activity-detection voice-activity-detection

Updated 10 months ago

find-delay • Science 26%

A Python package to calculate the delay between two arrays or two audio files

audio-processing delay lag module package pip python

Updated 10 months ago

awesome-audio-llm • Science 54%

Audio Large Language Models

audio-language audio-processing audio-understanding

Updated 10 months ago

libaca • Science 54%

C++ code accompanying the book "An Introduction to Audio Content Analysis" (www.AudioContentAnalysis.org)

audio-content-analysis audio-features audio-processing cmake cpp music-information-retrieval signal-processing

Updated 10 months ago

iir-hilbert-transformer • Science 44%

Infinite Impulse Response (IIR) Hilbert Transformer.

audio-processing halfband-filter iir-filters signal-processing

Updated 10 months ago

https://github.com/anira-project/anira-rt-principle-check • Science 13%

Evaluation of real-time violations of different inference engines and validation of the real-time safety of the anira library

audio-processing deep-learning libtorch onnx real-time-systems sanitizer tensorflow-lite

Updated 10 months ago

https://github.com/aryanvbw/aivoiceclone • Science 10%

Transform Your Voice: Replicate Your Unique Sound in a Pristine Pre-Trained Model and Cultivate Your Custom Voiceprint

ai ai-tools artificial-intelligence aryanshop aryanvbw audio-processing clonevoice vivek voice-cloning voice-imitation

Updated 10 months ago

https://github.com/alexanderlerch/aca-slides • Science 26%

Slides and Code for "An Introduction to Audio Content Analysis," also taught at Georgia Tech as MUSI-6201. This introductory course on Music Information Retrieval is based on the text book "An Introduction to Audio Content Analysis", Wiley 2012/2022

audio audio-analysis audio-content-analysis audio-processing music music-information-retrieval

Updated 10 months ago

diy-smartcube • Science 26%

A proof-of-concept proposal for turning standard Rubik's Cubes into smartcubes by embedding speakers into the cube's centercaps.

audio-processing pcb-design rubiks-cube software-engineering sound-processing thesis thesis-paper thesis-project

Updated 10 months ago

speechbrain • Science 64%

A PyTorch-based Speech Toolkit

asr audio audio-processing deep-learning huggingface language-model pytorch speaker-diarization speaker-recognition speaker-verification speech-enhancement speech-processing speech-recognition speech-separation speech-to-text speech-toolkit speechrecognition spoken-language-understanding transformers voice-recognition

Updated 10 months ago

https://github.com/alexisvassquez/ai_spotibot_player • Science 26%

AudioMIX is an open-source, AI-driven music production software designed to empower independent artists and DJs with mood-based audio analysis, LED integration, and creative autonomy. Spotibot was its original name.

ai audio audio-analysis audio-processing audio-utility cmake cpp daw hardware machine-learning mood-detection music-production-software music-production-tools music-programming-language music-visualizer open-source portaudio python software-engineering spotipy-api

Updated 10 months ago

https://github.com/csteinmetz1/steerable-nafx • Science 10%

Steerable discovery of neural audio effects

audio-processing neural-audio-effects

Updated 10 months ago

anira • Science 57%

an architecture for neural network inference in real-time audio applications

audio audio-processing deep-learning libtorch onnxruntime real-time tensorflow-lite

Updated 10 months ago

aca-code • Science 67%

Matlab scripts accompanying the book "An Introduction to Audio Content Analysis" (www.AudioContentAnalysis.org)

audio-content-analysis audio-features audio-processing music-informatics music-information-retrieval signal-processing

Updated 10 months ago

https://github.com/google-ai-edge/mediapipe • Science 36%

Cross-platform, customizable ML solutions for live and streaming media.

android audio-processing c-plus-plus calculator computer-vision deep-learning framework graph-based graph-framework inference machine-learning mediapipe mobile-development perception pipeline-framework stream-processing video-processing

Updated 10 months ago

https://github.com/akiomik/shiomi • Science 13%

An oscilloscope-like audio waveform GIF animation generator

audio-processing audio-visualizer gif gif-animation oscilloscope sound-processing