audio-language

Here are 8 public repositories matching this topic...

OFA-Sys / ONE-PEACE

A general representation model across vision, audio, language modalities. Paper: ONE-PEACE: Exploring One General Representation Model Toward Unlimited Modalities

representation-learning multimodal vision-and-language contrastive-loss vision-language vision-transformer foundation-models audio-language

Updated Oct 6, 2024
Python

AudioLLMs / Awesome-Audio-LLM

Star

Audio Large Language Models

audio-processing audio-language audio-understanding

Updated Jul 5, 2025
Python

CASIA-IVA-Lab / VAST

Star

[NIPS2023] Code and Model for VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

dataset vision-language audio-language multimodal-foundation-model cross-modality-pretraining vision-audio-subtitle-text

Updated Mar 14, 2024
Jupyter Notebook

Sreyan88 / GAMA

Star

Code for the paper: GAMA: A Large Audio-Language Model with Advanced Audio Understanding and Complex Reasoning Abilities

audio dataset question-answering reasoning large-language-model audio-language multimodal-large-language-models

Updated Dec 5, 2024
Python

Sreyan88 / CompA

Star

Code for ICLR 2024 Paper: CompA: Addressing the Gap in Compositional Reasoning in Audio-Language Models

audio nlp benchmark ai ml compositionality retreival audio-language

Updated Jul 10, 2024
Python

abduays / v0-tamil-writing-app

Star

Tamil learning and writing app for children with audio support, focused on simple input and clear pronunciation.

nextjs react-app tamil tailwindcss tamil-nadu education-app tamil-learning audio-language audio-learning tamil-app tamil-writing tamil-education

Updated Apr 14, 2026
TypeScript

Giuseppepointblank314 / peace-equalizer-APO

Star

Configure audio settings on Windows using this graphical interface for the Equalizer APO system-wide parametric equalizer.

swift kubernetes elixir osx openedx docker-compose audio-effect realtime lms representation-learning audio-processing equalizer equalizer-apo parametric-equalizer foundation-models audio-language eq-presets

Updated May 25, 2026
TypeScript

pro6692abou / llm-audio

Star

Provide Whisper-based audio transcription and translation with lightweight C++ libraries for easy integration into LLM projects.

text music-information-retrieval neural-networks speech-to-text text-to-image music-ai large-language-models foundational-models speech-ai vision-language-model audio-language large-vision-language-models large-audio-models speech-llms audio-understanding

Updated May 25, 2026
C++

Improve this page

Add a description, image, and links to the audio-language topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-language topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

audio-language

Here are 8 public repositories matching this topic...

OFA-Sys / ONE-PEACE

AudioLLMs / Awesome-Audio-LLM

CASIA-IVA-Lab / VAST

Sreyan88 / GAMA

Sreyan88 / CompA

abduays / v0-tamil-writing-app

Giuseppepointblank314 / peace-equalizer-APO

pro6692abou / llm-audio

Improve this page

Add this topic to your repo