Projects

Updated 10 months ago

proteinworkshop • Rank 11.6 • Science 67%

Benchmarking framework for protein representation learning. Includes a large number of pre-training and downstream task datasets, models and training/task utilities. (ICLR 2024)

benchmark dataset deep-learning lightning pretraining protein protein-structure pytorch

Updated 10 months ago

https://github.com/amazon-science/bigdetection • Rank 7.4 • Science 23%

BigDetection: A Large-scale Benchmark for Improved Object Detector Pre-training

computer-vision few-shot object-detection pretraining

Updated 10 months ago

https://github.com/bytedance/twist • Science 36%

Official codes: Self-Supervised Learning by Estimating Twin Class Distribution

computer-vision deep-learning pretraining research self-supervised-learning twist

Updated 10 months ago

transformers-bart-pretrain • Science 54%

Script to pre-train hugginface transformers BART with Tensorflow 2

bart gpu huggingface-transformers pretraining tensorflow tpu

Updated 10 months ago

https://github.com/bojarlab/gifflar • Science 36%

Glycan Informed Foundational Framework for Learning Abstract Representations, based on Combinatorial Complexes and Heterogeneous GNNs

combinatorial-complex foundational-models glycan glycobiology graph-neural-network heterogeneous-graph-neural-network pretraining

Updated 10 months ago

https://github.com/buaadreamer/mllm-finetuning-demo • Science 13%

使用LLaMA-Factory微调多模态大语言模型的示例代码 Demo of Finetuning Multimodal LLM with LLaMA-Factory

finetune-llm huggingface-datasets llama-factory llava lora mllm paligemma pretraining supervised-finetuning transformers yi-vl

Updated 10 months ago

graphg • Science 54%

GraphGen: Enhancing Supervised Fine-Tuning for LLMs with Knowledge-Driven Synthetic Data Generation

ai4science data-generation data-synthesis knowledge-graph llama-factory llm llm-training pretrain pretraining qa question-answering qwen sft sft-data xtuner

Updated 10 months ago

awesome-robotics-3d • Science 36%

A curated list of 3D Vision papers relating to Robotics domain in the era of large models i.e. LLMs/VLMs, inspired by awesome-computer-vision, including papers, codes, and related websites

3d benchmarks computer-vision diffusion-models foundation-models gaussian-splatting grasping llm manipulation navigation nerf pointclouds policy-learning pretraining robotics scene-graph simulations vision-language-model vlm

Updated 10 months ago

https://github.com/amazon-science/mix-generation • Science 10%

MixGen: A New Multi-Modal Data Augmentation

data-augmentation data-efficiency multimodal pretraining vision-language

Updated 10 months ago

https://github.com/amazon-science/wqa-multi-sentence-inference • Science 49%

This repository contains code used for our Multi Sentence Inference NAACL'22 paper.

answer-sentence-selection nlp pretraining question-answering transformer

Updated 10 months ago

zeldarose • Science 44%

Train transformer-based models.

bert fine-tuning machine-learning neural-networks nlp pretraining transformers

Updated 10 months ago

transform-emr • Science 54%

This model is a decoder transformer based model aiming to model events predictions from EMR records as a sequential text generation problem. This project is a part of my thesis research.

medical-informatics pretraining tokenization transformer-architecture

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Open Source Science

proteinworkshop • Rank 11.6 • Science 67%

https://github.com/amazon-science/bigdetection • Rank 7.4 • Science 23%

https://github.com/bytedance/twist • Science 36%

transformers-bart-pretrain • Science 54%

https://github.com/bojarlab/gifflar • Science 36%

https://github.com/buaadreamer/mllm-finetuning-demo • Science 13%

graphg • Science 54%

awesome-robotics-3d • Science 36%

https://github.com/amazon-science/mix-generation • Science 10%

https://github.com/amazon-science/wqa-multi-sentence-inference • Science 49%

zeldarose • Science 44%

transform-emr • Science 54%