Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

krishnateja95 updated a model about 6 hours ago

inference-optimization/Ornith-1.0-9B-FP8-Dynamic

krishnateja95 published a model about 6 hours ago

inference-optimization/Ornith-1.0-9B-FP8-Dynamic

ChibuUkachi updated a model about 9 hours ago

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-speculator.dflash

View all activity

Collections 2

models 184

inference-optimization/Ornith-1.0-9B-FP8-Dynamic

Text Generation • 9B • Updated about 6 hours ago

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-speculator.dflash

2B • Updated about 9 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt5

2B • Updated about 11 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step420136

2B • Updated 2 days ago • 51

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt4

2B • Updated 2 days ago • 3

inference-optimization/Qwen3-8B-FP8-Dynamic

Text Generation • 8B • Updated 2 days ago • 3

inference-optimization/Qwen3-8B-speculator.dflash.fullattn-qwen235b-instruct-bs16-ckpt0

2B • Updated 3 days ago • 21

inference-optimization/dflash-DeepSeek-V4-Flash-swa-muon-speculators-50k

2B • Updated 4 days ago • 123

inference-optimization/dflash-DeepSeek-V4-Flash-all-swa-muon-speculators-50k

2B • Updated 4 days ago • 106 • 1

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-data-subset-speculator.dflash

2B • Updated 5 days ago • 18

View 184 models

datasets 26

inference-optimization/every-eval-ever-demo

Viewer • Updated 15 days ago • 1 • 59

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated 16 days ago • 508k • 50

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated 21 days ago • 7.47k • 102

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated 28 days ago • 7.47k • 169

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated 28 days ago • 7.67k • 78

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated 29 days ago • 198

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated 29 days ago • 71

inference-optimization/gpt-oss-120b-responses

Preview • Updated 29 days ago • 21

inference-optimization/Qwen3-32B-responses

Preview • Updated 29 days ago • 55

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

Viewer • Updated May 28 • 5.61k • 49 • 1

View 26 datasets