26 15

吴晨

dibrimatter14

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

MIRA: Mid-training Rubric Anchoring for Source-Aware Data Selection

liked a dataset 7 days ago

osv5m/osv5m

liked a dataset 7 days ago

gionuibk/hyperliquidL2Book-v2

View all activity

Organizations

None yet

upvoted a paper 5 days ago

MIRA: Mid-training Rubric Anchoring for Source-Aware Data Selection

Paper • 2605.30288 • Published 11 days ago • 21

liked 2 datasets 7 days ago

osv5m/osv5m

Updated Apr 27, 2024 • 919k • 53

gionuibk/hyperliquidL2Book-v2

Preview • Updated 2 days ago • 30.8k • 8

liked a model 9 days ago

jsirish/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-oQ8-mtp

8B • Updated 9 days ago • 356 • 1

upvoted 2 papers 18 days ago

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Paper • 2605.11609 • Published 28 days ago • 195

IndusAgent: Reinforcing Open-Vocabulary Industrial Anomaly Detection with Agentic Tools

Paper • 2605.20682 • Published 20 days ago • 83

liked a model 21 days ago

mistralai/Mistral-7B-Instruct-v0.3

7B • Updated Dec 3, 2025 • 3.71M • 2.62k

liked a model 25 days ago

fpadovani/eng_100mb_baseline

Text Generation • 0.1B • Updated 25 days ago • 227 • 1

liked a dataset 28 days ago

Tony15246/OPENUAV_DATASET

Preview • Updated 15 days ago • 551 • 1

upvoted 2 papers about 1 month ago

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Paper • 2605.06130 • Published May 7 • 112

BARRED: Synthetic Training of Custom Policy Guardrails via Asymmetric Debate

Paper • 2604.25203 • Published Apr 28 • 8

upvoted 2 papers about 2 months ago

Micro Language Models Enable Instant Responses

Paper • 2604.19642 • Published Apr 21 • 4

DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-Off

Paper • 2604.13902 • Published Apr 15 • 62

liked 2 models about 2 months ago

WarriorMama777/OrangeMixs

Text-to-Image • Updated Jan 7, 2024 • 2.25k • 3.92k

autogluon/chronos-2

Time Series Forecasting • 0.1B • Updated 3 days ago • 14.2M • 32

upvoted 3 papers about 2 months ago

liked a dataset 2 months ago

dhruvbansalup/dlgenai-nppe-dataset

Viewer • Updated Apr 9 • 58.2k • 12 • 2

upvoted a paper 2 months ago

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference

Paper • 2603.25730 • Published Mar 26 • 53

吴晨

AI & ML interests

Recent Activity

Organizations

dibrimatter14's activity