Arjun Krishna

ArjunKrishnaK

1

·

https://arjunkrishnak.github.io/

ArjunKrishnak

AI & ML interests

LLM's and Distributed Training

Recent Activity

updated a model 2 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-asft-merged

published a model 2 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-asft-merged

updated a model 4 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_fp8

View all activity

Organizations

updated a model 2 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-asft-merged

Updated 2 days ago

published a model 2 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-asft-merged

Updated 2 days ago

updated 2 models 4 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_fp8

35B • Updated 4 days ago • 35

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_then_quantized_to_fp8_swift

35B • Updated 4 days ago • 32

published 3 models 4 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_fp8

35B • Updated 4 days ago • 35

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_to_fp8

Updated 4 days ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_then_quantized_to_fp8_swift

35B • Updated 4 days ago • 32

upvoted a paper about 1 year ago

Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning

Paper • 2505.24726 • Published May 30, 2025 • 283