user avatar
Rosinality
@rosinality
ML Engineer @poolsideai
London, United Kingdom
Joined October 2008
Posts
  • Pinned
    user avatar
    I post the papers I find interesting. There are so many papers published these days, and I frequently miss great papers. I appreciate paper recommendations via DM, but I tend to only post papers I discover on my own to keep my list personally curated.
  • user avatar
    공수처의 악의인지 무능인지는 사실 구분할 필요가 없긴 함. 권한을 가진 무능은 곧 악의이기 때문에.
  • user avatar
    clien.net/cs2/bbs/board.… "몰랐는데, 조준하기 전에 하늘 한번 살짝 보면 동공 축소되서 조준 더 잘된다고 하네요. 예비군 1년차는 물론이고 현역들도 까먹을 습관일건데 이분은 특전사때 얼마나 구른건지 40년이 지났는데도... ㄷㄷ"
    GIF
  • user avatar
    아니 전직 대통령이 두 명이 동시에 구속되는 게 무슨 문제? ㅋㅋㅋ 전직 대통령 두 명이 동시에 구속될 짓을 한 게 엄청난 문제지.
  • user avatar
    FP16 can have a smaller training-inference gap compared to BFloat16, thus fits better for RL. Even the difference between RL algorithms vanishes once FP16 is adopted. Surprising!
  • user avatar
    You can just train ViT from scratch to solve ARC.
  • user avatar
    요즘 프랑스 경제사를 읽고 있는데 의외로 16 - 17세기 정도에도 농업 생산성이 향상되지 않으니 거의 30살 정도에 결혼하는 만혼이 나타났다고. 더 재미있는 건 (추측이지만) 이 만혼 때문에 정신이 좀 이상해지는 사람들도 같이 나타남. 결혼하면 고쳐졌던 것 같다고.
    전부터 계속 허공 속으로 외치고 있지만 영국 여성 평균 결혼 연령은 늘 25살 위였고, 2차세계대전 후 잠시 아래로 내려가지만 21살 아래로 간 적은 없습니다. 사춘기 되면 일하러 보냈지 결혼 안 시켰어요…
  • user avatar
    용산으로 이동하면 당연히 금지 구역이나 고도 제한을 설정할 것이라는 것은 지나치게 합리적인 발상임. 좀 더 비합리적으로 생각해야 앞으로 벌어질 일들을 더 정확하게 예측할 수 있을 것.
  • user avatar
    웬만하면 올리지 않으려고 하는데 이건 버틸 수가 없었다 ㅋㅋㅋㅋㅋ 문노스 ㅋㅋㅋㅋㅋㅋㅋ
  • user avatar
    DeepDive: Advancing Deep Search Agents with Knowledge Graphs and Multi-Turn RL Training web agents with data constructed using knowledge graphs (arxiv.org/abs/2507.02592).
  • user avatar
    Why is RL after pretraining so effective? RL quickly upsamples the generalizable-but-rare patterns  in the pretrained model.
  • user avatar
    메시지 2483개 미쳐 ㅋㅋㅋㅋㅋ
  • user avatar
    오히려 과거에 인터넷 없이 도서관에서 저널 뒤져가면서 논문 찾던 시절에 더 다양한 논문을 인용했다는 이야기도 있음. 검색과 인용수가 바로 보이는 인터페이스 때문에 선호적 연결이 더 강해진다는 식.
  • user avatar
    An architecture for self speculative decoding by supporting block diffusion and AR in the same model. I think this kind of approach is quite promising. Anyway, there are inherently sequential problems in generation (especially for agentic trajectories) and parallelizable ones at