t.toda
11.3K posts
Joined December 2015
- ツッマが博士課程に進んだ
- LLMを合成データ生成器としてみたときの評価 arxiv.org/abs/2412.03679 新しいデータの生成はGPT-4o、既存のデータをベースに、その質を高めるような場合はClaude 3.5 Sonnetが良いらしい 生成能力はGSM8Kのような従来のLLMの問題解決能力を測るベンチマークとは相関しないという結果も興味深い
- Adamはオワコン(N回目) arxiv.org/abs/2412.11768
- Vicunaつよい 最近LLM色々出てるけど、今の所一番いい感じの受け答えができる印象 github.com/lm-sys/FastChat
- 音声からテキストを介さずに直接感情分類などのタスクを解くテキストレスNLP向けのライブラリtextlesslib
- 今年に入って何回かNLPコンペでLLMをイジイジしてきたので、育休入る前にTips的なやつメモしとく 完全に私の経験則なので「違くね?」みたいなのあったら指摘していただけると助かります🙇 ↓
- 対話による情報検索のベンチマークCORAL arxiv.org/abs/2410.23090 RAG流行ってるけど一問一答ばかりでモヤってたのでこれはナイス 作成の過程で情報検索を行う上での対話構造を4種類に分類してて、カスタマーサービスのFAQの構築とかにも参考にできそう
- KaggleのLLM講座 Day 4の資料 kaggle.com/whitepaper-sol… fine-tuningではタスク特化とドメイン特化がある、という話、ここが切り分けられてない事例多そうだなと思った
- 多くの方に反応いただいて驚いています せっかくなので公開します trtd56.github.io/lm-shooting/ コード: github.com/trtd56/lm-shoo… ゲーム自体はショボいですが、perplexityの計算に使ってるbi gramモデルはLLMのご先祖様みたいなものなので、ChatGPTから言語モデルで遊び始めた人は何か学びがあるかも言語モデルの気持ちになって次の単語を予測して撃ち落とすシューティングゲーム作った
00:00 - 7月頭くらいに話題になったStreaming音声対話モデルのMoshiが公開されてる!
- arxiv.org/pdf/2412.02592 RAGでOCRした文章を検索する際のノイズの影響についての研究 ノイズをOCRの予測エラーとフォーマットエラーの2つに分けて分析してる BM25のようなスパースなretrieverを使っているとOCR予測エラーに弱い、とかノウハウっぽい内容もあって良い
- 音声や画像を混ぜたマルチモーダルLLMのhallucinationについての論文 arxiv.org/abs/2410.12787 小鳥のさえずりが聞こえると(実際にはなくても)木が出てきちゃうとかそういうやつらしい あとで詳しく読む


