t.toda (@Trtd6Trtd) / X

t.toda

11.3K posts

t.toda

@Trtd6Trtd

ML Engineer / NLP / 音声対話 / Kaggle Master / #AI砂場 / #ロボ漫才

Joined December 2015

t.toda
@Trtd6Trtd
Dec 23, 2024
言語モデルの気持ちになって次の単語を予測して撃ち落とすシューティングゲーム作った
00:00
530K
t.toda
@Trtd6Trtd
Sep 18, 2021
ツッマが博士課程に進んだ
t.toda
@Trtd6Trtd
Dec 7, 2024
LLMを合成データ生成器としてみたときの評価 arxiv.org/abs/2412.03679 新しいデータの生成はGPT-4o、既存のデータをベースに、その質を高めるような場合はClaude 3.5 Sonnetが良いらしい生成能力はGSM8Kのような従来のLLMの問題解決能力を測るベンチマークとは相関しないという結果も興味深い
arxiv.org
Evaluating Language Models as Synthetic Data Generators
Given the increasing use of synthetic data in language model (LM) post-training, an LM's ability to generate high-quality data has become nearly as crucial as its ability to solve problems...
15K
t.toda
@Trtd6Trtd
Dec 23, 2024
Adamはオワコン（N回目） arxiv.org/abs/2412.11768
14K
t.toda
@Trtd6Trtd
Mar 31, 2023
Vicunaつよい最近LLM色々出てるけど、今の所一番いい感じの受け答えができる印象 github.com/lm-sys/FastChat
28K
t.toda
@Trtd6Trtd
Feb 17, 2022
音声からテキストを介さずに直接感情分類などのタスクを解くテキストレスNLP向けのライブラリtextlesslib
GitHub - facebookresearch/textlesslib: Library for Textless Spoken Language Processing
From github.com
t.toda
@Trtd6Trtd
Jul 18, 2024
今年に入って何回かNLPコンペでLLMをイジイジしてきたので、育休入る前にTips的なやつメモしとく完全に私の経験則なので「違くね？」みたいなのあったら指摘していただけると助かります🙇 ↓
23K
t.toda
@Trtd6Trtd
Jan 27, 2022
りんなのやつ試してる（すごい）
t.toda
@Trtd6Trtd
Nov 2, 2024
対話による情報検索のベンチマークCORAL arxiv.org/abs/2410.23090 RAG流行ってるけど一問一答ばかりでモヤってたのでこれはナイス作成の過程で情報検索を行う上での対話構造を4種類に分類してて、カスタマーサービスのFAQの構築とかにも参考にできそう
 14K
t.toda
@Trtd6Trtd
Nov 14, 2024
KaggleのLLM講座 Day 4の資料 kaggle.com/whitepaper-sol… fine-tuningではタスク特化とドメイン特化がある、という話、ここが切り分けられてない事例多そうだなと思った
kaggle.com
Solving Domain-Specific Problems Using LLMs
8.4K
t.toda
@Trtd6Trtd
Dec 23, 2024
多くの方に反応いただいて驚いていますせっかくなので公開します trtd56.github.io/lm-shooting/ コード: github.com/trtd56/lm-shoo… ゲーム自体はショボいですが、perplexityの計算に使ってるbi gramモデルはLLMのご先祖様みたいなものなので、ChatGPTから言語モデルで遊び始めた人は何か学びがあるかも
t.toda
@Trtd6Trtd
Dec 23, 2024
言語モデルの気持ちになって次の単語を予測して撃ち落とすシューティングゲーム作った
00:00
21K
t.toda
@Trtd6Trtd
Sep 18, 2024
7月頭くらいに話題になったStreaming音声対話モデルのMoshiが公開されてる！
GitHub - kyutai-labs/moshi: Moshi is a speech-text foundation model and full-duplex spoken dialogue...
From github.com
14K
t.toda
@Trtd6Trtd
Dec 7, 2024
arxiv.org/pdf/2412.02592 RAGでOCRした文章を検索する際のノイズの影響についての研究ノイズをOCRの予測エラーとフォーマットエラーの2つに分けて分析してる BM25のようなスパースなretrieverを使っているとOCR予測エラーに弱い、とかノウハウっぽい内容もあって良い
 11K
t.toda
@Trtd6Trtd
Oct 21, 2024
音声や画像を混ぜたマルチモーダルLLMのhallucinationについての論文 arxiv.org/abs/2410.12787 小鳥のさえずりが聞こえると（実際にはなくても）木が出てきちゃうとかそういうやつらしいあとで詳しく読む
 9.9K