AI Scientist Artifacts v1.0

Artifacts from the first complete run of the LossFunk AI scientist pipeline, including prompts, research ideas, and failure analyses from our paper accepted at Agents4Science 2025.

MARL-idea/ - Multi-agent RL coordination (failed at implementation)
SALVO-WM-idea/ - Perceptual loss for world models (failed at evaluation)
SDTS-WM-idea/ - Stochastic tree search in world models (failed at evaluation)
SemEnt-ALGN-idea/ - Semantic entropy jailbreak detection (successful paper)

Prompts

Complete workflow prompts used in our system:

idea_generation/ - Paper pair evaluation and mashing
hypotheses_generation/ - Converting ideas to testable hypotheses
experiment_planning/ - Implementation planning for Claude Code
paper_creation/ - Paper outlining and readiness checks

Citation

If you use these artifacts, please cite our report: "Supporting LLMs from Research Idea to Paper" (2025)

You can also refer to the successful submission to Agents4Science 2025:

OpenReview: https://openreview.net/forum?id=B6ZrLXou3u
Conference: https://agents4science.stanford.edu/submissions.html

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Scientist Artifacts v1.0

Contents

Research Ideas (4 total: 1 success, 3 failures)

Prompts

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
MARL-idea		MARL-idea
SALVO-WM-idea		SALVO-WM-idea
SDTS-WM-idea		SDTS-WM-idea
SemEnt-ALGN-idea		SemEnt-ALGN-idea
prompts		prompts
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

AI Scientist Artifacts v1.0

Contents

Research Ideas (4 total: 1 success, 3 failures)

Prompts

Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages