CogWriter

CogWriter is a cognitive writing framework designed to improve LLMs' capabilities in generating high-quality long-form text under strict requirements.

Overview

CogWriter implements a novel cognitive writing approach that:

Breaks down complex writing tasks into manageable components
Employs specialized agents for planning and generation
Ensures coherence and requirement adherence in long-form content

Installation

Environment Setup

# Create and activate conda environment
conda create -n cogwriter python=3.12
conda activate cogwriter

# Install dependencies
pip install -r requirements.txt

File Structure

.
├── CogWriter_model/            # Core framework implementation
│   ├── Agents/                 # Specialized cognitive agents
│   │   ├── GenerationAgent.py  # Content generation agent
│   │   └── PlanningAgent.py    # Strategic planning agent
│   ├── BaselineGen.py          # Baseline generation implementation
│   └── CogWriter.py            # Main framework orchestrator
├── datasets/                   # Input datasets
├── llms/                       # LLM interface implementations
├── utils/                      # Utility functions
├── longGenBench_output/        # Generation results and evaluations
│   ├── eval_cogwriter.py       # Evaluate CogWriter
│   └── eval_baseline.py        # Evaluate Baseline
└── runningLogs/                # Execution logs

Usage

Model Setup

Closed Source Models

# Configure API key in llms/llms.py
API_KEY = "your-api-key-here"

Open Source Models

# Start VLLM server
vllm serve meta-llama/Llama-3.3-70B-Instruct --tensor-parallel-size 4

Running Experiments

CogWriter Generation

python main.py \
    --model "Llama33-70b" \
    --dataset_dir "datasets/short.json" \
    --output_dir "longGenBench_output/Llama33-70b/output_short.json"
    --generator cogwriter

Baseline Generation

python main.py \
    --model "Llama33-70b" \
    --dataset_dir "datasets/short.json" \
    --output_dir "longGenBench_output/Llama33-70b/output_short_baseline.json" \
    --generator baseline

Evaluation

Baseline Evaluation

python eval_baseline.py \
    --data "Llama33-70b/output_short_baseline.json" \
    --csv "Llama33-70b/output_short_baseline.csv" \
    --gpu 4

CogWriter Evaluation

python eval_cogwriter.py \
    --data "Llama33-70b/output_short_baseline.json" \
    --csv "Llama33-70b/output_short_baseline.csv" \
    --gpu 4

Configuration

Core Parameters

Parameter	Description	Default
`--model`	Language model identifier	Required
`--dataset_dir`	Input dataset path	Required
`--output_dir`	Results output path	Required
`--generator`	Generation method (`cogwriter`/`baseline`)	`cogwriter`

Evaluation Parameters

Parameter	Description
`--gpu`	Number of GPUs for evaluation
`--data`	Path to results JSON file
`--csv`	Path for evaluation metrics CSV

License

This project is licensed under the MIT License.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
CogWriter_model		CogWriter_model
llms		llms
longGenBench_output		longGenBench_output
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

CogWriter

Overview

Table of Contents

Installation

Environment Setup

File Structure

Usage

Model Setup

Running Experiments

Evaluation

Configuration

Core Parameters

Evaluation Parameters

License

About

Uh oh!

Releases

Packages

Languages

License

KaiyangWan/CogWriter

Folders and files

Latest commit

History

Repository files navigation

CogWriter

Overview

Table of Contents

Installation

Environment Setup

File Structure

Usage

Model Setup

Running Experiments

Evaluation

Configuration

Core Parameters

Evaluation Parameters

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages