GitHub - najibna/OR-Royalties-Extractor: OR Royalties Extractor

OR Royalties Extractor (MVP)

Simple website-based data pipeline that:

Scrapes public updates from 3 mining company websites
Uses OpenRouter (only paid API) to extract structured investment fields + short summaries
Stores raw + structured results in PostgreSQL
Avoids duplicates
Provides a small web dashboard + on-demand database summary
Can run daily scheduled parsing

Tech

Backend: Python + FastAPI + SQLAlchemy
DB: PostgreSQL
Scraping: requests + BeautifulSoup (Playwright optional later)
AI: OpenRouter API (Chat Completions)
Frontend: React (Vite)

Quickstart (Docker Postgres + local apps)

1) Start Postgres

docker compose up -d db

2) Backend

cd backend
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
cp .env.example .env
# edit backend/.env and set OPENROUTER_API_KEY
uvicorn app.main:app --reload --port 8000

3) Frontend

cd frontend
npm install
npm run dev

Open the dashboard at http://localhost:5173.

Configuration

Create backend/.env (or set env vars) with:

OPENROUTER_API_KEY: required
OPENROUTER_MODEL: optional (default in .env.example)
DATABASE_URL: required (default points to docker compose Postgres)
ENABLE_SCHEDULER: true to run daily parsing on backend startup
SCHEDULE_CRON: optional cron string (default daily at 06:30)

Notes / MVP limitations

Scraping uses basic HTML parsing; if a site blocks requests or requires JS, we can add Playwright later.
“Detect new” is done by URL uniqueness + content hash; “updated” triggers if the content hash changes.
LLM extraction is best-effort. Raw text is always stored.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
backend		backend
frontend		frontend
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
docker-compose.yml		docker-compose.yml
image.png		image.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OR Royalties Extractor (MVP)

Tech

Quickstart (Docker Postgres + local apps)

1) Start Postgres

2) Backend

3) Frontend

Configuration

Notes / MVP limitations

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

OR Royalties Extractor (MVP)

Tech

Quickstart (Docker Postgres + local apps)

1) Start Postgres

2) Backend

3) Frontend

Configuration

Notes / MVP limitations

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages