Quantized-LLM

A mobile application that runs large language models (LLMs) directly on Android devices. Designed to showcase expertise in mobile machine learning optimization and deployment, the app loads quantized models (e.g., Qwen2.5-1.5B) and executes them entirely on-device—no internet connection required. It also features built-in performance monitoring to measure inference speed, memory usage, and response quality.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
benchmarks		benchmarks
llama.cpp		llama.cpp
screenshots		screenshots
README.md		README.md
quantize.py		quantize.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Quantized-LLM

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Quantized-LLM

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages