SLM: Small Language Model

A PyTorch implementation of a Small Language Model with state-of-the-art optimizations.

Features

Multi-Head Attention: Scaled dot-product attention with causal masking
Group Query Attention (GQA): Reduced memory footprint
KV Caching: Fast inference without recomputation
Different Tokenizations: Implementing sentence piece, byte pair encoding and other.
RLHF & DPO: Advanced training techniques

Installation

python -m venv .venv
source .venv/bin/activate
uv sync

Quick Start

from src.basics.multiheadAttention import MultiHeadAttention
import torch

mha = MultiHeadAttention(heads=8, d_model=512, d_v=64)
x = torch.randn(2, 10, 512)
output = mha(x)  # (2, 10, 512)

Run Tests

PYTHONPATH=. pytest tests/ -v

Project Structure

src/
├── basics/
│   ├── multiheadAttention.py
│   └── mask.py
├── model/
│   └── slm.py
└── training/
    ├── sft.py
    ├── rlhf.py
    └── dpo.py

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
configs		configs
data		data
runs/gpt		runs/gpt
src		src
tests		tests
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SLM: Small Language Model

Features

Installation

Quick Start

Run Tests

Project Structure

License

About

Uh oh!

Releases

Packages

Languages

kkkamur07/slm

Folders and files

Latest commit

History

Repository files navigation

SLM: Small Language Model

Features

Installation

Quick Start

Run Tests

Project Structure

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages