Редукція параметрів нейронних мереж на підставі машинного навчання

І. І. Хрипливий

Автор(и)

І. І. Хрипливий

Ключові слова:

великі мовні моделі, Mixture-of-Experts, редукція параметрів, shared experts, REAP pruning, KV-кеш, квантизація

Анотація

У кваліфікаційній роботі досліджено методи оптимізації використання пам'яті у великих мовних моделях (LLM) та розроблено підходи до редукції параметрів нейронних мереж. Проаналізовано сучасні архітектури Mixture-ofExperts (MoE), методи квантизації, оптимізації KV-кеша та факторизації ембедингів.

Редукція параметрів нейронних мереж на підставі машинного навчання

Автор(и)

Ключові слова:

Анотація

##submission.downloads##

Опубліковано

Номер

Розділ

Інформація

Мова