Интуитивное объяснение проксимальной оптимизации политики (PPO) для больших языковых моделей9просмотров8 месяцев назад
GRPO (групповая относительная оптимизация политики) от DeepSeek | Обучение с подкреплением для LLM13просмотров8 месяцев назад
Объяснение Llama 4: Архитектура, длинный контекст и встроенная мультимодальность8просмотров8 месяцев назад
Как большие языковые модели выживают при низкой точности | Основы квантования4просмотра8 месяцев назад
Единственное условие успеха в эпоху искусственного интеллекта — как его создать8просмотров8 месяцев назад
Эволюция архитектуры Transformer, используемой в LLMs (2017-2025) – Полный курс25просмотров10 месяцев назад
Вариационные автоэнкодеры | Анимированный генеративный искусственный интеллект12просмотров10 месяцев назад
Визуализация скрытого пространства: PCA, t-SNE, UMAP | Анимация для глубокого обучения15просмотров10 месяцев назад