Развернуть собственный ИИ через Open WebUI на своем сервере не так уж сложно, но перед запуском стоит прояснить пару нюансов. В этом руководстве мы разберем оба способа установки своего ИИ, честно поговорим о требованиях к серверу и не будем делать вид, что дешевый VPS за $10 в месяц сможет быстро генерировать ответы на тяжелых моделях (от 70 млрд параметров).
Что такое Open WebUI?
Если, пользуясь ChatGPT, вы когда-нибудь думали: «Вот бы запустить нечто подобное на своем сервере», то Open WebUI — это именно оно. Это бесплатный AI-чат с открытым кодом для самостоятельного хостинга, который подключается к локальным моделям через Ollama или к удаленным API вроде OpenAI и Anthropic. Вы получаете понятный интерфейс, историю переписок, возможность работы с несколькими моделями сразу и полный контроль над своими данными.
Когда вы разворачиваете ИИ у себя, ваши запросы не покидают пределов сервера. Это особенно важно, если вы обрабатываете конфиденциальную информацию: внутреннюю документацию, данные клиентов или закрытый код.
Помните, что Open WebUI — это лишь визуальная оболочка. Самому интеллекту все равно нужен бэкенд: либо модель, которая работает локально на вашем сервере, либо внешний API, за использование которого вы платите.
На что способен Open WebUI, а на что нет
Если вы планируете запускать локальные модели через связку Open WebUI и Ollama, обратите пристальное внимание на характеристики вашего VPS. На сервере только с процессором (без видеокарты) реально запустить нейросети размером от 3 до 7 миллиардов параметров — например, Phi-3, Gemma 2B или Mistral 7B с квантованием Q4. Ответы будут генерироваться медленно (от 30 до 90 секунд на сообщение, в зависимости от модели), но для экспериментов и несложных личных задач этого вполне хватит.
Чтобы запускать более тяжелые модели (от 13 млрд параметров) с комфортной скоростью при хостинге своего ИИ, вам понадобится видеокарта (GPU). Придется либо брать выделенный сервер с графическим ускорителем, либо полностью переносить вычисления на внешний API.
Именно этот второй вариант — самый разумный старт для большинства людей, желающих развернуть свой ИИ. Вы устанавливаете Open WebUI на VPS исключительно как интерфейс, а в качестве «мозгов» подключаете OpenAI, Anthropic или OpenRouter. В этом случае VPS просто держит веб-интерфейс, что требует минимум ресурсов, а ответы генерируются быстро, так как вся тяжелая вычислительная работа происходит на чужих серверах.
Что нужно подготовить перед установкой
Есть два пути. Выбирайте тот, который подходит под ваши задачи.
Сценарий А: Open WebUI + Ollama (локальный запуск моделей)
Модель работает прямо на вашем VPS. Требования:
- Минимум 8 ГБ оперативной памяти (технически будет работать и на 4 ГБ, но будьте готовы к зависаниям).
- От 2 ядер процессора.
- От 50 ГБ свободного места на диске.
Последний пункт куда важнее, чем пишут в большинстве руководств. Сам образ Ollama весит около 4,7 ГБ, Open WebUI заберет еще 3,8 ГБ, а модель Mistral 7B Q4 добавит сверху примерно 4,1 ГБ. Это уже 12,6 ГБ — и это без учета операционной системы, истории ваших переписок и кеша Docker. На сервере с маленьким NVMe-накопителем место закончится гораздо быстрее, чем вы ожидаете.
Тариф Premium от is*hosting (4 ядра / 8 ГБ ОЗУ / 50 ГБ NVMe, от $31.99 в месяц) — это оптимальный выбор для такой задачи. Технически можно попытаться взять сервер послабее, но как мы уже посчитали выше, на самых дешевых тарифах место на диске закончится очень быстро.
Сценарий Б: Open WebUI + внешний API
В этом случае ваш VPS поддерживает только саму оболочку чата, а все вычисления нейросети происходят на серверах OpenAI, Anthropic или OpenRouter. Поэтому требования к серверу тут минимальные: 2 ядра процессора и 2 ГБ оперативной памяти будет более чем достаточно. С такой задачей легко справится базовый тариф Start от is*hosting (от $10.19 в месяц).
Как установить Open WebUI на VPS

Подключитесь к вашему VPS по SSH и убедитесь, что установлен Docker. Если его нет, выполните:
curl -fsSL https://get.docker.com | sh
sudo usermod -aG docker $USER
Выйдите из системы и зайдите снова, чтобы добавление в группу docker вступило в силу.
Open WebUI + Ollama (всё в одном через Docker Compose)
Создайте файл compose.yaml:
services:
ollama:
image: ollama/ollama
container_name: ollama
volumes:
- ollama:/root/.ollama
restart: unless-stopped
open-webui:
image: ghcr.io/open-webui/open-webui:main
container_name: open-webui
depends_on:
- ollama
ports:
- "3000:8080"
environment:
- OLLAMA_BASE_URL=http://ollama:11434
- WEBUI_SECRET_KEY=your-secret-key-here
- OLLAMA_MAX_LOADED_MODELS=1
extra_hosts:
- "host.docker.internal:host-gateway"
volumes:
- open-webui:/app/backend/data
restart: unless-stopped
volumes:
ollama:
open-webui:
Пару важных моментов по конфигурации:
- WEBUI_SECRET_KEY отвечает за шифрование сессий. Обязательно замените your-secret-key-here на случайную строку перед запуском.
- OLLAMA_MAX_LOADED_MODELS=1 не дает загружать в оперативную память несколько моделей одновременно. Это критично для серверов с 8 ГБ ОЗУ, где одна тяжелая модель (на 7 млрд параметров) может незаметно съесть всю память. Если ваш Open WebUI вдруг завис и перестал открываться, выполните команду
dmesg | grep -i oom— она покажет, не завершила ли система процесс из-за нехватки памяти. - Строка extra_hosts нужна для специфических сетевых настроек, чтобы контейнер Open WebUI мог без проблем связываться с контейнером Ollama. Разработчики добавили её в официальные примеры не просто так, поэтому лучше её оставить.
Запускаем:
docker compose up -d
Если панель управления не открывается, первым делом проверьте логи:
docker logs -f open-webui
Теперь скачаем модель (Mistral 7B Q4 — отличный стартовый вариант для запуска на процессоре):
docker exec -it ollama ollama pull mistral
Open WebUI будет доступен по адресу http://ip-вашего-сервера:3000. Для постоянного использования мы рекомендуем спрятать его за Nginx и прикрутить SSL-сертификат.
Важно для безопасности: первый человек, который зарегистрируется в свежеустановленном Open WebUI, автоматически становится администратором. Если ваш сервер открыт в интернет по порту 3000, кто-то посторонний может зайти и занять админское место быстрее вас. Поэтому либо заблокируйте порт 3000 в фаерволе, пока не создадите свой аккаунт, либо добавьте строку ENABLE_SIGNUP=false в блок environment сразу после регистрации.
И еще один совет по версии образа: тег :main всегда подтягивает самые свежие изменения разработчиков, а значит, очередное обновление может что-то сломать. Если вы ставите ИИ не просто ради тестов, лучше зафиксировать версию жестко. Зайдите на страницу релизов Open WebUI на GitHub и замените :main на конкретный тег, например :v0.6.5.
Open WebUI только с внешним API (без Ollama)
Если вы хотите развернуть свой ИИ, но локальные модели вам не нужны, можете вообще пропустить установку Ollama. Вот самый легкий вариант запуска Open WebUI через Docker:
docker run -d \
-p 3000:8080 \
-e WEBUI_SECRET_KEY=your-secret-key-here \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main
Когда контейнер запустится, просто откройте настройки (Settings → Connections) и вставьте API-ключ от OpenAI или другого совместимого сервиса (например, OpenRouter). Всё готово — вы получаете отличный интерфейс Open WebUI, работающий на внешних мощностях, поэтому наличие видеокарты (GPU) теряет всякий смысл.
VPS за 5-15 минут
Выделенные ресурсы и изоляция KVM для глобальных экспериментов.
Как обновить Open WebUI
Давайте разберемся в том, как обновлять Open WebUI заранее — это сбережет вам время в будущем. При использовании Docker Compose вам не придется удалять и перенастраивать всё с нуля:
docker compose pull && docker compose up -d
Docker просто скачает новый образ и пересоздаст только те контейнеры, в которых произошли изменения. Все остальные процессы продолжат работать. Ваши данные надежно хранятся в отдельном томе open-webui, поэтому история переписок и настройки никуда не исчезнут.
Раз уж мы заговорили об этом, создание резервной копии этого тома тоже делается одной командой:
docker run --rm -v open-webui:/data -v $(pwd):/backup alpine tar czf /backup/open-webui-backup.tar.gz /data
Запускайте её перед каждым обновлением, и у вас всегда будет надежный бэкап на случай непредвиденных сбоев.
Инструменты (Tools) и пайплайны (Pipelines) в Open WebUI
Именно благодаря этим функциям Open WebUI оставляет далеко позади более простые аналоги.
Инструменты Open WebUI — это функции, которые нейросеть может вызывать прямо во время диалога: например, поискать информацию в интернете, запустить калькулятор или запросить данные через API. Вы можете добавлять их через раздел Tools в админке. Сообщество постоянно пополняет библиотеку готовых решений на сайте openwebui.com, а написать свой собственный инструмент можно на базовом Python.
Пайплайны (Pipelines) Open WebUI позволяют вам перехватывать и изменять запросы и ответы между пользователем и моделью. С их помощью можно на лету внедрять системные промпты, маршрутизировать разные запросы к разным нейросетям, ограничивать пользователям лимиты сообщений или настраивать нестандартное логирование. Пайплайны работают в отдельном контейнере и связываются с Open WebUI по внутреннему API.
Отдельно стоит упомянуть RAG (поиск и генерация на основе внешних данных) — одну из самых мощных встроенных функций Open WebUI. Вы просто загружаете документы прямо в интерфейс, и модель начинает отвечать на вопросы, опираясь именно на их текст, а не на свои общие знания. Платформа поддерживает девять различных векторных баз данных для RAG. Это значит, что систему легко масштабировать под ваши нужды: от простого локального файла SQLite до мощных кластеров на базе Chroma или Qdrant.
Инструменты, пайплайны и встроенный RAG переводят Open WebUI из категории домашних проектов в класс серьезных решений. Это готовая база, на которой можно выстроить работу целой команды или запустить коммерческий продукт.
Альтернативы Open WebUI: LibreChat, LM Studio и другие

Уже точно решили ставить Open WebUI? Смело пропускайте этот раздел. А если еще сомневаетесь, оставляем ниже сравнение конкурентов.
Open WebUI против LibreChat
Обе системы — это интерфейсы для запуска своего ИИ, которые умеют работать с разными нейросетями. LibreChat больше заточен под корпоративные задачи: здесь из коробки есть поддержка множества пользователей, архитектура плагинов и продвинутая авторизация (OAuth/SSO). Open WebUI, в свою очередь, берет простотой: он быстрее ставится, у него более лаконичный дизайн, а интеграция с Ollama встроена изначально. Если вы работаете в одиночку или в небольшой команде и планируете запускать локальные модели, Open WebUI — хороший выбор. LibreChat стоит брать только в том случае, если вам с самого начала нужна сложная система ролей и доступов.
LM Studio против Open WebUI
На самом деле, эти инструменты созданы для разных задач. LM Studio — это обычная программа для ПК. В ней удобно запускать локальные модели прямо на своем компьютере, просто кликая мышкой. Но это не сервер, к которому можно подключить команду или зайти с телефона.
Open WebUI — это веб-приложение, которое ставится на VPS и доступно отовсюду. Если вы хотите развернуть ИИ для нескольких человек или пользоваться им с разных устройств, LM Studio не подойдет. А вот для простых тестов на домашнем ноутбуке — это отличный вариант.
Из других альтернатив Open WebUI можно отметить Hollama (минималистичный чат с управлением с клавиатуры), Jan (программа для ПК в духе LM Studio) и Msty. Но ни одна из них не дотягивает до Open WebUI по сочетанию поддержки Ollama, скорости обновлений и гибкости настроек.
Заключение
Запускать свой собственный ИИ нужно далеко не всем. Но если вам важна приватность данных или вы хотите полностью контролировать рабочую среду, Open WebUI на данный момент — самый серьезный и удобный вариант для селф-хостинга.
Если коротко, вот что и на чем стоит запускать:
- Тесты локальных моделей на процессоре (CPU): VPS уровня Premium (4 ядра / 8 ГБ ОЗУ), связка Ollama + Open WebUI. Для начала отлично подойдут модели Mistral 7B или Gemma 2B.
- Работа через внешний API (нужна только оболочка): базовый VPS уровня Start (2 ядра / 2 ГБ ОЗУ), только Open WebUI без Ollama.
- Запуск тяжелых моделей для сложных задач: обычный VPS не потянет, вам потребуется сервер с видеокартой (GPU).
Если вы впервые настраиваете серверные ИИ-сервисы, перед стартом стоит немного почитать о базовой работе с Linux — наша инструкция подразумевает, что вы не боитесь командной строки.
Установка Open WebUI через Docker — это правда легко. Попробуйте поднять его хотя бы раз, и станет ясно, почему все, кто собирает свой ИИ-стек, в итоге останавливаются именно на этой панели.
Управляемый VPS
Мы берем на себя настройку, обновления и мониторинг. Вы занимаетесь проектом.
От $5.94/месяц