Open WebUI на VPS: запуск своего ИИ через Ollama или API

Written by Команда is*hosting | 02.06.2026 4:00:00

Развернуть собственный ИИ через Open WebUI на своем сервере не так уж сложно, но перед запуском стоит прояснить пару нюансов. В этом руководстве мы разберем оба способа установки своего ИИ, честно поговорим о требованиях к серверу и не будем делать вид, что дешевый VPS за $10 в месяц сможет быстро генерировать ответы на тяжелых моделях (от 70 млрд параметров).

Что такое Open WebUI?

Если, пользуясь ChatGPT, вы когда-нибудь думали: «Вот бы запустить нечто подобное на своем сервере», то Open WebUI — это именно оно. Это бесплатный AI-чат с открытым кодом для самостоятельного хостинга, который подключается к локальным моделям через Ollama или к удаленным API вроде OpenAI и Anthropic. Вы получаете понятный интерфейс, историю переписок, возможность работы с несколькими моделями сразу и полный контроль над своими данными.

Когда вы разворачиваете ИИ у себя, ваши запросы не покидают пределов сервера. Это особенно важно, если вы обрабатываете конфиденциальную информацию: внутреннюю документацию, данные клиентов или закрытый код.

Помните, что Open WebUI — это лишь визуальная оболочка. Самому интеллекту все равно нужен бэкенд: либо модель, которая работает локально на вашем сервере, либо внешний API, за использование которого вы платите.

На что способен Open WebUI, а на что нет

Если вы планируете запускать локальные модели через связку Open WebUI и Ollama, обратите пристальное внимание на характеристики вашего VPS. На сервере только с процессором (без видеокарты) реально запустить нейросети размером от 3 до 7 миллиардов параметров — например, Phi-3, Gemma 2B или Mistral 7B с квантованием Q4. Ответы будут генерироваться медленно (от 30 до 90 секунд на сообщение, в зависимости от модели), но для экспериментов и несложных личных задач этого вполне хватит.

Чтобы запускать более тяжелые модели (от 13 млрд параметров) с комфортной скоростью при хостинге своего ИИ, вам понадобится видеокарта (GPU). Придется либо брать выделенный сервер с графическим ускорителем, либо полностью переносить вычисления на внешний API.

Именно этот второй вариант — самый разумный старт для большинства людей, желающих развернуть свой ИИ. Вы устанавливаете Open WebUI на VPS исключительно как интерфейс, а в качестве «мозгов» подключаете OpenAI, Anthropic или OpenRouter. В этом случае VPS просто держит веб-интерфейс, что требует минимум ресурсов, а ответы генерируются быстро, так как вся тяжелая вычислительная работа происходит на чужих серверах.

Что нужно подготовить перед установкой

Есть два пути. Выбирайте тот, который подходит под ваши задачи.

Сценарий А: Open WebUI + Ollama (локальный запуск моделей)

Модель работает прямо на вашем VPS. Требования:

Минимум 8 ГБ оперативной памяти (технически будет работать и на 4 ГБ, но будьте готовы к зависаниям).
От 2 ядер процессора.
От 50 ГБ свободного места на диске.

Последний пункт куда важнее, чем пишут в большинстве руководств. Сам образ Ollama весит около 4,7 ГБ, Open WebUI заберет еще 3,8 ГБ, а модель Mistral 7B Q4 добавит сверху примерно 4,1 ГБ. Это уже 12,6 ГБ — и это без учета операционной системы, истории ваших переписок и кеша Docker. На сервере с маленьким NVMe-накопителем место закончится гораздо быстрее, чем вы ожидаете.

Тариф Premium от is*hosting (4 ядра / 8 ГБ ОЗУ / 50 ГБ NVMe, от $31.99 в месяц) — это оптимальный выбор для такой задачи. Технически можно попытаться взять сервер послабее, но как мы уже посчитали выше, на самых дешевых тарифах место на диске закончится очень быстро.

Premium VPS

Конфигурация VPS для нормальной работы с Open WebUI: 8 GB RAM и 50 GB SSD.

Настроить VPS

Сценарий Б: Open WebUI + внешний API

В этом случае ваш VPS поддерживает только саму оболочку чата, а все вычисления нейросети происходят на серверах OpenAI, Anthropic или OpenRouter. Поэтому требования к серверу тут минимальные: 2 ядра процессора и 2 ГБ оперативной памяти будет более чем достаточно. С такой задачей легко справится базовый тариф Start от is*hosting (от $10.19 в месяц).

Как установить Open WebUI на VPS

Подключитесь к вашему VPS по SSH и убедитесь, что установлен Docker. Если его нет, выполните:

curl -fsSL https://get.docker.com | sh
sudo usermod -aG docker $USER

Выйдите из системы и зайдите снова, чтобы добавление в группу docker вступило в силу.

Open WebUI + Ollama (всё в одном через Docker Compose)

Создайте файл compose.yaml:

services:
  ollama:
    image: ollama/ollama
    container_name: ollama
    volumes:
      - ollama:/root/.ollama
    restart: unless-stopped

  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    container_name: open-webui
    depends_on:
      - ollama
    ports:
      - "3000:8080"
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
      - WEBUI_SECRET_KEY=your-secret-key-here
      - OLLAMA_MAX_LOADED_MODELS=1
    extra_hosts:
      - "host.docker.internal:host-gateway"
    volumes:
      - open-webui:/app/backend/data
    restart: unless-stopped

volumes:
  ollama:
  open-webui:

Пару важных моментов по конфигурации:

WEBUI_SECRET_KEY отвечает за шифрование сессий. Обязательно замените your-secret-key-here на случайную строку перед запуском.
OLLAMA_MAX_LOADED_MODELS=1 не дает загружать в оперативную память несколько моделей одновременно. Это критично для серверов с 8 ГБ ОЗУ, где одна тяжелая модель (на 7 млрд параметров) может незаметно съесть всю память. Если ваш Open WebUI вдруг завис и перестал открываться, выполните команду dmesg | grep -i oom — она покажет, не завершила ли система процесс из-за нехватки памяти.
Строка extra_hosts нужна для специфических сетевых настроек, чтобы контейнер Open WebUI мог без проблем связываться с контейнером Ollama. Разработчики добавили её в официальные примеры не просто так, поэтому лучше её оставить.

Запускаем:

docker compose up -d

Если панель управления не открывается, первым делом проверьте логи:

docker logs -f open-webui

Теперь скачаем модель (Mistral 7B Q4 — отличный стартовый вариант для запуска на процессоре):

docker exec -it ollama ollama pull mistral

Open WebUI будет доступен по адресу http://ip-вашего-сервера:3000. Для постоянного использования мы рекомендуем спрятать его за Nginx и прикрутить SSL-сертификат.

Важно для безопасности: первый человек, который зарегистрируется в свежеустановленном Open WebUI, автоматически становится администратором. Если ваш сервер открыт в интернет по порту 3000, кто-то посторонний может зайти и занять админское место быстрее вас. Поэтому либо заблокируйте порт 3000 в фаерволе, пока не создадите свой аккаунт, либо добавьте строку ENABLE_SIGNUP=false в блок environment сразу после регистрации.

И еще один совет по версии образа: тег :main всегда подтягивает самые свежие изменения разработчиков, а значит, очередное обновление может что-то сломать. Если вы ставите ИИ не просто ради тестов, лучше зафиксировать версию жестко. Зайдите на страницу релизов Open WebUI на GitHub и замените :main на конкретный тег, например :v0.6.5.

Open WebUI только с внешним API (без Ollama)

Если вы хотите развернуть свой ИИ, но локальные модели вам не нужны, можете вообще пропустить установку Ollama. Вот самый легкий вариант запуска Open WebUI через Docker:

docker run -d \
  -p 3000:8080 \
  -e WEBUI_SECRET_KEY=your-secret-key-here \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

Когда контейнер запустится, просто откройте настройки (Settings → Connections) и вставьте API-ключ от OpenAI или другого совместимого сервиса (например, OpenRouter). Всё готово — вы получаете отличный интерфейс Open WebUI, работающий на внешних мощностях, поэтому наличие видеокарты (GPU) теряет всякий смысл.

VPS за 5-15 минут

Выделенные ресурсы и изоляция KVM для глобальных экспериментов.

Выбрать VPS

Как обновить Open WebUI

Давайте разберемся в том, как обновлять Open WebUI заранее — это сбережет вам время в будущем. При использовании Docker Compose вам не придется удалять и перенастраивать всё с нуля:

docker compose pull && docker compose up -d

Docker просто скачает новый образ и пересоздаст только те контейнеры, в которых произошли изменения. Все остальные процессы продолжат работать. Ваши данные надежно хранятся в отдельном томе open-webui, поэтому история переписок и настройки никуда не исчезнут.

Раз уж мы заговорили об этом, создание резервной копии этого тома тоже делается одной командой:

docker run --rm -v open-webui:/data -v $(pwd):/backup alpine tar czf /backup/open-webui-backup.tar.gz /data

Запускайте её перед каждым обновлением, и у вас всегда будет надежный бэкап на случай непредвиденных сбоев.

Инструменты (Tools) и пайплайны (Pipelines) в Open WebUI

Именно благодаря этим функциям Open WebUI оставляет далеко позади более простые аналоги.

Инструменты Open WebUI — это функции, которые нейросеть может вызывать прямо во время диалога: например, поискать информацию в интернете, запустить калькулятор или запросить данные через API. Вы можете добавлять их через раздел Tools в админке. Сообщество постоянно пополняет библиотеку готовых решений на сайте openwebui.com, а написать свой собственный инструмент можно на базовом Python.

Пайплайны (Pipelines) Open WebUI позволяют вам перехватывать и изменять запросы и ответы между пользователем и моделью. С их помощью можно на лету внедрять системные промпты, маршрутизировать разные запросы к разным нейросетям, ограничивать пользователям лимиты сообщений или настраивать нестандартное логирование. Пайплайны работают в отдельном контейнере и связываются с Open WebUI по внутреннему API.

Отдельно стоит упомянуть RAG (поиск и генерация на основе внешних данных) — одну из самых мощных встроенных функций Open WebUI. Вы просто загружаете документы прямо в интерфейс, и модель начинает отвечать на вопросы, опираясь именно на их текст, а не на свои общие знания. Платформа поддерживает девять различных векторных баз данных для RAG. Это значит, что систему легко масштабировать под ваши нужды: от простого локального файла SQLite до мощных кластеров на базе Chroma или Qdrant.

Инструменты, пайплайны и встроенный RAG переводят Open WebUI из категории домашних проектов в класс серьезных решений. Это готовая база, на которой можно выстроить работу целой команды или запустить коммерческий продукт.

Альтернативы Open WebUI: LibreChat, LM Studio и другие

Уже точно решили ставить Open WebUI? Смело пропускайте этот раздел. А если еще сомневаетесь, оставляем ниже сравнение конкурентов.

Open WebUI против LibreChat

Обе системы — это интерфейсы для запуска своего ИИ, которые умеют работать с разными нейросетями. LibreChat больше заточен под корпоративные задачи: здесь из коробки есть поддержка множества пользователей, архитектура плагинов и продвинутая авторизация (OAuth/SSO). Open WebUI, в свою очередь, берет простотой: он быстрее ставится, у него более лаконичный дизайн, а интеграция с Ollama встроена изначально. Если вы работаете в одиночку или в небольшой команде и планируете запускать локальные модели, Open WebUI — хороший выбор. LibreChat стоит брать только в том случае, если вам с самого начала нужна сложная система ролей и доступов.

LM Studio против Open WebUI

На самом деле, эти инструменты созданы для разных задач. LM Studio — это обычная программа для ПК. В ней удобно запускать локальные модели прямо на своем компьютере, просто кликая мышкой. Но это не сервер, к которому можно подключить команду или зайти с телефона.

Open WebUI — это веб-приложение, которое ставится на VPS и доступно отовсюду. Если вы хотите развернуть ИИ для нескольких человек или пользоваться им с разных устройств, LM Studio не подойдет. А вот для простых тестов на домашнем ноутбуке — это отличный вариант.

Из других альтернатив Open WebUI можно отметить Hollama (минималистичный чат с управлением с клавиатуры), Jan (программа для ПК в духе LM Studio) и Msty. Но ни одна из них не дотягивает до Open WebUI по сочетанию поддержки Ollama, скорости обновлений и гибкости настроек.

Заключение

Запускать свой собственный ИИ нужно далеко не всем. Но если вам важна приватность данных или вы хотите полностью контролировать рабочую среду, Open WebUI на данный момент — самый серьезный и удобный вариант для селф-хостинга.

Если коротко, вот что и на чем стоит запускать:

Тесты локальных моделей на процессоре (CPU): VPS уровня Premium (4 ядра / 8 ГБ ОЗУ), связка Ollama + Open WebUI. Для начала отлично подойдут модели Mistral 7B или Gemma 2B.
Работа через внешний API (нужна только оболочка): базовый VPS уровня Start (2 ядра / 2 ГБ ОЗУ), только Open WebUI без Ollama.
Запуск тяжелых моделей для сложных задач: обычный VPS не потянет, вам потребуется сервер с видеокартой (GPU).

Если вы впервые настраиваете серверные ИИ-сервисы, перед стартом стоит немного почитать о базовой работе с Linux — наша инструкция подразумевает, что вы не боитесь командной строки.

Установка Open WebUI через Docker — это правда легко. Попробуйте поднять его хотя бы раз, и станет ясно, почему все, кто собирает свой ИИ-стек, в итоге останавливаются именно на этой панели.

View full post