Блог и Новости is*hosting - Хостинг-провайдер Нового Поколения

Open WebUI на VPS: запуск своего ИИ через Ollama или API

Written by Команда is*hosting | 02.06.2026 4:00:00

Развернуть собственный ИИ через Open WebUI на своем сервере не так уж сложно, но перед запуском стоит прояснить пару нюансов. В этом руководстве мы разберем оба способа установки своего ИИ, честно поговорим о требованиях к серверу и не будем делать вид, что дешевый VPS за $10 в месяц сможет быстро генерировать ответы на тяжелых моделях (от 70 млрд параметров).

Что такое Open WebUI?

Если, пользуясь ChatGPT, вы когда-нибудь думали: «Вот бы запустить нечто подобное на своем сервере», то Open WebUI — это именно оно. Это бесплатный AI-чат с открытым кодом для самостоятельного хостинга, который подключается к локальным моделям через Ollama или к удаленным API вроде OpenAI и Anthropic. Вы получаете понятный интерфейс, историю переписок, возможность работы с несколькими моделями сразу и полный контроль над своими данными.

Когда вы разворачиваете ИИ у себя, ваши запросы не покидают пределов сервера. Это особенно важно, если вы обрабатываете конфиденциальную информацию: внутреннюю документацию, данные клиентов или закрытый код.

Помните, что Open WebUI — это лишь визуальная оболочка. Самому интеллекту все равно нужен бэкенд: либо модель, которая работает локально на вашем сервере, либо внешний API, за использование которого вы платите.

На что способен Open WebUI, а на что нет

Если вы планируете запускать локальные модели через связку Open WebUI и Ollama, обратите пристальное внимание на характеристики вашего VPS. На сервере только с процессором (без видеокарты) реально запустить нейросети размером от 3 до 7 миллиардов параметров — например, Phi-3, Gemma 2B или Mistral 7B с квантованием Q4. Ответы будут генерироваться медленно (от 30 до 90 секунд на сообщение, в зависимости от модели), но для экспериментов и несложных личных задач этого вполне хватит.

Чтобы запускать более тяжелые модели (от 13 млрд параметров) с комфортной скоростью при хостинге своего ИИ, вам понадобится видеокарта (GPU). Придется либо брать выделенный сервер с графическим ускорителем, либо полностью переносить вычисления на внешний API.

Именно этот второй вариант — самый разумный старт для большинства людей, желающих развернуть свой ИИ. Вы устанавливаете Open WebUI на VPS исключительно как интерфейс, а в качестве «мозгов» подключаете OpenAI, Anthropic или OpenRouter. В этом случае VPS просто держит веб-интерфейс, что требует минимум ресурсов, а ответы генерируются быстро, так как вся тяжелая вычислительная работа происходит на чужих серверах.

Что нужно подготовить перед установкой

Есть два пути. Выбирайте тот, который подходит под ваши задачи.

Сценарий А: Open WebUI + Ollama (локальный запуск моделей)

Модель работает прямо на вашем VPS. Требования:

  • Минимум 8 ГБ оперативной памяти (технически будет работать и на 4 ГБ, но будьте готовы к зависаниям).
  • От 2 ядер процессора.
  • От 50 ГБ свободного места на диске.

Последний пункт куда важнее, чем пишут в большинстве руководств. Сам образ Ollama весит около 4,7 ГБ, Open WebUI заберет еще 3,8 ГБ, а модель Mistral 7B Q4 добавит сверху примерно 4,1 ГБ. Это уже 12,6 ГБ — и это без учета операционной системы, истории ваших переписок и кеша Docker. На сервере с маленьким NVMe-накопителем место закончится гораздо быстрее, чем вы ожидаете.

Тариф Premium от is*hosting (4 ядра / 8 ГБ ОЗУ / 50 ГБ NVMe, от $31.99 в месяц) — это оптимальный выбор для такой задачи. Технически можно попытаться взять сервер послабее, но как мы уже посчитали выше, на самых дешевых тарифах место на диске закончится очень быстро.

Сценарий Б: Open WebUI + внешний API

В этом случае ваш VPS поддерживает только саму оболочку чата, а все вычисления нейросети происходят на серверах OpenAI, Anthropic или OpenRouter. Поэтому требования к серверу тут минимальные: 2 ядра процессора и 2 ГБ оперативной памяти будет более чем достаточно. С такой задачей легко справится базовый тариф Start от is*hosting (от $10.19 в месяц).

Как установить Open WebUI на VPS

Подключитесь к вашему VPS по SSH и убедитесь, что установлен Docker. Если его нет, выполните:

curl -fsSL https://get.docker.com | sh
sudo usermod -aG docker $USER

Выйдите из системы и зайдите снова, чтобы добавление в группу docker вступило в силу.

Open WebUI + Ollama (всё в одном через Docker Compose)

Создайте файл compose.yaml:

services:
  ollama:
    image: ollama/ollama
    container_name: ollama
    volumes:
      - ollama:/root/.ollama
    restart: unless-stopped

  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    container_name: open-webui
    depends_on:
      - ollama
    ports:
      - "3000:8080"
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
      - WEBUI_SECRET_KEY=your-secret-key-here
      - OLLAMA_MAX_LOADED_MODELS=1
    extra_hosts:
      - "host.docker.internal:host-gateway"
    volumes:
      - open-webui:/app/backend/data
    restart: unless-stopped

volumes:
  ollama:
  open-webui:

Пару важных моментов по конфигурации:

  • WEBUI_SECRET_KEY отвечает за шифрование сессий. Обязательно замените your-secret-key-here на случайную строку перед запуском.
  • OLLAMA_MAX_LOADED_MODELS=1 не дает загружать в оперативную память несколько моделей одновременно. Это критично для серверов с 8 ГБ ОЗУ, где одна тяжелая модель (на 7 млрд параметров) может незаметно съесть всю память. Если ваш Open WebUI вдруг завис и перестал открываться, выполните команду dmesg | grep -i oom — она покажет, не завершила ли система процесс из-за нехватки памяти.
  • Строка extra_hosts нужна для специфических сетевых настроек, чтобы контейнер Open WebUI мог без проблем связываться с контейнером Ollama. Разработчики добавили её в официальные примеры не просто так, поэтому лучше её оставить.

Запускаем:

docker compose up -d

Если панель управления не открывается, первым делом проверьте логи:

docker logs -f open-webui

Теперь скачаем модель (Mistral 7B Q4 — отличный стартовый вариант для запуска на процессоре):

docker exec -it ollama ollama pull mistral

Open WebUI будет доступен по адресу http://ip-вашего-сервера:3000. Для постоянного использования мы рекомендуем спрятать его за Nginx и прикрутить SSL-сертификат.

Важно для безопасности: первый человек, который зарегистрируется в свежеустановленном Open WebUI, автоматически становится администратором. Если ваш сервер открыт в интернет по порту 3000, кто-то посторонний может зайти и занять админское место быстрее вас. Поэтому либо заблокируйте порт 3000 в фаерволе, пока не создадите свой аккаунт, либо добавьте строку ENABLE_SIGNUP=false в блок environment сразу после регистрации.

И еще один совет по версии образа: тег :main всегда подтягивает самые свежие изменения разработчиков, а значит, очередное обновление может что-то сломать. Если вы ставите ИИ не просто ради тестов, лучше зафиксировать версию жестко. Зайдите на страницу релизов Open WebUI на GitHub и замените :main на конкретный тег, например :v0.6.5.

Open WebUI только с внешним API (без Ollama)

Если вы хотите развернуть свой ИИ, но локальные модели вам не нужны, можете вообще пропустить установку Ollama. Вот самый легкий вариант запуска Open WebUI через Docker:

docker run -d \
  -p 3000:8080 \
  -e WEBUI_SECRET_KEY=your-secret-key-here \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

Когда контейнер запустится, просто откройте настройки (Settings → Connections) и вставьте API-ключ от OpenAI или другого совместимого сервиса (например, OpenRouter). Всё готово — вы получаете отличный интерфейс Open WebUI, работающий на внешних мощностях, поэтому наличие видеокарты (GPU) теряет всякий смысл.

VPS за 5-15 минут

Выделенные ресурсы и изоляция KVM для глобальных экспериментов.

Выбрать VPS

Как обновить Open WebUI

Давайте разберемся в том, как обновлять Open WebUI заранее — это сбережет вам время в будущем. При использовании Docker Compose вам не придется удалять и перенастраивать всё с нуля:

docker compose pull && docker compose up -d

Docker просто скачает новый образ и пересоздаст только те контейнеры, в которых произошли изменения. Все остальные процессы продолжат работать. Ваши данные надежно хранятся в отдельном томе open-webui, поэтому история переписок и настройки никуда не исчезнут.

Раз уж мы заговорили об этом, создание резервной копии этого тома тоже делается одной командой:

docker run --rm -v open-webui:/data -v $(pwd):/backup alpine tar czf /backup/open-webui-backup.tar.gz /data

Запускайте её перед каждым обновлением, и у вас всегда будет надежный бэкап на случай непредвиденных сбоев.

Инструменты (Tools) и пайплайны (Pipelines) в Open WebUI

Именно благодаря этим функциям Open WebUI оставляет далеко позади более простые аналоги.

Инструменты Open WebUI — это функции, которые нейросеть может вызывать прямо во время диалога: например, поискать информацию в интернете, запустить калькулятор или запросить данные через API. Вы можете добавлять их через раздел Tools в админке. Сообщество постоянно пополняет библиотеку готовых решений на сайте openwebui.com, а написать свой собственный инструмент можно на базовом Python.

Пайплайны (Pipelines) Open WebUI позволяют вам перехватывать и изменять запросы и ответы между пользователем и моделью. С их помощью можно на лету внедрять системные промпты, маршрутизировать разные запросы к разным нейросетям, ограничивать пользователям лимиты сообщений или настраивать нестандартное логирование. Пайплайны работают в отдельном контейнере и связываются с Open WebUI по внутреннему API.

Отдельно стоит упомянуть RAG (поиск и генерация на основе внешних данных) — одну из самых мощных встроенных функций Open WebUI. Вы просто загружаете документы прямо в интерфейс, и модель начинает отвечать на вопросы, опираясь именно на их текст, а не на свои общие знания. Платформа поддерживает девять различных векторных баз данных для RAG. Это значит, что систему легко масштабировать под ваши нужды: от простого локального файла SQLite до мощных кластеров на базе Chroma или Qdrant.

Инструменты, пайплайны и встроенный RAG переводят Open WebUI из категории домашних проектов в класс серьезных решений. Это готовая база, на которой можно выстроить работу целой команды или запустить коммерческий продукт.

Альтернативы Open WebUI: LibreChat, LM Studio и другие

Уже точно решили ставить Open WebUI? Смело пропускайте этот раздел. А если еще сомневаетесь, оставляем ниже сравнение конкурентов.

Open WebUI против LibreChat

Обе системы — это интерфейсы для запуска своего ИИ, которые умеют работать с разными нейросетями. LibreChat больше заточен под корпоративные задачи: здесь из коробки есть поддержка множества пользователей, архитектура плагинов и продвинутая авторизация (OAuth/SSO). Open WebUI, в свою очередь, берет простотой: он быстрее ставится, у него более лаконичный дизайн, а интеграция с Ollama встроена изначально. Если вы работаете в одиночку или в небольшой команде и планируете запускать локальные модели, Open WebUI — хороший выбор. LibreChat стоит брать только в том случае, если вам с самого начала нужна сложная система ролей и доступов.

LM Studio против Open WebUI

На самом деле, эти инструменты созданы для разных задач. LM Studio — это обычная программа для ПК. В ней удобно запускать локальные модели прямо на своем компьютере, просто кликая мышкой. Но это не сервер, к которому можно подключить команду или зайти с телефона.

Open WebUI — это веб-приложение, которое ставится на VPS и доступно отовсюду. Если вы хотите развернуть ИИ для нескольких человек или пользоваться им с разных устройств, LM Studio не подойдет. А вот для простых тестов на домашнем ноутбуке — это отличный вариант.

Из других альтернатив Open WebUI можно отметить Hollama (минималистичный чат с управлением с клавиатуры), Jan (программа для ПК в духе LM Studio) и Msty. Но ни одна из них не дотягивает до Open WebUI по сочетанию поддержки Ollama, скорости обновлений и гибкости настроек.

Заключение

Запускать свой собственный ИИ нужно далеко не всем. Но если вам важна приватность данных или вы хотите полностью контролировать рабочую среду, Open WebUI на данный момент — самый серьезный и удобный вариант для селф-хостинга.

Если коротко, вот что и на чем стоит запускать:

  • Тесты локальных моделей на процессоре (CPU): VPS уровня Premium (4 ядра / 8 ГБ ОЗУ), связка Ollama + Open WebUI. Для начала отлично подойдут модели Mistral 7B или Gemma 2B.
  • Работа через внешний API (нужна только оболочка): базовый VPS уровня Start (2 ядра / 2 ГБ ОЗУ), только Open WebUI без Ollama.
  • Запуск тяжелых моделей для сложных задач: обычный VPS не потянет, вам потребуется сервер с видеокартой (GPU).

Если вы впервые настраиваете серверные ИИ-сервисы, перед стартом стоит немного почитать о базовой работе с Linux — наша инструкция подразумевает, что вы не боитесь командной строки.

Установка Open WebUI через Docker — это правда легко. Попробуйте поднять его хотя бы раз, и станет ясно, почему все, кто собирает свой ИИ-стек, в итоге останавливаются именно на этой панели.