Нажмите "Enter" для перехода к содержанию

Ваш самый ожидаемый хак генерации ИИ — Часть 2.

Создавайте качественные AI-изображения даже без GPU, на этот раз дешевле, а точнее — 100% бесплатно — никаких условий.

В первой части этой серии мы исследовали, как настроить и использовать Fooocus на вашем локальном компьютере для генерации качественных изображений, которые можно сравнить с теми, что производит Midjourney — и все это без подписок. Однако не у всех есть доступ к мощному GPU или необходимому оборудованию для запуска ресурсоемких AI-моделей локально.

Вот здесь и вступает в игру Google Colab. Я все еще считаю, что Fooocus требует большего внимания, так как он чувствуется недооцененным. Я использовал более десятка платформ для генерации изображений как с открытым исходным кодом, так и платных. Но все же Fooocus среди них выглядит очень привлекательно.

В этой части мы углубимся в то, как вы можете использовать Google Colab, бесплатную облачную платформу, для запуска Fooocus без необходимости в дорогом оборудовании. Мы кратко познакомим вас с Google Colab, проведем вас через настройку Fooocus в этой среде с использованием предоставленного кода и объясним, как использовать Fooocus с его основными функциями.

Введение в Google Colab

Google Colaboratory, обычно известный как Google Colab, — это бесплатный облачный сервис, предлагаемый Google Research. Он позволяет вам писать и выполнять код на Python через ваш браузер, используя вычислительные ресурсы Google, включая GPU и TPU.

Ключевые функции Google Colab

  • Облачная среда: Установка не требуется; все выполняется в облаке.
  • Бесплатный доступ к GPU: Используйте NVIDIA Tesla GPU для вычислительных задач.
  • Простота использования: Интерфейс, похожий на Jupyter Notebooks.
  • Интеграция с Google Drive: Легко сохраняйте и управляйте своими проектами.

Будь вы ученым в области данных, энтузиастом машинного обучения или человеком, заинтересованным в генерации AI-искусства, Google Colab предоставляет удобную и мощную платформу для запуска вашего кода без ограничений оборудования.

Почему стоит использовать Google Colab для Fooocus

Запуск Fooocus локально требует производительного GPU и достаточного объема VRAM, которые могут быть недоступны для всех. У меня RTX 4060 и 32 ГБ оперативной памяти, что достаточно согласно документации к Fooocus. Но поверьте, когда вы действительно работаете, этого может оказаться недостаточно. Google Colab устраняет этот разрыв, предоставляя бесплатный доступ к высокопроизводительным GPU, что делает его идеальной средой для запуска ресурсоемких приложений, таких как Fooocus.

Преимущества использования Google Colab для Fooocus

  • Нет необходимости в инвестициях в оборудование: Запускайте ресурсоемкие задачи без наличия GPU.
  • Доступность: Работайте с любого устройства с доступом в интернет.
  • Масштабируемость: Используйте мощные GPU для более быстрой генерации изображений.

Запуская Fooocus в Google Colab, вы можете генерировать изображения AI качества Midjourney без ограничений аппаратного обеспечения вашего локального компьютера.

Настройка Fooocus в Google Colab

Чтобы начать работать с Fooocus в Google Colab, вам понадобится учетная запись Google. Вот как настроить вашу среду с использованием предоставленного кода.

Предварительные условия

  • Учетная запись Google: Зарегистрируйтесь бесплатно, если у вас ее нет.
  • Подключение к интернету: Стабильное соединение для доступа к Colab и загрузки необходимых файлов.

Пошаговое руководство

Шаг 1: Доступ к Google Colab
Откройте веб-браузер и перейдите на Google Colab.
Войдите в систему с помощью своей учетной записи Google.

Шаг 2: Создайте новую записную книжку
Нажмите “File” > “New Notebook”.
Переименуйте свою записную книжку во что-то описательное, например, “Fooocus_AI_Image_Generation”.

Шаг 3: Настройка среды выполнения
Нажмите “Runtime” > “Change runtime type”.
В разделе “Hardware accelerator”, select “GPU”.
Нажмите “Save”.

Шаг 4: Установка зависимостей и клонирование Fooocus
В первой ячейке вашей записной книжки вставьте следующий код:

!pip install pygit2==1.15.1
%cd /content
!git clone https://github.com/lllyasviel/Fooocus.git
%cd /content/Fooocus

Объяснение:

  • !pip install pygit2==1.15.1: Устанавливает конкретную версию pygit2, необходимую Fooocus.
    %cd /content: Изменяет каталог на корневую папку содержимого в Colab.
  • !!git clone https://github.com/lllyasviel/Fooocus.git: Клонирует репозиторий Focus из GitHub.
  • %%cd /content/Focus: Позволяет перейти в каталог Focus.

Нажмите Shift + Enter, чтобы запустить ячейку.

Шаг 5: Запустите Focus
В следующей ячейке выполните следующую команду:

!python entry_with_update.py --share --always-high-vram

Объяснение:

  • entry_with_update.py : Скрипт точки входа для Focus.
  • —share: Генерирует общедоступный URL-адрес для доступа к веб-интерфейсу.
  • —always-high-vram: гарантирует, что Focus будет работать в режиме с высоким уровнем видеопамяти.

Выполнение этой ячейки запустит Focus и предоставит вам общедоступный URL-адрес.

Использование Fooocus: Основные функции и руководство

Теперь, когда Fooocus запущен и работает, давайте рассмотрим его основные функции и как эффективно их использовать.

Интерфейс Fooocus

При доступе к веб-интерфейсу вы увидите удобный интерфейс с несколькими ключевыми компонентами:

  • Поле ввода запроса: Здесь вы вводите текстовый запрос, описывающий изображение, которое хотите сгенерировать.
  • Поле отрицательного запроса: Укажите элементы, которые хотите исключить из изображения.
  • Параметры генерации: Настройте такие параметры, как количество шагов выборки (sampling steps), масштаб (guidance scale) и разрешение изображения (image resolution).
  • Кнопка генерации: Запускает процесс генерации изображения.
  • Область отображения результатов: Показывает сгенерированные изображения.

Пошаговая инструкция по использованию

Шаг 1: Введите ваш запрос

В поле ввода запроса введите описательное предложение о изображении, которое вы хотите сгенерировать. Например («Безмятежный пейзаж с горами на закате, цифровое искусство»):

"A serene landscape with mountains during sunset, digital art"

Сгенерированный результат с настройками по умолчанию — занял менее 30 секунд ❤

Шаг 2: Используйте отрицательные подсказки (необязательно)

В поле Negative Prompt Field (Отрицательные подсказки) укажите все элементы, которых вы хотите избежать. Установите флажок «Заранее» внизу, чтобы просмотреть все эти дополнительные настройки.

Например:

"trees, flowers"

Шаг 3: Настройка параметров генерации

  • Выбор производительности (Performance selection): Управляет количеством итераций при генерации изображения.

Рекомендация: Начните с 30 (опция скорости) для достижения баланса между качеством и скоростью.

  • Стиль (Style): Определяет, в каком стиле нужно генерировать изображение.

Рекомендация: По умолчанию используется fooocus. Но это зависит от желаемого художественного стиля.

  • Соотношение сторон (Aspect ratio): Выберите желаемое разрешение вывода.

Примечание: Для более высоких разрешений может потребоваться больше видеопамяти, а на создание может потребоваться больше времени.

Шаг 4: Создайте изображение

Нажмите кнопку “Создать” (Generate), чтобы начать процесс создания изображения.

Шаг 5: Просмотр и сохранение изображения

  • Как только генерация завершится, изображение появится в области отображения результатов.
  • Вы можете сохранить изображение, щелкнув правой кнопкой мыши и выбрав “Сохранить изображение как…” или использовать иконку загрузки в правом верхнем углу.

Изучение основных функций

Проектирование подсказок (промптов)

Создание эффективных подсказок — ключ к получению желаемого результата.

  • Будьте описательными: Включите детали о сцене, стиле и элементах.
  • Уточняйте стили: Упомяните художественные стили или конкретных художников для стилистического влияния.

Отрицательные подсказки

Используйте отрицательные подсказки для фильтрации нежелательных элементов.

Распространенные отрицательные подсказки:

— “размытое”
— “зернистое”
— “искаженное”
— “текст”
— “плохие руки” (поскольку обычно генерация изображений ИИ все еще испытывает трудности с созданием рук.)

Управление сидом

Случайный сид: Генерирует новое изображение каждый раз.
Фиксированный сид: Воссоздает то же самое изображение, если подсказка и настройки не изменены. (не на 100% одинаково, но вы, скорее всего, не заметите разницы, так как сид управляет случайностью процесса генерации.)

Использование: Полезно для настройки параметров, сохраняя базовое изображение постоянным.

Пакетная генерация

Размер пакета: Количество изображений, которые нужно сгенерировать для каждой подсказки (более крупные размеры пакетов потребляют больше ресурсов).
Количество пакетов: Количество пакетов для обработки.

Советы по оптимизации Fooocus в Colab

Хотя Google Colab предоставляет бесплатный доступ к GPU, есть некоторые ограничения и лучшие практики, которые следует учитывать.

Управление ресурсами

Ограничения видеопамяти: У GPU в Colab ограниченная видеопамять.
Решение: Уменьшите разрешение изображения или размер пакета, если встретите ошибки памяти.

Длительность сеанса: Сессии Colab могут отключаться после периодов неактивности.
Совет: Оставайтесь активными или рассмотрите возможность использования Colab Pro для более длительных сессий.

Сохранение выходных данных

  • Локальные загрузки: Сохраняйте изображения напрямую на свой локальный компьютер.
  • Интеграция с Google Drive:
    Подключите свой Google Drive, чтобы сохранять выходные данные на постоянной основе.
    Добавьте следующий код в новую ячейку:
from google.colab import drive drive.mount('/content/drive')
  • Измените путь сохранения в Fooocus, чтобы он указывал на ваш Google Диск.

Мониторинг производительности

  • Системные метрики (System Metrics): Используйте встроенные инструменты Colab для мониторинга использования GPU.
  • Избегайте перегрузки (Avoid Overloading): Одновременный запуск нескольких тяжелых процессов может замедлить работу или вызвать сбой сессии.

Заключение и следующие шаги

Используя возможности Google Colab, вы можете запустить Fooocus и создавать впечатляющие AI-изображения, не беспокоясь об аппаратных ограничениях. Этот облачный подход делает генерацию AI-арта доступной для более широкой аудитории, открывая новые возможности для творчества и инноваций.

Что дальше?

В будущих статьях мы углубимся в:

  • Расширенные функции Fooocus: исследование инженерии подсказок, смешивания стилей и многого другого.
  • Оптимизация производительности: советы и рекомендации для максимальной выгоды от Fooocus.
  • Пользовательские модели и расширения: улучшение Fooocus с помощью дополнительных моделей и плагинов.

Оставайтесь с нами, чтобы получать больше инсайтов и учебных руководств, которые помогут вам стать профессионалом в использовании Fooocus и поднять ваше AI-сгенерированное искусство на новый уровень.

Благодарности команде Fooocus за то, что сделали генерацию AI-арта доступной для всех.
Репозиторий Fooocus на GitHub

Обсуждение закрыто.