Шрифт:
Эта команда указывает Midjourney, какой именно образ вы хотите увидеть.
Когда бот завершает генерацию изображения, он предоставляет вам четыре варианта изображения, которые соответствуют вашему запросу. Под созданными изображениями вы увидите кнопки “U1”, “U2”, “U3”, “U4” и “V1”, “V2”, “V3”, “V4”. Вот что они означают:Кнопки “U” и “V”
o Кнопки “U” (Upscale) – позволяют увеличить и улучшить выбранное изображение. Например, нажав “U1”, вы выберете первое изображение и получите его в более высоком качестве с улучшенными деталями.
o Кнопки “V” (Variation) – позволяют создать вариации выбранного изображения. Например, нажав “V2”, вы получите несколько новых изображений, основанных на втором варианте.
Эта кнопка позволяет отправить запрос повторно и сгенерировать новый набор изображений на основе исходного текста. Если вас не устраивают предложенные варианты, вы можете использовать “?” для перегенерации.Кнопка “? (Reroll)”
Midjourney позволяет добавлять параметры к вашим запросам, чтобы управлять конечным результатом. Параметры могут включать:Управление параметрами
–ar (Aspect Ratio) – задаёт соотношение сторон изображения. Например:
/imagine prompt: Зима в горах –ar 16:9
–q (Quality) – управляет качеством изображения. Чем выше качество, тем больше ресурсов будет потрачено на его создание, но результат будет детализированнее. Например:
/imagine prompt: Портрет старика –q 2
После того как вы сгенерировали изображение, вы можете сохранить его на своё устройство. В Discord достаточно открыть изображение и выбрать опцию сохранения. Кроме того, Midjourney предоставляет онлайн-галерею, где сохраняются все изображения, созданные вами, что позволяет легко управлять своим творчеством и делиться результатами с другими.Просмотр галереи и сохранение изображений
Простой промпт для первого изображения: “Солнечный закат над городом”
Для того чтобы почувствовать, как работает Midjourney, давайте начнем с простого промпта – “Солнечный закат над городом”. Этот запрос поможет вам понять, как AI интерпретирует базовые концепты и создает красивые и реалистичные изображения.
Как правильно составить запрос
Когда вы составляете запрос, важно учитывать, что чем конкретнее будет ваше описание, тем точнее будет результат. В случае с “Солнечным закатом над городом” нейросеть будет анализировать следующие ключевые слова: – “Солнечный закат” – описывает атмосферные условия и время суток. – “Над городом”– указывает на то, что основным элементом изображения будет город.
Введите команду в чате Discord:
/imagine prompt: Солнечный закат над городом
После отправки команды бот начнет процесс генерации изображения, используя ваше описание. Спустя несколько минут вы увидите четыре варианта изображения, каждый из которых интерпретирует ваш запрос по-разному. Вы можете выбрать понравившийся вариант и увеличить его с помощью кнопок “U” или создать новые вариации с помощью кнопок “V”.
Анализ результата
Когда изображения будут готовы, обратите внимание на то, как Midjourney интерпретировал ваш запрос. Вероятно, каждое из изображений будет иметь разные особенности: где-то закат будет более ярким, где-то акцент будет сделан на архитектуру города. Этот процесс помогает понять, как нейросеть работает с ключевыми словами и какие элементы она выделяет.
Использование простых промптов, таких как “Солнечный закат над городом”, – отличный способ начать работу с Midjourney и понять основы взаимодействия с платформой. Со временем вы сможете усложнять свои запросы, добавляя больше деталей и параметров, чтобы получать изображения, максимально соответствующие вашим задумкам.
Глава 2: Как работает Midjourney?
Midjourney – это впечатляющая платформа, которая использует мощь искусственного интеллекта для создания изображений на основе текстовых запросов. Эта технология основана на использовании генеративной нейросети, которая обучается на огромных объемах данных, чтобы понимать текст и преобразовывать его в визуальные формы. В этой главе мы рассмотрим, что такое генеративная нейросеть, как она обучается, и как Midjourney “понимает” ваши запросы и превращает их в изображения.
Что такое генеративная нейросеть и как она обучается
Генеративная нейросеть – это особый тип искусственного интеллекта, способный создавать что-то новое на основе обучения. В отличие от традиционных алгоритмов, которые просто классифицируют или предсказывают, генеративные нейросети способны генерировать оригинальный контент. Такие сети обучаются на огромных массивах данных, что позволяет им понимать сложные связи между разными аспектами изображения, такими как форма, цвет, текстура и композиция.
Midjourney использует генеративно-состязательные сети (GAN, Generative Adversarial Networks), которые состоят из двух частей: генератора и дискриминатора. Генератор создает изображения, в то время как дискриминатор оценивает, насколько эти изображения соответствуют реальным примерам. Эти две сети соревнуются между собой: генератор стремится создавать всё более правдоподобные изображения, а дискриминатор учится их различать. Это взаимодействие улучшает результаты, и в конечном итоге генератор создает настолько реалистичные изображения, что они становятся неотличимыми от настоящих.