Цепляем визуалом, экономим когнитивные силы и веселимся

Каталог

Цепляем визуалом, экономим когнитивные силы и веселимся — как социолог использует ИИ?

12 ноября, 2024

Открыть для себя нейросети — это как ввести чит-код в игре — один раз попробуешь и не захочешь останавливаться. Мы продолжаем делиться инсайдами тех, кто взломал рабочую рутину с помощью ИИ. В этот раз пообщались с социологом города бюро исследований «Гражданская инженерия» Петром Ивановым и узнали, какие задачи специалист делегирует нейросетям. А еще получили рекомендации от Василисы Болотовой, преподавателя нашего интенсива «Основы ИИ для тех, кто работает в недвижимости».

В целом, использую нейросети с большой осторожностью в своей деятельности, однако в большинстве случаев рабочего применения доволен результатом.

Создавать цепляющий и безопасный визуал

Использую для своего телеграм-канала «Урбанизм как смысл жизни» нейросеть Ru-Dalle. Она помогает мне генерировать картинки для постов. Каждый пост я сопровождаю картинкой.

Когда я пишу про наши в бюро исследований «Гражданская инженерия» полевые исследования и реальные проекты, проблема визуального контента не стоит — мы создаем его сами в процессе работы. Совсем другое дело, когда я работаю с другими направлениями своего блога — публицистикой и популяризацией научной литературы. С версии 3.1 Ru-Dalle генерирует симпатичные и цепляющие изображения в самой разной стилистике и неплохо понимает промпты.

Хотя бывают и сложности. Я хотел рассказать про выявленные нами с коллегами по Высшей школе урбанистики в 2014 году 4 типа горожан в российских региональных столицах, и Ru-Dalle упорно не понимал числительное «четыре» или цифру 4 и всегда рисовал больше типов горожан.

В целом, я доволен работой с этой нейросетью, она делает мой стиль блоггинга безопасным с точки зрения авторских прав на визуальный контент.

Промпты я пишу очень по-разному, недавний успех — промпт «плотность населения агломерация депрессия городская среда» для иллюстрации рассказа об открытии китайских ученых про влияние плотности населения на симптоматику депрессии. Получилась с некоторой попытки очень удачная и атмосферная картинка в стиле примитивизма.

Иллюстрация для телеграм-канала «Урбанизм как смысл жизни», сгенерированная нейросетью Ru-Dalle

Во-первых, ни одна нейросеть с первого раза не дает тот результат, к которому вы стремитесь. В редких случаях происходит мгновенное попадание. И то, когда первый входной промпт был хорошо продуман и сконструирован. Всегда нужно несколько генераций — и для картинок, и для текста, и тем более для видео.

Во-вторых, особенности построения промпта. Когда мы описываем желаемое, качественно улучшить понимание смысла нейросетью может такая штука как «негативный промпт». Он как раз хорошо работает с ИИ для генерации картинок. Это список характеристик, которые мы не хотим видеть на изображении. Если нам нужно четыре человека на картинке, значит можно попробовать написать в промпте «не более четырех человек» или «избегай изображения более чем четырех человек, толпы, больших групп» и т. п.

К тому же, оригинальные нейросети часто недоступны из-за санкций и оплатить их русской картой мы не можем. Поэтому некоторые аналоги интегрируют ИИ в телеграм.
Значит, это ИИ-бот, т. е. ассистент, скроенный внутри нейросети и вынесенный во вне (в телеграм) при помощи API. Короче говоря, что-то типа нейробота. Это значит, что мы как пользователи взаимодействуем с ИИ через интерфейс бота, который все так же идет на сервер оригинального ИИ и, например, генерит картинку там. Есть вероятность что из-за такой надстройки образуется сломанный телефон. Бот передает наш запрос на сервер и возвращает ответ. Скорее всего задача бота — переводить с нашего русского на английский (на котором создана нейросеть). Сразу вопрос к переводчику, который там встроен. Например, в русском и английском языках есть принципиальная разница в понимании числительных — как они согласуются с существительными, как используются падежи и т. д. Поэтому результат может быть непредсказуемым. Лучше, конечно, избегать ботов и искать способы использовать нейросети в оригинале и без надстроек от сторонних разработок.

Василиса Болотова

ИИ-менеджер интенсива «Основы ИИ для тех, кто работает в недвижимости»

Экономить когнитивные силы

Текстовые нейросети помогают мне работать с интервью. Как социолог и как редактор в журнале «Экоурбанист» я постоянно работаю с материалами интервью. Но есть некоторая специфика, отличающая устную речь от письменной речи — особый порядок слов, пропуск значимых для письменной речи частей в устной речи, неправильное построение предложений (иногда прямо катастрофическое, когда собеседник говорит ярко и эмоционально). При восприятии устной речи в моменте мы это зачастую не замечаем и нам все понятно. Но когда устная речь транскрибируется в письменную, становится понятно, что все было не так хорошо, как в моменте. Поэтому я периодически использую нейросеть Яндекса [YandexGPT — примеч. редактора] для того, чтобы она конвертировала транскрипт в грамотную письменную речь. Это помогает при анализе и презентации текста.

Фрагмент интервью в журнале «Экоурбанист», отредактированный с помощью нейросети YandexGPT

Конечно, нужно внимательно следить за сохранностью смысла, поэтому даже хорошо, что конверсия осуществляется небольшими порциями. Но это правда помогает экономить когнитивные силы, которые лучше уделить анализу или смысловой редактуре. Нейросеть Яндекса неплохо понимает промпт про стили речи, в особенности ей удаётся нейтрально-аналитический стиль, который мне для всех моих задач как раз и нужен.

Нейросети Яндекса объективно хорошо справляются с редактированием русскоязычного текста. Задача транскрибаторов — переводить аудио в текст так, как есть. Поэтому для стилистических корректировок всегда подойдет ChatGPT или Claude. К тому же у ChatGPT недавно вышло прекрасное обновление для работы с текстами внутри самого чата. Немаловажно, что такие нейросети постоянно развиваются и в них есть функции анализа контекста, что также может значительно повлиять на качество редактуры текста.

Василиса Болотова

ИИ-менеджер интенсива «Основы ИИ для тех, кто работает в недвижимости»

Повеселиться и повеселить

Еще я баловался с нейросетями, встроенными в телеграм, например, с Suno для генерации смешных песен, чтобы повеселиться самому и повеселить друзей. С этой задачей она справляется неплохо, хотя слишком подвязана на текст. Скажем, инструменталы в ней генерить сложно, так что для серьезной работы со звуком она не подходит.

Боты в телеграм часто упрощают интерфейс нейросетей, поэтому многих фич мы просто не видим. Тут возвращаемся к тому же — все надстройки непонятно как и кем сделаны. И сделаны они скорее всего не для полноценной работы, а развлечения ради и чтобы заработать на подписке пользователей, потому что такое развлечение действительно затягивает.

Василиса Болотова

ИИ-менеджер интенсива «Основы ИИ для тех, кто работает в недвижимости»

Поможем делегировать ваши задачи нейросетям — на интенсиве «Основы ИИ для тех, кто работает в недвижимости». За две недели вы сможете посмотреть видеоуроки в удобное время, получать рекомендации от эксперта по ИИ Василисы Болотовой и обмениваться опытом с коллегами в специальном чате. Даже предоставим вам бесплатный доступ к самой популярной модели ChatGPT (все для вас 💙). Присоединяйтесь — стартуем уже 27 ноября clck.ru/3EZNb9

Вернуться к статьям