Сергей, открутим время назад и начнем с предыстории вашего увлечения интеллектуальными технологиями. Мне кажется вполне естественным жизненный переход музыканта-электронщика к тому, чем вы сейчас занимаетесь.
Я всю свою жизнь был на острие всего технологичного, всего современного. В интернете я с 1994 года! То есть как только появился интернет и как только он добрался до Ростова-на-Дону, я сразу нырнул туда. Он стал мне родным, а то, что меня в большей степени знают как музыкального продюсера, сложилось потому, что это наиболее яркая сторона моей жизни.
В одной из моих компаний в начале 2010-х годов мы разрабатывали приложения для айфонов, детские приложения, игры. Просто об этой части моей деятельности не очень сильно было известно. А так, изначально я инженер и учился по этой части. И сейчас занимаюсь, по сути, инженерией, только в другом ракурсе.
Мне всегда были интересны новинки, связанные с технологиями. Если в 1994 году это был интернет, то сейчас самое острие всего развития технологических процессов — искусственный интеллект и все, что с ним связано. Поэтому я этим и занимаюсь.
Какие самые интересные продукты, созданные командой Пименова, связаны именно с участием искусственного интеллекта?
Мы разбираем бизнес-процессы в компаниях, находим тонкие места, рутинные задачи и предлагаем пути решения, которые данные задачи оптимизируют. Это консалтинг с помощью искусственного интеллекта. ИИ позволяет выполнять огромное количество задач, имеющих прикладное применение. И мы занимаемся как раз тем, что придумываем применение ИИ в совершенно реальных сферах.
Одно из применений ИИ — аналитика больших данных. Например, мы сотрудничали с крупным ростовским девелопером. Чтобы понять, что ему строить, разработали сценарий жизни: спроектировали поселок, которого еще нет, с участием «синтетических персон». Создали воображаемых жителей поселка с их характеристиками и потребностями. Каждый житель был описан, придуман его пользовательский профиль: возраст, место работы, семейное положение, техническая грамотность, интересы.
Затем с «синтетическими персонами» проводили интервью. Спрашивали, что бы они хотели видеть в поселке, учитывая исходные данные. А дальше разрабатывали сценарии жизни. Как бы персоны там жили, что бы делали. В результате получили картинку, которая показывает, кто может быть жителями поселка, как они проводят время, какая требуется инфраструктура: нужно ли там строить школу или детский сад и т. д.
В реальной жизни вы не станете делать тысячу интервью с потенциальными покупателями или жителями поселка: это очень дорого и трудоемко, практически даже невозможно. И данные могут получиться очень сомнительными. А статистика, например, интервью с «синтетическими персонами», говорит о том, что попадание составляет 80%. Мы спрашиваем сначала о том, что придуманные люди хотели бы видеть, а потом, что им не нравится. Можем задать неудобные вопросы, на которые люди в реальном мире не захотят отвечать. А наша модель отвечает. И таким образом получаем данные, которые, вообще, больше никак не получишь.
Какие разработки с использованием искусственного интеллекта «Фабрика контента» уже создала для помощи журналистам?
Для любого интервьюера проблема — расшифровка аудиозаписи. Это самая нудная работа, но без нее никуда. Для облегчения процесса перевода звучащего слова в буквы я использовал одну из возможностей, широко применяемую в больших языковых моделях. Это то, что называется транскрибация, то есть расшифровка аудио в текст.
Уже существуют хорошие модели, их много, какие-то лучше понимают аудио, какие-то хуже. Но расшифровать аудио — только первая часть, потому что текст получается «грязный». Поэтому мы пошли дальше и добавили нашему боту дополнительные функции: разложить говорящих по голосам, а также создать на основе «услышанного» некую связную аннотацию. И когда мы для своих целей реализовали подобные инструменты для транскрибации, то я сразу подумал о том, что журналистам это может быть полезно, и предложил специалистам холдинга «ЕвроМедиа» протестировать нашего ИИ-помощника.
Сейчас это воплощено в виде простого, однозадачного телеграм-бота, но под его «капотом» работают сразу три ассистента. Журналист отправляет боту любую аудиозапись. Тот сначала обрабатывает и переводит аудиофайл в полный текст, потом разбивает его по спикерам, а в конце еще дает некое резюме, аннотацию, чтобы можно было быстро понять, о чем шел разговор. Весь процесс занимает не более пяти минут. Естественно, ошибки случаются, ведь наш ассистент на 100% никогда не сможет расслышать текст и из-за помех, и из-за особенностей речи. Люди могут шуметь, перебивать друг друга и так далее. Но журналист-то свой материал знает, и ему потребуется всего несколько минут на правку текста, присланного нашим помощником.
Если говорить не только о медиабизнесе, а широком круге предпринимателей, что может предложить команда разработчиков?
Если говорить о расшифровках аудиозаписей, то здесь имеется невероятный потенциал. Вот мы для своей работы придумали бота «Расшифровка разговоров», которого уже представили в публичном доступе. Я записываю сейчас все деловые встречи. Приходит ко мне человек с какой-то идеей или заказом, и мне нужно сделать ему деловое предложение.
Процесс до принятия решения раньше растягивался надолго, а сейчас после любой встречи я сразу кидаю ее аудиозапись в расшифровку. И мои боты, ассистенты выдают мне из делового разговора проблемы и вытекающие из них задачи для постановки и возможности для реализации возникших идей. Текст, полученный с помощью бота, я отправляю буквально в тот же день в течение часа заказчику и прошу его оценить результаты. И заказчик соглашается, как правило, работать дальше. После этого я беру список задач и бросаю следующему ассистенту, тот пишет мне техническое задание.
То есть я в обед поговорил с потенциальным клиентом, днем уже посылаю ему сформулированное техническое задание, а вечером, собственно, могу выставлять счет! И дальше у заказчика два пути: оплатить и начать делать, или ничего не отвечать, понимая при этом, что в техническом задании уже все разложено. А техническое задание, как та же расшифровка, — отдельная большая работа, которую никто не любит делать. И вот эту проблему я решил. Клиенту остается только подтвердить, все ли так, как он хотел, наша ИИ-модель поняла. А если все так, то можно начинать делать чистовую работу, цена которой известна. Такой бот автоматически убирает часть ненужного для бизнесмена персонала.
Разговаривать с Сергеем Пименовым и не коснуться музыкальной сферы? Чем тут удивите?
Искусственный интеллект в музыке — отдельная большая история, потому что применение ИИ в творческих задачах доставляет сильную боль представителям этого цеха. Дискуссии идут похлеще, чем в бизнесе: заменит ли ИИ музыкантов и художников? Я всегда говорю: если это плохой художник, то, конечно, заменит. Если это плохой музыкант, конечно, заменит. Тут уж, извините! Но я еще раз напомню: боты-помощники и другие наши разработки — все это инструменты.
И что боты помогли придумать? Что изображено на картинке с четырьмя латинскими буквами, как будто вырезанной из комикса?
Мне пришла такая идея: смогу ли я сделать музыкальную группу за один день? За сутки решил поставленную задачу, пробежав некий творческий марафон. Я стал накидывать картинки и быстро нашел образ группы, работающей в модном ныне K-pop`е. Ребята, которые со мной в команде, на одной волне, взяли сгенеренного мною персонажа, и мы втроем за один день создали образы участников музыкального коллектива. Потом сделали им плакаты. Я купил домен, мы сделали сайт, написали песню, открыли телеграм-канал.
То есть это был прикольный эксперимент. Я люблю такие упражнения. Просто ты сидишь-сидишь, занимаешься какими-то бизнес-задачами. Но наступает момент, чтобы сменить вид деятельности, и я говорю своим соратникам: «Сегодня мы делаем группу!» Я могу себе позволить такие творческие эксперименты, и моя команда любит такое. И вот мы условно во вторник выключились из рутинных процессов, переключились и сделали к вечеру группу NZNX c гитаристом Пикселем, прообразом которого стал мой любимый пес.
А картиночки коллектива, постеры тоже «сгенерили» своими ассистентами?
Недавно мы сделали еще одну классную штуку: обучили модель, которая делает изображения моих лиц. Теперь есть готовая разработка, генерирующая любые картинки со мной. Я могу, отправляя запросы ассистенту, создавать себя в любых вариантах. Нужен деловой имидж Пименова, пожалуйста, нужен веселый, тоже не проблема!
На создание такого помощника мы потратили несколько дней, определенную сумму денег. Как только я его выложил у себя на сайтах, получил сразу несколько запросов. Например, артистам нужен ИИ-помощник, чтобы «генерить» обложки своих альбомов, а ищущим интересную работу для портфолио. Я понимаю, что это некая виртуальная фотосессия, но в то же время созданные образы максимально приближены к реальному объекту. На орбите я, вряд ли, побываю, так почему бы не создать свое фото в космосе?!
Раньше подобное было возможно, например, в фотошопе, но это все равно не то. А сейчас я имею возможность создавать галерею образов любого человека, для чего мне понадобятся 10-20 фотографий. В течение суток я обучаю нашего помощника и потом могу выдавать массу качественных изображений этого человека.
Применение ИИ в образовании. О киберучителях сейчас не говорит только ленивый. Какие обучающие наработки есть в портфеле вашей «Фабрики»?
В принципе, все, что связано с искусственным интеллектом, очень хорошо применяется в образовании. Сами большие языковые модели содержат практически все данные мира. Соответственно, их оттуда можно извлекать и потом выдавать учащимся в доступной форме. Как ты спросишь эту модель, так она тебе и ответит. Захочешь узнать о квантовой физике, например. Если правильно задашь вопрос, получишь правильный ответит.
Вы ведь о той же квантовой физике уже сделали цикл программ?
У нас в компании появилась новая технология — создание видеокурсов, любых видео с видеоаватарами. Она позволяет записать, создать один раз свой визуальный образ и потом этим аватаром озвучивать любой текст. Возникла мысль, как бы продемонстрировать данную возможность? И неплохо бы сделать сразу что-то на контрасте. Что-то такое, что вызывало бы у зрителей, как минимум, удивление. Если с моим аватаром, то что-то не связанное с образом, в котором меня люди привыкли видеть.
И на ум пришла квантовая физика, ведь по крайней мере для меня это было что-то совершенно непонятное. Я подумал, какая классная идея — сделать курс, где я бы рассказывал, по сути, прежде всего, для себя, чтобы сам понял и чтобы азы квантовой физики стали понятны всем. Сначала я сгенерировал этот курс в текстовом виде, потом озвучил его простыми словами. И сваял в итоге десять роликов по три минуты каждый.
А специалисты вас не раскритиковали?
Нет, там даже не может быть ошибок, потому что материал разжеван очень просто. Отзывы же людей, далеких от естественных наук, поступали такие: «Я все понял». Таким образом, считаю, задача была выполнена, а я отработал технологию создания подобных обучающих материалов. И уже начал делать следующий курс под названием «Искусственный интеллект. Философия сознания», в котором будет объясняться, почему искусственный интеллект — не человек и никогда человеком не станет. Потому что это тоже очень частый вопрос, который задается.
А если говорить о более широком применении искусственного интеллекта в образовании?
Это совершенно фантастическая штука! С помощью ИИ можно получить ответы на множество вопросов в той форме, которую обучающийся человек реально понимает. Потом, это бесконечный кладезь знаний, возможность любые объемы информации интерпретировать, возможность этим объемам между собой взаимодействовать.
Представьте себе такую задачу: чтобы написать новую научную статью, проверить собственную идею или теорию, вам нужно проанализировать сто уже опубликованных работ. Существует отличная технология RAG, позволяющая это делать. Вы берете сто PDF-файлов, создаете из них векторную базу данных, которая становится дополнительным источником для модели, и дальше можете задавать вопросы с учетом этих данных. Создав такую базу однажды, вы будете получать краткое содержание не одной статьи, а всех ста.
Подобным образом можно сформировать собственную дополнительную базу. Именно это я предлагаю сейчас Южному федеральному университету: взять работы, написанные за все время существования вуза, оцифровать, создать единую базу и затем на их основе разрабатывать новые материалы, методические пособия, темы для лекций. Я общался с представителями высших учебных заведений. Они даже не думают о том, что где-то в архиве лежат работы, которые никогда не были не только оцифрованы, но и прочитаны специалистами. Между тем, возможно, в них содержатся научные открытия.
Но для создания базы данных нужно провести большую подготовительную работу. А если материалы уже есть в цифре, то можно начинать действовать прямо сейчас. Причем, есть возможность использовать сканированные документы, текстовые файлы, аудио- и видеозаписи лекций, то есть данные в любом виде.
Если подвести итог: так сможет искусственный интеллект заменить учителя или нет?
Конечно, вопрос замены учителей искусственным интеллектом звучит очень остро. И многие, когда слышат о прогрессе ИИ, думают, что профессия педагога может исчезнуть. Но давайте посмотрим глубже. Искусственный интеллект, безусловно, становится мощным инструментом в образовании. Он помогает анализировать данные, искать информацию, интерпретировать сложные материалы, создавать интерактивные курсы и даже отвечать на вопросы студентов так, как это может быть понятно каждому отдельному человеку.
Однако роль учителя гораздо шире, чем просто передача информации. Учитель — это наставник, проводник, который помогает учащимся не только получать знания, но и понимать их, развивать критическое мышление, поддерживать стремление к исследованию и самопознанию. Учитель вдохновляет, мотивирует, дарит эмоции и помогает справляться с трудностями, которые неизбежно возникают в процессе обучения. Учитель умеет слушать и слышать своих учеников, выстраивает отношения и создает среду, в которой дети растут как личности.
Искусственный интеллект не способен на настоящее понимание человеческих чувств, глубокую эмпатию. Он может подбодрить в нужный момент так, как это делает учитель, озвучить слова поддержки, но не сможет прочувствовать ученика. Он может интерпретировать данные, но не сможет интерпретировать чувства.
Я думаю, что ИИ — это помощник, ассистент, который может разгрузить учителя от рутинной работы, дать больше времени для творческой и педагогической составляющей. И именно поэтому учителя не окажутся на свалке истории. Наоборот, их роль станет еще важнее, ведь они будут теми, кто с помощью ИИ сможет делать обучение, действительно, вдохновляющим и человечным.