Меню

«Нет волшебного промпта, который напишет за вас «Войну и мир». Придется потратить время»

Автор фото: Денис Полуэктов. Иллюстрация: NetAngels

Директор NetAngels Антон Халиков — о том, что нужно знать о нейросетях для того, чтобы получить желаемый результат от их использования и повысить свою эффективность.

Сегодня все чаще звучат опасения, что в будущем многие специалисты из разных областей столкнутся с ситуацией, когда им скажут: «Мы больше не нуждаемся в ваших услугах, потому что вас заменила нейросеть». Однако опыт показывает, что этот прогноз не столь однозначен. Даже востребованный многими ChatGPT иногда выдает тезисы, которые не только не решают поставленные задачи, но и не соответствуют действительности.

В колонке для DK.RU директор NetAngels Антон Халиков объяснил, почему это происходит, и как сделать нейросети надежным рабочим инструментом:

— Нейросети пока не способны заменить специалистов, но уже сегодня могут сделать их гораздо более эффективными. Для того чтобы правильно использовать этот инструмент, важно не только применять готовые промпты, но и понимать основы промпт-инжиниринга. Рано или поздно наступит момент, когда хрестоматийные промпты для решения задач не подойдут. А знание принципов работы искусственного интеллекта позволит быстро адаптироваться и повышать свою ценность для работодателя.

Дальше я буду рассказывать про большие языковые модели (LLM), которые используются нами чаще всего. Грубо говоря, это нейросети, которые работают с текстом (такие, как Chat GPT). Все они устроены по одинаковому принципу. И вы удивитесь, но они ничего не знают про текст.

Как устроены нейросети?

LLM разбивает фразу на токены и работает с ними, как с числами. Этот процесс — основа работы больших языковых моделей.

Например, в фразе «мама мыла раму» каждый токен (часть слова) имеет свой числовой эквивалент:

  • например, «ма» — это 10,
  • второе «ма» — 25,
  • «мы» — 13,
  • «ла» — 17.

Задача модели — при получении набора токенов (например, 10, 25, 13), предсказать, что последует за этим набором. Благодаря обучению на огромных массивах текстов, нейросеть может с высокой долей вероятности предсказать, что следующим токеном будет 17 («ла»), и завершить фразу «мама мыла». Предсказание того, какой токен будет следующим — это единственная задача, которую большие языковые модели способны выполнять очень хорошо.

У LLM нет памяти и сознания, она не сохраняет информацию о предыдущих запросах. Однако для того, чтобы предсказывать следующий токен, она использует десятки и даже сотни миллиардов параметров. Эти параметры содержат знания, извлеченные из энциклопедий, учебников и книг, написанных человеком. Однако модель не имеет сознания, чтобы вспомнить конкретный отрывок из книги — она анализирует контекст математическими методами.

В этом смысле, к нейросетям можно относиться, как к ребенку вундеркинду: с одной стороны он обладает обширными знаниями, с другой стороны — он не может их применить без сторонней помощи.

Почему это важно? От того, как мы формулируем наш запрос для нейросети, зависит результат. И если мы просим ее написать текст или провести анализ чего-то, не давая дополнительных сведений — вряд ли мы получим то, на что рассчитывали. 

Представим, что вы выбираете холодильник в офис, и вам нужно сравнить две модели — А и Б. Если мы спросим, чем А лучше Б, в ответ большая языковая модель напишет, что это зависит от личных предпочтений каждого либо выдаст какую-то отсебятину, которая вас вряд ли удовлетворит.

В данном случае, чтобы увидеть адекватное сравнение, можно:

  • попросить привести сильные и слабые стороны каждой из этих моделей,
  • обозначить конкретные критерии для сравнения (например, количество компрессоров, уровень шума, энергоэффективность).

Другой вариант — можно дать нейросети обзорную статью про модели А и Б, сформулировать свой запрос и попросить опираться только на предоставленный ей источник информации.

Почему у LLM происходят галлюцинации?

Языковая модель интерпретирует смысл запроса по-разному — в зависимости от контекста и используемых слов. Она обрабатывает сотни тысяч токенов и выбирает комбинацию, которая с наибольшей вероятностью подойдет в качестве ответа.

Иногда, не владея достаточным контекстом, нейросеть пытается адаптироваться, и возникает такое явление, которое называют галлюцинацией. На самом деле, те, кто используют нейросети, часто с ними сталкиваются.

Простой пример. Недавно я спросил одну из нейросетей:

Сколько лет будет президенту США в 2024 г.?

Она ответила: 

В 2024 г. президентом США является Джо Байден, ему 81 год, но его срок полномочий заканчивается, поэтому следующему президенту будет 58 лет.

Откуда она взяла 58 лет, и о ком говорила? Не понятно. И подобные спонтанные ответы — это как раз галлюцинация. В данном случае ее можно было бы избежать, если бы мы написали, что речь идет только о Байдене, и нас не интересует, кто будет после него и какой возраст у этого человека.

Все нейросети перед тем, как стать доступными публике, долго учатся на больших объемах данных, которые ограничены определенным периодом — для актуальных LLM это конец 2023 г. Поэтому сами они не владеют информацией о том, что случилось в 2024 г. Но им всегда можно дать контекст в виде ссылки на новость. И тогда в рамках конкретного запроса, включающего этот контекст, нейросеть будет в курсе более свежих событий. Соответственно, сейчас нейронные сети, отвечая на вопросы о 2024 г., могут либо сочинять, либо галлюцинировать — как это случилось в примере выше.

Языковая модель без дополнительных инструментов не знает, какой сегодня день, месяц и год. Поэтому для вычисления возраста человека или для произведения каких-то других расчетов, ей необходимо четко указать, что и с чем сравнивать. Например, запрос может быть сформулирован так:

Вычисли, сколько времени прошло с момента такого-то события, если сегодня 1 сентября 2024 г. 

Еще один прием, который поможет исключить «галлюцинации» нейросети — пошаговое решение задач. Например, если вернуться к запросу о возрасте президента США, полезно использовать следующую формулировку:

Не отвечай на вопрос сразу: сначала пошагово напиши, как ты будешь проводить расчет, а потом посчитай.

Почему это работает? Потому что в этом случае нейросеть формирует свой ответ поэтапно, сначала решая более простую задачу («напиши пошагово, как будешь отвечать на вопрос»). А потом, когда дело уже дойдет до формулировки финального ответа, нейросеть будет видеть предложенный ею же самой алгоритм решения задачи, что позволит сформировать финальный ответ более точно — она как будто бы подглядывает в собственную шпаргалку.

Как создавать контент?

А как быть в случае, когда нам нужно решить какую-то креативную задачу, например, написать статью? Допустим, вы ведете блог сети салонов оптики, и вам нужно написать текст о том, как правильно подобрать солнцезащитные очки. Если просто попросить нейросеть это сделать — скорее всего, она выдаст набор противоречивых сведений. Во-первых, она сама никогда очки не выбирала, а во-вторых, она не знает, какой именно текст вы хотели получить.

Для решения этой задачи, языковую модель также необходимо снабдить определенным контекстом. Если вам нужно, чтобы в тексте были какие-то определенные сведения — эту информацию стоит указать в запросе.

Работу над созданием статьи тоже можно выстроить пошагово.

  • Сначала можно попросить нейросеть составить план материала на эту тему.
  • Количество пунктов и их содержание можно скорректировать в ручном режиме, удаляя и дополняя то, что считаете нужным.
  • Затем можно попросить нейросеть написать текст по этому плану.
  • И если какой-то из разделов показался неполным или некорректным — его можно доработать отдельно по той же схеме.

Повысить шансы на получение желаемого результата можно, если показать нейросети несколько примеров текстов, которые подходят вам по стилистике или по своей структуре. Либо снабдить ее конкретными источниками информации и поставить задачу — опираться в ходе подготовки статьи только на них и не использовать ее внутренние знания. Это позволит в очередной раз избежать галлюцинаций.

К сожалению, нет такого волшебного промпта, который напишет за вас книгу «Война и мир» — нейросети не способны на такие вещи. В каждом случае нужно подходить к решению задачи итеративно. Постоянно уточняя условия решения задачи, можно не только избежать галлюцинаций нейросети, но и получить действительно классный результат.

Некоторые полагают, что нейросети способны заменить журналистов, копирайтеров, фотографов, видеографов, дизайнеров и других представителей творческих профессий. Но на креатив они не способны.

Чтобы создать креативный продукт с помощью нейросети, нужно, чтобы креативная идея была в голове человека. И пусть иногда вам придется тратить достаточно много времени на составление подробного технического задания — в итоге с ее помощью вы все равно решите задачу быстрее, чем самостоятельно. И возможно именно с помощью нейросетей вы сможете создавать более совершенный контент.

Ранее на DK.RU: «Использование собственных нейросетей защитит компанию от утечек»: что для этого нужно?

Реклама. ООО «ИНТЕРНЕТ-ПРО» ИНН 6671142678 erid:LjN8KUak3