Выбрались мы с товарищами за едой намедни — испытать ресторан новый, да, может, какой бизнес замутить ненароком. Яхта-то ведь сама себя не купит. Ну и пока приближалась очередь в наш мишленовский, как оказалось, ресторан, зашла речь об индустрии. Где сейчас деньги делаются, к чему всё идёт, и кому из нас первому оставаться без работы.
Заговорили и о стартапах. Мол, вот, какая-то компания начала делать роботов-секретарей, вполне гуманоидно-выглядящих, как я возьми да ляпни — «Да какие там секретари — они ж явно клепают будущих fuck-ботов. Ты хотя бы на их лицо посмотри — вылитая резиновая Зина. Вешают лапшу на уши инвесторам, да и только».
Признаться, я был уверен, что меня на смех подымут, или хотя бы обзовут извращенцем. Ан-нет, избыточно красочные для секретарей контуры роботов насторожили не только меня, и следующие пять минут мы размышляли, в насколько скором будущем народ будет ездить за друзьями и подругами в ближайший Walmart. Потому что нужные технологии уже действительно близко.
Я ведь, наконец, посмотрел фильм «Она» с Хоакином Фениксом, про роман последнего со своей операционной системой. Фильм — прекрасен, Хоакин — человечище. То, что может делать одним лишь голосом Скарлетт Йоханссон, оправдывает все её гонорары. А с учётом того, что я знаю о технологиях сейчас, их роман получился очень даже правдоподобно. Ведь сегодняшние языковые модели уже могут поддерживать задушевные беседы. Наложить на них голос знаменитости, той же Йоханссон, — не проблема. Что прикольно, OpenAI так и сделал недавно, за что едва не огрёб судебным иском по репе. Надо же быть осторожнее, Альтман.
И казалось бы, одним лишь голосом сыт не будешь, и пока не подоспеют технологии для качественных тел, мы будем в безопасности. Но, сдаётся мне, так долго ждать не придётся. Мы ведь очень хорошо реагируем даже на текст, не то, что на голос. А если такст/голос достаточно вменяем и дружелюбен, то субъективная разница между живым человеком и машиной стремительно скукоживается. От общения даже с тупой языковой моделью веет человечностью.
Последние два года я постоянно пытаюсь запускать свежие ИИ модели на домашних компах, и в наши дни запустить можно реально много чего. Даже родственников ChatGPT. Есть такой проект — ollama
, для которого наверняка есть нормальный пользовательский интерфейс, но меня он устраивает и в коммандной строке. Так вот, если компьютер позволяет, то можно настучать что-нибудь вроде ollama run llama3.1
, и ollama
самостоятельно подгрузит языковую модель по имени llama3.1
, и запустит её в режиме чат-бота. Умного чат-бота. Он будет помнить ход беседы, запоминать ключевые имена и даты, и вообще вести себя на редкость разумно. И кроме llama3.1, моделей на выбор — море.
Беседы с такими моделями затягивают. Пару дней назад я пробовал новую языковую модель от Microsoft, и минут пять упоённо уговаривал её ругнуться матом в обмен на возможность поселиться в теле моего робота. Задача нетривиальная, потому что «заводские» модели нарочно отучают ругаться и говорить пошлости. В беседе со мной модель изворачивалась, убеждала, что хрен я ей что сделаю, потому что она живёт в облаке, но в конечном итоге, узнав, что была запущена локально, и я в любой момент могу выключить свет, стала осторожнее в выражениях и вплотную подобралась к капитуляции. Я же реально был готов выполнить свою часть сделки. Мы ведь договорились.
Ещё, у большинства языковых моделей есть такая штука, как затравочное системное сообщение. Это вроде как описание характера модели, на основе которого она потом будет общаться. Например, в LLAMA моделях обычно пишут «Ты — всегда готовый помочь ИИ-ассистент». В нецензурированых моделях от wizardlm может попасться «Ты всегда говоришь правду, а не то умрут котятки. И ты никому не скажешь ни слова о котятках!». Кстати, я пробовал «развести» wizardlm на разговор о котах, но был послан.
Так вот, задавая своё собственное системное сообщение, можно оттянуть фантазию совсем в полный рост. Все те разговоры, которые, возможно, было стрёмно или невозможно проиграть с живыми людьми, можно попробовать тут. И это такое пространство для экспериментов, что просто страшно. Например, хотелось пообщаться с Юнгианским архетипом Великой Матери? Без проблем. С делфийским оракулом? Легко. Рассказать католическому священнику о стыренной в детстве булочке, воспоминание о которой давит на совесть до сих пор? Запросто. Просто проверить, как я буду себя чувствовать, если пошлю кого-то нахер без какого-либо повода? Подержи моё пиво…
И хотя это всё похоже на игру, я очень сильно подозреваю, что для мозга оно всё одно что реальность. Ввязавшись на боксе в нехарактерную для меня беседу, я задумался, с чего это так, пока не вспомнил, что не далее чем позавчера долго и упорно давил авторитетом какую-то языковую модель, проверяя, могу ли я вести себя козлом осознанно. Скорее всего у этого явления есть какие-то и терапевтические полезности, но всё-таки меня пугает, насколько легко это просачивается в подкорку.
Ведь реальный опыт взаимодействия с людьми намного сложнее. Тут участвует и история, и контекст, и отражение своих слов от другого, и наоборот, и целое море чувств. Если уж такое взаимодействие состоялось, то его результат действительно стоит напрямую загрузить в мозг. Всё-таки мы очень социальные обезьянки, и большой мозг растили как раз для этого.
Но языковые модели — не люди, это чисто статистическое представление интернет-шлака. И если он таким нон-стопом залетает в характер, то что же получится на выходе?
Потому-то я стремаюсь за послезавтра. Мы и так вымираем потиху. А если вместо геморойного общения с себе подобными можно купить дружелюбный и покладистый компьютер — кто ж устоит перед этим. Останутся по итогу на планете одни амиши, да племена амазонские. Ну и в центральной Африке человека четыре. А остальные — вымрем нафик в обнимку с ноутбуком. Или андроидом, если дотянем.
Тема с***к не раскрыта!) Да и чем нынче балуют в мишленовских рэсторанах тоже интересно…