Всем привет, меня зовут Алекс Гусев. Это третья публикация в линейке (раз, два), посвящённой тому, как меняется работа со знанием в условиях его избытка и почемВсем привет, меня зовут Алекс Гусев. Это третья публикация в линейке (раз, два), посвящённой тому, как меняется работа со знанием в условиях его избытка и почем

От идей к коду: проверяю теорию внимания на практике

2026/02/11 00:40
7м. чтение

Всем привет, меня зовут Алекс Гусев. Это третья публикация в линейке (раз, два), посвящённой тому, как меняется работа со знанием в условиях его избытка и почему внимание становится ключевым ограничивающим ресурсом.

В первых двух текстах я рассматривал персональные картины мира, то, как знание встраивается в опыт, роль внимания в этом процессе и в общих чертах затрагивал тему того, как внимание проявляется через поведение пользователей на современных платформах. Основной фокус тогда был на формулировке идей и их обсуждении. В этой статье я продолжаю ту же линию и перехожу к практическому шагу - к проверке этих идей в виде работающего эксперимента.

Форма эксперимента

Эксперимент реализован в виде веб-приложения Mindstream:

  • приложение: https://mindstream.app.wiredgeese.com/

  • исходники: https://github.com/flancer32/mindstream

Приложение состоит из серверной и браузерной частей. Серверная часть работает одинаково для всех пользователей: она читает публикации с Хабра через RSS, формирует для них при помощи языковых моделей аннотации и краткие обзоры и на их основе собирает общую ленту публикаций.

Лента публикаций Хабра
Лента публикаций Хабра

Браузерная часть отвечает за персонализацию. При входе на страницу пользователь видит ленту статей с аннотациями и обзорами, а также маркеры персонального интереса. При первом использовании все значения интереса равны нулю, предварительные предпочтения отсутствуют.

Нулевой маркер интереса пользователя к публикации
Нулевой маркер интереса пользователя к публикации

Взаимодействие с лентой устроено просто: пользователь читает название публикации и краткую аннотацию, открывает и читает обзор, при возникновении интереса переходит по ссылке на оригинальную публикацию. Эти действия фиксируются как сигналы внимания. На их основе прямо в браузере формируется персональный вектор интересов пользователя, относительно которого оцениваются последующие публикации в ленте.

Локальные вычисления и идентичность

Все расчёты персонального интереса выполняются и хранятся локально, в браузере пользователя. По умолчанию никакие данные о поведении пользователя на сервер не отправляются.

При желании пользователь может создать анонимную идентичность в виде UUID. В этом случае сигналы внимания начинают дублироваться на сервер. На текущий момент эти данные лишь сохраняются и не используются для формирования коллективных сигналов или рекомендаций. Коллективные эффекты сознательно исключены на текущей стадии эксперимента.

Создание анонимной identity
Создание анонимной identity

Наблюдение за формированием интересов

По мере взаимодействия с лентой Mindstream - чтения аннотаций, открытия обзоров и переходов к оригинальным статьям - в браузере пользователя формируется вектор его собственных интересов. Это числовое представление не интерпретируется и не поясняется, однако относительно него у новых публикаций появляются маркеры, показывающие степень семантической близости их содержания к уже зафиксированным интересам.

Ненулевой маркер интереса пользователя к публикации
Ненулевой маркер интереса пользователя к публикации

В этом режиме читатель выступает участником эксперимента и источником данных через собственное внимание. Использование приложения сводится к наблюдению за тем, как со временем меняется персональный вектор интересов и какие статьи Хабра начинают с ним коррелировать.

Как рассчитывается маркер интереса

В основе расчёта маркеров интереса лежит векторное представление текстов. Для каждой публикации используется не полный текст статьи, а её обзор, сформированный при помощи языковой модели. Обзор представляет собой пересказ публикации и служит компактным носителем её семантики. Предполагается, что смысл обзора в достаточной степени соответствует смыслу исходного текста.

Обзор, созданный при помощи LLM
Обзор, созданный при помощи LLM

Для обзора вычисляется эмбеддинг-вектор, описывающий его положение в многомерном семантическом пространстве. В этом пространстве расстояние между векторами используется как мера смысловой близости текстов. Чтение обзора рассматривается как сигнал внимания. При таком событии эмбеддинг-вектор соответствующего обзора добавляется в персональный вектор интересов пользователя. Таким образом, вектор интересов формируется из тех же представлений, что и сами публикации, и находится в том же семантическом пространстве. Для каждой публикации в ленте рассчитывается расстояние между эмбеддинг-вектором её обзора и текущим вектором интересов пользователя. Полученное значение используется как маркер интереса и показывает степень семантической корреляции между содержанием публикации и уже зафиксированными интересами читателя. Это значение используется как относительный индикатор и не интерпретируется дополнительно.

Персональный вектор интересов пользователя в локальном хранилище браузера
Персональный вектор интересов пользователя в локальном хранилище браузера

Идентичность, данные и доверие

При таком устройстве эксперимента вопрос доверия сводится к конкретным аспектам: где формируются сигналы внимания, где они хранятся и в какой момент пользователь осознанно выходит за пределы локального контура. По умолчанию Mindstream работает полностью локально. Персональный вектор интересов формируется и используется в браузере пользователя, а сигналы внимания не сохраняются и не передаются. В этом режиме эксперимент остаётся индивидуальным и замкнутым на пользователя.

Предупреждение при создании анонимной идентичности (UUID)
Предупреждение при создании анонимной идентичности (UUID)

Идентичность вводится как отдельный добровольный шаг. Она представляет собой анонимный UUID и не связана с персональными данными. При её создании сигналы внимания начинают дублироваться на сервер, что в будущем позволяет рассматривать коллективные эффекты и агрегированные данные. На текущем этапе эти данные не используются для формирования рекомендаций или общей ленты. Mindstream не является сервисом и не предполагает гарантий результата. Данные используются строго в рамках описанной модели и исключительно для исследования поведения сигналов внимания и векторных представлений в практическом контуре. Создание идентичности остаётся осознанным выбором пользователя.

Регистрация идентичности и сигналов внимания
Регистрация идентичности и сигналов внимания

Агентная разработка и моя роль

Разработка Mindstream началась 1 февраля и заняла около десяти дней. За это время было собрано клиент-серверное веб-приложение с обращением к внешним источникам данных (RSS Хабра) и внешним моделям для работы с текстами и эмбеддингами.

Основной объём прикладного кода был написан не мной напрямую, а агентом на базе языковой модели (Codex). В рамках используемого подхода моя роль заключалась в формировании контекста для работы агента, постановке задач, оценке предлагаемых решений и корректировке результата. Архитектурные решения, структура модулей и значительная часть связующего кода были сгенерированы агентом в рамках этого контекста. Если бы я писал это приложение вручную, оно выглядело бы иначе по структуре и стилю. Ход работы агента и принятые решения зафиксированы в отчётах, доступных в репозитории проекта.

При формировании документов контекста, проработке архитектурных решений и уточнении границ эксперимента также использовался ChatGPT - как инструмент совместного мышления и проверки формулировок. На серверной стороне применяется мой собственный контейнер объектов @tefw/di, обеспечивающий позднее связывание компонентов во время выполнения и упрощающий тестирование. Это позволило удерживать архитектуру гибкой и не фиксировать решения раньше, чем они становились необходимыми в рамках эксперимента.

Опыт разработки Mindstream стал для меня контекстом, в котором позже возникла сегодняшняя дискуссия на Хабре о возможности создания полноценных приложений с использованием языковых моделей. К моменту обсуждения у меня уже был практический результат - работающий эксперимент, собранный в одиночку и в ограниченные сроки. В комментариях к статье "Как оптимизация промптов превратилась из шаманства в инженерную дисциплину" я участвовал в разговоре, опираясь на этот опыт разработки и наблюдения, сделанные в ходе работы над Mindstream. В этом контексте Mindstream можно рассматривать как зафиксированный практический результат: приложение существует, функционирует и решает конкретную задачу, будучи созданным с использованием именно агентного подхода.

Ограничения эксперимента

Mindstream находится в экспериментальной стадии, и его возможности сознательно ограничены. Эти ограничения задают границы интерпретации получаемых результатов.

  • Приложение не предназначено для замены Хабра и не выполняет роль рекомендательной системы. Оно не отбирает публикации и не оптимизирует ленту под вовлечённость. Mindstream визуализирует возможную семантическую корреляцию между интересами пользователя и текущими публикациями, не вмешиваясь в порядок и состав исходной ленты.

  • Используемая модель работает с обзорами, а не с полными текстами статей. Обзор служит приближённым носителем семантики публикации, поэтому оценки интереса зависят от его качества и не отражают содержание исходного текста напрямую.

  • Эмбеддинг-векторы и расстояния между ними являются модельным представлением смысла. Они позволяют сравнивать тексты в одном пространстве, но не дают интерпретируемых объяснений и не отражают причины интереса пользователя. Маркеры интереса показывают относительную близость, а не значимость или ценность публикации.

  • Коллективные сигналы внимания в текущей версии не используются. Даже при создании анонимной идентичности данные не агрегируются и не влияют на ленту. Это сделано сознательно, чтобы не смешивать персональный эксперимент с социальными механизмами.

Эти ограничения позволяют рассматривать Mindstream как лабораторный стенд для проверки отдельных идей о внимании, смысле и векторных представлениях в контролируемом виде.

Зачем я это публикую и что будет дальше

Эта публикация не является отчётом о завершённом проекте. Mindstream задумывался и остаётся экспериментом, цель которого - проверить, как идеи о внимании и персональном смысле проявляют себя в работающем инженерном контуре.

Мне важно понять, насколько такой формат интересен другим людям как практический инструмент наблюдения: за собственной лентой, за сигналами внимания, за тем, какие публикации со временем начинают коррелировать с вектором интересов. В частности, мне интересно, готовы ли пользователи осознанно участвовать в эксперименте и делиться сигналами внимания ради получения агрегированных результатов.

От этого зависит, будет ли эксперимент развиваться дальше. Коллективные эффекты и агрегированная статистика возможны только в том случае, если окажутся востребованными.

Если этот подход откликается, вы можете попробовать Mindstream самостоятельно и составить собственное впечатление. Дополнительный контекст и другие мои материалы доступны на сайте wiredgeese.com.

Спасибо всем, кто смог прочитать.

Источник

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.