Долгое время считалось, что язык — это фундамент человеческого разума, ключ к математике, музыке и сложному социальному познанию. Однако исследования Евгении ФеДолгое время считалось, что язык — это фундамент человеческого разума, ключ к математике, музыке и сложному социальному познанию. Однако исследования Евгении Фе

Как нейробиолог разрушила главный миф о связи речи с интеллектом и причем тут вообще LLM

397b9caa46260597e8f9a1d889d0496a.jpeg

Долгое время считалось, что язык — это фундамент человеческого разума, ключ к математике, музыке и сложному социальному познанию.

Однако исследования Евгении Федоренко, нейробиолога из MIT (Массачусетского технологического института), не оставили от этой красивой теории камня на камне. Оказалось, что в мозге каждого взрослого человека работает специализированный «языковой парсер», который не имеет никакого отношения к высокоуровневому мышлению.

Но главная ирония открытия заключается в другом. Изучая эту сугубо биологическую структуру, Федоренко обнаружила ее пугающее сходство с архитектурой нейросетей искусственных — тех самых, что сегодня лежат в основе современных языковых моделей.

Даже в мире, наводненном большими языковыми моделями и умными чат-ботами, трудно смириться с тем фактом, что гладкое, связное письмо может быть продуктом бездумной машины. Для человека поиск верного слова — это неотъемлемая часть мыслительного процесса, а не изолированное действие.

Федоренко начала изучать механизмы речи в мозге взрослого человека задолго до появления ChatGPT. Она выделила специализированную структуру — так называемую «языковую сеть», которая отвечает за сопоставление слов с их значениями.

Ее исследования показывают: в некотором смысле мы действительно носим в себе биологическую версию языкового процессора. И, судя по всему, работает этот механизм так же, как и его цифровые аналоги — полностью неосознанно.

Последние 15 лет Федоренко собирает биологические доказательства существования этой системы в своей лаборатории в MIT.

В отличие от больших языковых моделей, человеческая сеть не просто комбинирует слова в правдоподобные шаблоны. Она работает как переводчик, связывая внешние стимулы — устную речь, текст или язык жестов — со смыслами, хранящимися в других отделах мозга (включая эпизодическую память и социальное познание, которыми машины не обладают).

Физически эта структура совсем невелика: если собрать все составляющие ее ткани вместе, по размеру они будут сопоставимы с клубникой.

Однако повреждение столь малого участка ведет к драматическим последствиям. Нарушение работы языковой сети вызывает различные формы афазии. Трагедия в том, что высокий интеллект и сложные когнитивные способности остаются нетронутыми, но оказываются запертыми внутри мозга. Человек теряет возможность выразить себя или вычленить смысл из потока чужой речи.

Федоренко прогуливается и беседует с научными сотрудниками MIT Андреа де Варда (слева) и Хейли Олсон (справа).
Федоренко прогуливается и беседует с научными сотрудниками MIT Андреа де Варда (слева) и Хейли Олсон (справа).

Страсть к языкам проявилась у Евгении еще в детстве. В 1980-х годах, пока она росла в Советском Союзе, по требованию матери ей пришлось освоить пять иностранных языков — английский, французский, немецкий, испанский и польский — в дополнение к родному русскому.

Юность пришлась на тяжелый период распада страны. Несмотря на лишения и даже голод, который пришлось пережить в те годы, Евгения была прилежной ученицей и добилась полной стипендии в Гарварде.

Там она поначалу планировала заниматься лингвистикой, но вскоре добавила вторую специальность — психологию. «Лингвистика была увлекательной, но больше напоминала решение абстрактных головоломок, чем попытку понять, как все устроено в реальности», — признается она.

Спустя три года аспирантуры в MIT Федоренко снова сменила курс, на этот раз уйдя в нейробиологию. Она начала работать с Нэнси Канвишер — первооткрывательницей веретенообразной извилины, области мозга, отвечающей за распознавание лиц. Федоренко поставила перед собой амбициозную цель: найти аналогичную специализированную зону для языка.

Задача оказалась непростой.

bee481029b4e3aa60c0fef43e87fee4d.png

Заберите максимум новогодних подарков с 15 по 23 декабря🎁

Один день — один сюрприз: адвент-календарь со скидками до 100% на IT-инфраструктуру.

Подробнее →

Итогом многолетней работы стала статья, опубликованная в 2024 году в журнале Nature Reviews Neuroscience. В этом фундаментальном обзоре Федоренко определяет сеть обработки речи как «естественный тип» (natural kind): интегрированный набор областей, специализирующихся исключительно на языке. Эта структура, по утверждению автора, присутствует в мозге каждого типичного взрослого человека.

fb51065473dc3aec214ed3562a834856.jpeg

Багаж из шести языков, выученных в детстве, привел Федоренко сначала в лингвистику, а затем — в нейробиологию. Проведя сканирование мозга 1 400 человек, она доказала существование универсальной языковой сети. Это, по ее словам, особая «ткань, которая надежно выполняет лингвистические вычисления».

В интервью изданию Quanta Федоренко рассказала, почему сравнивает эту сеть с пищеварительной системой, что известно о «языковом декодере» и действительно ли в наших головах работают биологические аналоги больших языковых моделей. Ниже приведена отредактированная для ясности запись той беседы.

В кабинете Федоренко представлены три модели мозга, иллюстрирующие языковую сеть. Сверху вниз: фиолетовым цветом обозначена вышивка Лауры Бундесен; красным — вышивка крестиком Ханны Смолл; красным — модель, напечатанная на 3D-принтере.
В кабинете Федоренко представлены три модели мозга, иллюстрирующие языковую сеть. Сверху вниз: фиолетовым цветом обозначена вышивка Лауры Бундесен; красным — вышивка крестиком Ханны Смолл; красным — модель, напечатанная на 3D-принтере.

— Что такое языковая сеть?

— В мозге взрослого человека работает группа взаимосвязанных областей, отвечающая за лингвистическую структуру. Это живая база данных, где хранятся значения слов и правила их сборки. Изучая язык, вы, по сути, загружаете в себя эти инструкции и соответствия.

Система эта невероятно гибкая: она позволяет мгновенно кодировать абстрактную мысль в конкретную последовательность слов на любом известном вам языке.

— Звучит абстрактно. Вы называете эту сеть «естественным видом» (natural kind). Значит ли это, что она так же реальна, как, скажем, пищеварительная система?

— Именно так. Системы, обнаруженные нами в мозге — будь то языковая сеть или зоны зрительного восприятия, — по своей сути являются органами. Возьмите ту же веретенообразную извилину, отвечающую за лица: это четко очерченная биологическая единица.

Анатомия языковой сети тоже конкретна. У большинства людей она базируется в левом полушарии: три основные зоны в лобной доле и пара участков, тянущихся вдоль средней височной извилины.

Единство системы подтверждается тестами. Если поместить человека в сканер МРТ, мы увидим, что эти области всегда активируются синхронно, как единый механизм.

Мы обследовали уже около 1 400 человек и составили вероятностную карту. Топография у всех немного разная — индивидуальная, как отпечатки пальцев, — но общая схема неизменна. В пределах этих зон у каждого человека гарантированно присутствует ткань, которая занята исключительно лингвистическими вычислениями.

— А как же хрестоматийная зона Брока? Разве не она отвечает за речь?

— Зона Брока — территория бесконечных научных споров. Я бы вообще поостереглась называть ее языковой областью. Это скорее диспетчерская для мышц, центр артикуляционного планирования.

Прямо сейчас она занята тем, что дирижирует моим ртом, чтобы я могла издавать звуки. Нюанс в том, что ей все равно, что озвучивать: Шекспира или полную абракадабру — она включится одинаково активно.

Ее функция чисто техническая: получить звуковой образ и рассчитать, какие рычаги дернуть, чтобы мышцы его воспроизвели. Это исполнитель, которому языковая сеть просто спускает инструкции.

— Вы также сказали, что язык — это не то же самое, что мышление. Но если языковая сеть не генерирует мысли и не шевелит языком физически, то чем она вообще занята?

— Она работает посредником. По сути, это интерфейс между «низким уровнем» (сенсорика, моторика) и «высшими сферами» (абстрактные смыслы, логика).

Возьмем, к примеру, генерацию речи. Все начинается со смутной, нечеткой мысли. Чтобы вытащить ее наружу, мозг обращается к своему лингвистическому багажу. Это не просто мешок со словами, а сложная библиотека конструкций и правил их стыковки.

Мы подбираем код, чтобы упаковать эту абстрактную мысль в стройный ряд слов. И только когда такая внутренняя работа завершена, даем команду моторной системе: озвучить, написать или показать жестами.

Выявление Федоренко языкового анализатора в мозге позволяет предположить, что производство речи — это отдельный процесс, не связанный с высокоуровневым мышлением.
Выявление Федоренко языкового анализатора в мозге позволяет предположить, что производство речи — это отдельный процесс, не связанный с высокоуровневым мышлением.

С пониманием языка процесс разворачивается на 180 градусов. Все начинается с физики: звуковая волна ударяет в перепонку или свет падает на сетчатку.

Сначала мозг проводит первичную обработку, вычленяя из потока цепочку слов. Затем в игру вступает языковая сеть. Она сканирует полученное, находит знакомые блоки и использует их как указатели — ссылки на смыслы, хранящиеся в глубинах памяти.

В обоих режимах — и при генерации речи, и при ее восприятии — эта сеть работает как библиотека соответствий между формой и значением. Это не застывший архив, а живое, изменчивое хранилище, которое мы пополняем и обновляем на протяжении всей жизни.

Но как только код усвоен, мы получаем универсальный ключ. Можем гибко использовать его и чтобы транслировать свои идеи вовне, и чтобы дешифровать смысл чужих слов.

Зачем нужна такая сложная система? Исключительно для того, чтобы мы могли обмениваться мыслями. Телепатии ведь не существует, верно?

— Насколько глубока эта специализация? Есть ли в языковой сети уникальные клетки, которые включаются на конкретные фразы — подобно тому, как «нейроны концепций» реагируют на определенные образы?

— Я подозреваю, что обработка информации здесь скорее распределена по всей системе, ведь язык критически зависит от контекста. Но существование клеток, настроенных на отдельные языковые аспекты, вполне вероятно.

В подтверждение этому группа Ицхака Фрида из Калифорнийского университета в Лос-Анджелесе (UCLA) уже выпустила предварительную публикацию. Изучая работу отдельных нейронов, они обнаружили те же закономерности, которые мы фиксировали на уровне целых популяций с помощью МРТ и внутричерепных датчиков.

Например, выяснилось, что эти клетки абсолютно одинаково реагируют и на письменную речь, и на устную. И искать таких «универсальных солдат» следует именно в языковой сети.

Механизм распознавания объектов в мозге работает на том же уровне абстракции, что и языковая сеть. Принцип здесь почти не отличается от устройства высших зрительных зон, например, нижневисочной коры. Там хранятся «чертежи» форм, а в веретенообразной извилине — базовые шаблоны лиц. Мы используем эти заготовки, чтобы идентифицировать предметы вокруг, но сами по себе эти шаблоны оторваны от глубоких знаний о мире.

По словам Федоренко, описанная ею языковая система «ограничена памятью» и обрабатывает «блоки, состоящие максимум из восьми-десяти слов».
По словам Федоренко, описанная ею языковая система «ограничена памятью» и обрабатывает «блоки, состоящие максимум из восьми-десяти слов».

Идеальный пример — знаменитая фраза лингвиста Ноама Хомского: «Бесцветные зеленые идеи яростно спят».

Вы считываете структуру, понимаете грамматику, но не можете соотнести написанное с реальностью — в этом просто нет смысла. Тем не менее, наши исследования (как и данные других групп) доказывают: языковая сеть реагирует на подобную бессмыслицу так же активно, как и на абсолютно логичные высказывания.

Я бы не хотела называть эту систему «глупой», но она, безусловно, довольно поверхностна.

— Складывается впечатление, что вы утверждаете, будто в мозг каждого человека вшита большая языковая модель (LLM). Вы это имеете в виду?

— По сути, да. Я считаю, что наша языковая сеть поразительно похожа на ранние версии LLM. Она точно так же обучается на статистических закономерностях и запоминает, как слова цепляются друг за друга.

Представить это совсем несложно. Вы наверняка встречали людей, которые говорят невероятно бегло. Речь льется рекой, но спустя минуту вы ловите себя на мысли: «В этом нет ничего связного». Форма идеальна, а содержание нулевое. И заметьте: для такого эффекта собеседнику вовсе не обязательно иметь повреждения мозга.

— И все же мысль о том, что люди создают речь с помощью механизма, столь же бессмысленного, как ChatGPT, кажется нелогичной.

— Согласна — поначалу она казалась такой и мне! Когда я приступала к этим исследованиям, была убеждена: язык — это фундамент сложного, высокоуровневого мышления.

Существовала гипотеза, что секрет кроется в умении человека работать с иерархическими структурами. Ведь иерархия — это ключевая особенность не только языка, но и математики, музыки, социального познания. Поэтому я ожидала обнаружить в мозгу универсальные процессоры, которые обрабатывают любые сложные структуры.

Но эмпирические данные разрушили эту теорию. Еще в 2011 году стало очевидно: все компоненты этой системы узко специализированы исключительно под язык. А если вы ученый, вы просто принимаете факты, корректируете свои убеждения и работаете дальше.

Источник

Возможности рынка
Логотип Large Language Model
Large Language Model Курс (LLM)
$0.0003607
$0.0003607$0.0003607
-7.01%
USD
График цены Large Language Model (LLM) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно