Красная линия ChatGPT

Boris Kravtsov, PhD
5 min readAug 31, 2023
Photo by Mariia Shalabaieva on Unsplash

Введение

Задача. Два вида геометрических фигур размещены на плоскости случайным образом. Перемещая их, добейтесь того, чтобы с каждой стороны красной линии оказались фигуры только одного вида.

Любой пятилетний ребенок решит «задачу красной линии», даже если видит фигуры на рисунке впервые. А новомодная технология ChatGPT, увы, этого сделать не в состоянии. Лишенная креативности, она не может придумать метод сравнения геометрических фигур разной формы или по-разному трансформированных. Креативность — отличительное свойство интеллекта, а технология ChatGPT — просто сложная и зачастую бесконтрольная компиляция уже известных фактов (автору она напоминает давнего приятеля, который любит рассказывать анекдоты, но, к сожалению, всегда старые).

Огромные вычислительные ресурсы и объемы информации, которыми оперирует ChatGPT, тоже не спасают положения: накопление данных и генерация новых идей на их основе — принципиально разные вещи. Заметим также, что избыточная информация может оказаться даже вредной. Эйнштейн, к примеру, обдумывая свою очередную статью, старался не читать научные журналы.

Создание искусственного интеллекта

Из всех проявлений человеческого интеллекта нас будет интересовать лишь его умение распознавать. «Создание искусственного интеллекта» при этом означает моделирование работы затылочной части головного мозга, его зрительной коры (visual cortex).

Существуют два направления, которые мы условно назовем «Подход программистов» и «Подход физиков»:

1. «Подход программистов» и их технология глубокого обучения (deep learning). Для распознавания, например, котов нам предлагается начать с настройки или обучения системы (train deep learning model), т. е. с загрузки в нее сотен тысяч фотографий котиков, а затем… Стоп, достаточно! Абсолютно не важно, что будет дальше, так как для выполнения задачи нашей зрительной коре всего этого не нужно: она способна сравнивать объекты, которые видит впервые. Другими словами, подход программистов, требующий предварительной настройки системы, неадекватен объекту моделирования и должен быть сразу исключен. По сути, броская терминология, такая как «обучение нейронных сетей», ничего не меняет: никакого отношения к реальным связям нейронов головного мозга такой подход иметь не может. War is too serious a matter to be entrusted to generals.

2. «Подход физиков». Познание любого природного явления ученые-физики начинают с наблюдений, экспериментов и формулирования гипотез. Так создается физическая модель (здесь прервемся и посочувствуем бедному Галилею, которому много раз пришлось подниматься по трем сотням ступеней Пизанской башни, пока он не заключил, что «все тела падают одинаково»). В дальнейшем модель будет уточняться или от нее вовсе откажутся. Физики, в отличие от программистов, строго следят за адекватностью, т. е. непротиворечивостью своих моделей всем известным экспериментальным фактам.

Физики рассматривают зрительную кору как еще одно природное явление. Автору, физику по специальности, такой подход кажется естественным и логичным. Лабораторные эксперименты с мозгом и, в частности, с его зрительной корой стали обычным делом, построению моделей посвящены тысячи публикаций. Особенно нас заинтересовали те из них, которые, начиная с Campbell and Robson, 1968; Pollen and Lee, 1971; Maffei and Fiorentiny, 1973; Glezer et al., 1989, рассматривают зрительную кору как частотный анализатор. Как известно, практически все операции обработки изображений можно выполнять в пространстве изображений или в частотном пространстве. Авторы предполагают, что зрительная кора выбрала второй путь. Последовательно придерживаясь данной гипотезы, мы пытаемся проследить, к каким практическим результатам это может привести (см. публикации ниже).

Amazing AI Tables — Feb 16, 2023 (есть версия на русском языке)

1. В частотном пространстве вводится понятие степени сходства геометрических фигур (similarity) и на большом статистическом материале показана его эффективность.

2. Используя similarity, успешно решена «задача красной линии», усложненный вариант которой мы назвали AI Tables.

3. Продемонстрировано распознавание рукописных чисел без процедуры предварительного обучения (pre-training).

Image Processing in the Visual Cortex — Feb 18, 2022

Переход в частотное пространство дал возможность объяснить известные оптические иллюзии (Müller-Lyer illusion, Vertical-horizontal illusion).

New High-Quality Edge Detector — Feb 2, 2022

Одно из самых заметных достижений в экспериментальном исследовании мозга (Нобелевская премия 1981 года) — это обнаружение ориентационно-селективных нейронов (orientation-selective neurons). В очень упрощенном виде речь идет о следующем. Авторы открытия Д. Хьюбел и Т. Визел демонстрировали подопытному животному (домашней кошке) слайды с изображенными на них одиночными прямыми. При появлении такой линии на экране аппаратура отмечала у кошки активность одного из нейронов коры. Эта активность зависела от угла наклона линии, и можно было установить то единственное направление, при котором активность нейрона достигала максимума. Далее, меняя слайды и имитируя медленное вращение линии-раздражителя, ученые наблюдали, как снижение активности этого нейрона сменялось появлением и ростом активности другого (второго) нейрона. А снижение активности второго нейрона сменялось появлением и ростом активности третьего нейрона и т. д. Максимумы активности нейронов коры следовали со строгой периодичностью в 12 градусов: 0, 12, 24, … Хотя с момента открытия ориентационно-селективных нейронов прошло более 60 лет, до сих пор непонятна их роль в системе зрения. В данной статье предпринята попытка ответить на этот вопрос.

На языке специалистов по обработке изображений Д. Хьюбел и Т. Визел обнаружили в зрительной коре встроенный набор детекторов края (edge detectors set). Поэтому подробнее рассмотрим один из них — фильтр Собеля с ядром Gy (Sobel Edge Detector). На рисунке ниже представлен результат фильтрации.

Как видим, данный фильтр выявил горизонтальные линии и края на изображении, но по мере ухода от горизонтали его чувствительность падала, и в результате вертикальные линии он обнаружить не смог (см. правую часть рисунка). Правда, существует второй вид фильтра Собеля, c ядром Gx, который как раз заточен на обнаружение вертикальных линий, но ему, соответственно, будут недоступны горизонтальные края и линии изображения. Здесь рекомендовано совместное использование обоих видов фильтра: по мере снижения чувствительности (активности) одного из них растет чувствительность (активность) другого. Снова вспомним бедную кошку, чтобы отметить полное сходство в поведении фильтров Собеля с тем, как ведет себя пара «соседних» ориентационно-селективных нейронов коры.

Мы показали, как переходом в частотное пространство можно изменить направление максимальной чувствительности фильтра Собеля. Теперь этим направлением может стать любой угол, а не только 0 градусов (ядро Gy) или 90 градусов (ядро Gx). Это позволяет смоделировать любой ориентационно-селективный нейрон и посмотреть результат коллективного действия всех ориентационно-селективных нейронов коры. Для этого просуммируем работу всего набора детекторов края (фильтров Собеля), настроенных на следующие направления: 0, 12, 24, … градусов, и в итоге получим высококачественное контурное изображение.

Нахождение контуров — это первый шаг всех известных методов распознавания. Как видим, роль ориентационно-селективных нейронов состоит в создании контурного изображения поля зрения.

Экспериментальное подтверждение этого положения и выяснение способа и мéста хранения контуров в зрительной коре станет серьезной заявкой на получение следующей Нобелевской премии.

--

--

Boris Kravtsov, PhD

I’m trying to share some of my old thoughts and new promising solutions.