Diploma

Диплом. Unplugged.
Когнитивная графика

Электонный глаз.
По наличию глаз можно сказать, что перед нами живое существо. Жизнь Пинокио начилась с открытых глаз, а вовсе не с носа. В темноте о присутствии хищников свидетельствуют горящие глаза. Символическое закрытие глаз означает конец жизни. Различное одушевление неживых предметов в сказках связана с пририсовыванием человеческих глаз. Когда у роботов вместо глаз рисуют видеокамеры, это может говорить о двух вещах. Или перед нами бездушный киборг. Или за стеклом окуляра сидит «гуманоид», управляющий остальной автоматизированной переферией. Поддельные электронные датчики можно скрыть только за темными очками. Глаза остаются монополией природы, и возможно именно поэтому создать целый виртуальный мир оказывается легче, чем 2 электроннах глаза.

Сетчатка, как и многие сложные системы, существующие в природе до недавнего времени была неким «Черным Ящиком». Тем не менее она исправно справляетсяся с жизненно необходимой функцией восприятия, доставки, распределения и т.д. зрительной информции. Но так бывает не всегда, иногда сетчатка перестает функционировать, и тогда имеет смысл заглянуть в «Черный Ящик» и искать нарушения в работе отдельных ее элементов - клеток. Метод Вынужденных Потенциалов (ВП) можно сравнить с тестированием уникальной системы, включенной в качестре рабочего элемента в другую систему. Поэтому сетчатку нельзя «закрыть на ремонт», тем более забрать на обследование. Все тесты должны проходить в естественной среде (хотя и в искусственно создаваемых условиях: в темной комнате, мелькающий свет и т.д. ). После тестирования остаются графические изображения, неимеющие ничего общего на первый взгляд с глазами.
Применяя Когнитивную Графику (КГ), можно добиться следующих результатов:
+ По малопонятным графическим изображениям восстановить реальную картину повидения клеток. Это задача обычной визуализации, когда реально существующий объект изображается похоже на экране и потом «оживляется». Экранный двойник подключается к каналу, из которого идут данные об изменении в повидении реального двойника.
+ Придумать образ, который поможет поставить диагноз. Он врядли будет связан с внешним видом клеток глаза, скорее с их функцией. Как уже отмечалось она более изучена. К тому же в КГ чаще используют не микро, а макро объекты с привычными человеку функциями.

FAQ

В: Чем когнитивная графика отличается от обычной графики?
O: Когнитивная графика отличается от обычной, иллюстративной графики своей функцией. Иллюстративная графика применяется с целью наиболее фотогорафично отразить реальность, при этом все составные части изображения одинаково важны, и их присутствие на рисунке говорит только о том, что они “существуют” в данном месте в данный момент. Когнитивная графика применяется с целью понять, как устроена действительность (“когнитивная” – способствующая познанию), при этом предметная область декомпозируется на составные части и зависимости между частями, среди них выделяются первостепенные и второстепенные. Изображение “собирается” заново из этих частей. Если же какая-то составная часть включена в изображение, но не связана с другими, то говорят о неопределенности в представлении знаний, которую стремятся устранить.
В: Почему графики и различные диаграммы не заменят КГ?
О: Графики и диаграммы являются изображениями зависимости одного параметра от другого или реже одного от двух других параметров (в трехмерном случае). Построение графика не снижает, так называемый, интеллектуальный порог. Напротив, появляются новые параметры – единичный отрезок, минимальное и максимальное значения, отчетный период. Но если ввести некое средство, которое будет одновременно с построением графика производить подбор функции, апроксимирующей характеристики процесса (распознавать процесс), или средство, которое будет выводить словесное описание процесса: “функция насыщяется”, “мелкие колебания функции вызваны наличием помех”, ”функция возможно периодическая” и т.д. , то принятие решения значительно упростится.
В: Зачем нужна сложная система КГ, когда все равно всех особенностей не учесть и визуальную оболочку лучше писать под конкретную задачу?
O: В основе системы КГ лежит алгоритмическая сеть, которая описывается на специальном языке КГ. Этот язык достаточно прост: его грамматика умещается на одной странице. А математические функции и функции визуализации можно реализовывать в отдельных модулях с учетом специфики задачи.

Естественный язык.
Используется в некотором обществе, в некоторое время, в некотором пространстве. Суть языка как семиотической системы состоит в установлении соответствия между множеством всех возможных смыслов и множеством всех звуковых оболочек. Язык - это локализованный в мозгу человека механизм, который соотносит то, что мы думаем, с тем, что мы говорим. Если последовательно придерживаться этой трактовки, будет ошибочно считать языком, например, речь, записанную на магнитофон. Речь есть продукт языка, тогда как сам язык - механизм, порождающий этот продукт. Cам язык не дан исследователю в непосредственном наблюдении, поэтому приходится изучать его проявления, а уже по ним пытаться построить модель языка. В начале XX века лингвисты обнаружили, что за внешним различием множества существующих естественных языков таится внутреннее сходство. Так появилась необходимость в формальном аппарате, объясняющем это сходство. Одно из направлений современной лингвистики – когнитивная лингвистика.
Язык когнитивной графики.
Используется среди людей некоторой профессии, в некоторый момент технического прогресса, в некоторых графических средах. Суть языка как семиотической системы состоит в установлении соответствия между множеством всех возможных смыслов и множеством всех визуальных объектов. Язык - это локализованный в мозгу человека механизм, который соотносит то, что мы думаем, с тем, что мы рисуем на экране. Если последовательно придерживаться этой трактовки, будет ошибочно считать языком, например, картину, нарисованную на обычной бумаге. Картина есть продукт языка, тогда как сам язык - механизм, порождающий этот продукт. Cам язык не дан исследователю в непосредственном наблюдении, поэтому приходится изучать его проявления, а уже по ним пытаться построить модель языка. Попытки разработать законченную теорию, “создать сконструированный генерал-бас живописи” производились неоднократно (Леонардо да Винчи, В.Кандинским и др). Их безуспешность Кандинский объяснял, в частности, малой оторванностью живописи от природы и души Художника в начале ХХ века. С появлением ПК “язык живописи” должен стать понятным каждому. Одно из направлений современной живописи – когнитивная графика.

Доклад.

Когнитивную графику традиционно связывают с введением метафоры. Метафора – это образное сближение понятий из двух разных предметных областей. В нашем случае предметными областями являются с одной стороны физиология зрения, с другой - компьютерная программа. А близкими по функциональности компонентами являются с одной стороны - нейронные клетки сетчатки с аксонами и дендритами, а с другой - подпрограмма с входными и выходными параметрами.
Первым примером метафоры может служить темно-адаптирующийся архиватор. Сближаются процессы восприятия изображения глазом с передачей информации в мозг и архивации изображения с записью в файл. В схематически представленной на слайде сетчатке классическими нейронами являются биполярные и ганглиозные клетки, фоторецепторы выполняют функцию непосредственного восприятия световой информации. Палочки более многочисленны, чем колбочки. Их проще объединить в группы, одна группа палочек может обслуживать передачу сигнала в одну или сразу несколько биполярных клеток. В свою очередь одна или несколько биполярных клеток связаны с одной ганглиозной клеткой и формируют ее рецептивное поле. Под действие одного поля попадает часть архивируемого рисунка.
Функции отдельных нейронов.
Палочки высоко чувствительны к свету, но не различают длину волны (цвет):
• На входе – цвет пикселя рисунка в формате RGB;
• На выходе – минимальное и максимальное по яркости значения компонент.
Колбочки, например, красного цвета:
• На входе – цвет пикселя цвета в формате RGB;
• На выходе - значение красной компоненты - GetRValue;
Биполярные клетки:
• На входе – вектор минимальных и максимальных по яркости компонент;
• На выходе – максимум из максимумов и минимум из минимумов – итоговые по всему полю;
Амакриновые клетки:
• На входе – максимальное и минимальное значения компонент в поле;
• Эти клетки настраивают функцию h;
Ганглиозные клетки:
• На входе – значение красной компоненты;
• На выходе – записываемое в файл значение (сила импульса воспринимаемого мозгом);
Функция для определения записываемого значения До настройки: h(K)=K* size div MaxComp После настройки: h(K)=(K – Min) * size div (Max - Min) 0 < Min < K < Max

Второй пример – распознавание символов глазом и с помощью компьютерной программы. Задача распознавания разбивается на несколько подзадач. Чтобы сравнить распознаваемый образ с эталонным изображением, необходимо правильно позиционировать исследуемое изображение, найти коэффициенты искажения и интервалы между символами. Для совмещения центров образов воспользуемся технологией непрямого пути через горизонтальные клетки. Горизонтальные клетки передают сигнал от фоторецепторов в биполярные клетки с информацией о направлении, в котором он был получен: сигнал пришел справа, слева, снизу или сверху. Ганглиозная клетка получит четыре таких сигнала, более сильный придет с той стороны, где расположен центр символа. Именно туда и следует переместить глаз. Это буквально позволяет узнать, сколько «белизны» («черноты») скопилось в неком направлении от центральной биполярной клетки. Можно снимать это значение с участка определенного радиуса или пропускать некоторые участки, например, интервалы между буквами.
Функции отдельных нейронов.
Палочки:
• На входе – цвет пикселя рисунка в формате RGB;
• На выходе – среднее значения его компонент;
Горизонтальные клетки:
• На входе – среднее значение компонент;
• На выходе – строка с приставкой вида
“left^среднее_значение” или, например
“right^right^top^среднее_значение ”;
Биполярные клетки:
• На входе – вектор средних значений с приставками (одинарными, двойными, тройными и т.д.);
• На выходе – взвешенная сумма, где в качестве весов учитываются число приставок.
Амакриновые клетки:
• На входе – вектор направлений и взвешенных сумм;
• На выходе – векторная сумма и решение, куда перемещать взгляд.
Тест на зрительное утомление. Пациенту дают рассмотреть разделенный пополам кружочек. Если он не видит границы, его глаза утомлены.
Третий пример – поисковая система, основанная на контрастах. Эта технология похожа на предыдущую, только горизонтальные клетки передают по цепочке информацию о том, что соседние палочки зафиксировали противоположные значения. Можно сконструировать свертку, отражающую характер контраста: либо пестрота, либо граница между двумя областями. Дальнейшей реакцией глаза может быть либо перемещение в область контрастов, либо перемещение вдоль контура. Как известно средоточие информации – источник контрастов, а решение многих задач лежит на границе области определения. Поэтому будет правильно производить поиск именно в области контрастов.

В языке КГ можно выделить части речи, среди которых в свою очередь выделяются концепты и связи. Введем следующие определения:
Концепт (Concept) – это значащий элемент языка, обозначающий базовое понятие, сущность, утверждение, состояние, т.е. фактор, который должен быть учтен при рассмотрении в данной модели.
Связь (Relation) – это служебный элемент языка, служит для связи концептов. Не может существовать самостоятельно, но важна, так как придает смысловые оттенки модели или даже совершенно меняет смысл. Иначе говоря, концептами можно обозначать цели (познания), связями – пути, ведущие к этим целям.
Как, например, у имени существительного есть число, род, склонение, так у концепта есть заголовок (Caption), вид (Kind), уровень (Level), значение (Value), а у связи – название (Caption), начало связи (BegRel), конец связи (EndRel) и вес (Weight) – все это формы, в которых элементы языка находятся в модели.
Заголовок (Caption) – слово из языка высокого уровня, отражающее смысл концепта. Как комментарий, необходимо только для наглядности.
Вид (Kind) – тип, класс – определяет функции (математическую и визуальную) данного концепта.
Уровень (Level) – определяет сложность понятия, обозначенного данным концептом. Нулевой уровень имеют обычно известные, хорошо изученные, доступные для измерения, оценки, наблюдения сущности. Ненулевой – производные, неизвестные, абстрактные, целевые и т.д. Естественно, без интерпритации первых невозможна интерпретация вторых.
Значение (Value) – значение, принимаемое концептом в некоторый момент времени.
Если концепт – утверждение, то возможны значения: 0-Ложь, 1-Истина.
Если концепт – состояние, то возможны значения: 0-Нормальное, 1-Аномальное, 2-Кризисное.
Если концепт – наблюдаемая, непрерывно меняющаяся сущность, то значения могут браться из заданного интервала. Начало связи (BegRel)– условие, исходное данное, причина, источник - “откуда?” проведена связь, “то, что влияет”. Ссылка на концепт. Конец связи (EndRel) – цель, выходное данное, следствие, приемник – “куда?” проведена связь,”то, на что влияет”. Ссылка на концепт. Связи могут быть проведены в обе стороны, тогда концепт начала связи и концепт конца связи – синхронные. Если меняет значения один, то меняет его и другой. Вес (Weight) – сила связи, если к одному концепту проведены несколько связей, то вес определяет преоритет, относительную важность каждой из них.
class CConcept
{
CString m_caption; BOOL m_cr; int m_ind; int m_kind_ind1,m_lev_ind2; int m_value_weight; BOOL m_visible; int m_pic; int m_state; bool m_need_update;
public:
CCell(int m_ind, BOOL cr=1, int m_kind_ind1=0, int m_lev_ind2=0, int m_value_weight=0, BOOL m_visible=1, CString m_caption="Concept", int m_pic=0);
virtual ~CCell();
void Funk();
void DrawRel(CDC *pDC,CPoint from,CPoint to);
void DrawCon(CDC *pDC,CRect Fr, int m_h=0, int m_w=0, int m_t=0, CDC *m_pmdc=NULL, CDC *m_pbdc=NULL);
};

Постановка диагноза.
Необходимые знания содержатся в специальной литературе или могут быть получены у экспертов. Все знания можно «разложить по четырем полочкам», представленным в схеме: С x D -> {x1, x2, … , xn} -> S(t) -> {y1, y2, … yn}
C – Условия стимуляции лабораторные условия, при которых ставится диагноз;
D – Диагноз пациента;
S – картина, наблюдаемая при условиях C у пациента с диагнозом D, меняющаяся с течением времени t : S(x1, x2, … , xn, t)
xi – Факторы, формирующие S : x1(C,D), x2(C,D), … , xn(C,D)
yi – Параметры, получаемые при анализе S: y1=max (S), y2=min (S), y3=max(S)-min(S), y4=t: S(t)=max (S) … y1(C,D), y2(C,D), … , yn(C,D)
Схема построена по принципу: нижние уровни зависят от верхних. Зная при каких условиях и при каком диагнозе факторы xi или параметры yi принимают данное значение, можно поставить точный диагноз. C можем создать искусственно. Какике xi влияют на S, вид S, на какие параметры следует обратить внимание, можно узнать у экспертов. Остается поставить диагноз D.
Пример 1.
При анализе Электроретинограммы (ЭРГ) пациента получены следующие параметры: y1=normal_a - min (S), отклонение а-волны ; y2=normal_b - max(S) - min(S), отклонение b-волны при условии С1 – частота мелькания стимула равна p1 и при условии С2 – частота мелькания стимула равна p2>p1. На какой стадии диабетическая ретинопатия?
y1 C1 C2 D1-Начальная стадия 0 0 D2-Манифестная стадия 5-20 0 D3-Паталогическая стадия 5-20 0
y2 C1 C2 D1-Начальная стадия 0 20-35 D2-Манифестная стадия 0 20-35 D3-Паталогическая стадия 5-35 40-60
y1(C1,D)=15; y1(C2,D)=0; y2(C1,D)=0; y2(C2,D)=35; D = D2
Пример2.
При анализе ЭРГ пациента получены следующие параметры: y= max(S) - min(S), peak-to-peak
при условиях: С1 – частота мелькания стимула равна p1 С2 – частота мелькания стимула равна p2>p1 С3 – стимул крачный С4 – стимул белый
Есть ли у пациента палочковая дистрофия?
& C3 y C1 C2 норма >0 - дистрофия - -
y C1 C2 норма >0 >0 дистрофия >0 - & C4
y(C1)>0 y(C2)=0 Если стимул был красный, то дистрофии нет. y= max(S) - min(S) = max(S(x1,x2)) - min(S(x1,x2))
Факторы: x1 – активность палочек x2 – активность колбочек
x1(C3)< y = max(S(x1)) - min(S(x1))=y(x1) для первой таблицы x2(C4)< y = max(S(x2)) - min(S(x2))=y(x2) для второй таблицы

Можно провести анализ влияния различных факторов на ситуацию сложившуюся на дорогах. Вершины интерпретируются следующим образом:
1) Превышение скорости;
2) Мороз на улице;
3) Каникулы в школах;
4) Количество соли на дорогах;
5) Количество школ в районе;
6) Проводятся ли занятия по правилам ДД в школах;
7) Среднее время торможения машин;
8) Кол-во детей на улицах (всех);
9) Кол-во детей из группы риска;
10) Кол-во дорожно-транспортных происшествий (ДТП).
Связи интерпретируются так:
2-8 влияние погоды на количество детей на улицах;
3-10 влияние каникул на количество ДТП;
5-8 зависимость числа детей от числа школ в районе;
6-9 влияние занятий по правилам дорожного движения на количество непослушных детей;
8-9 процент детей из группы риска;
9-10 процент ДТП, произошедших из-за игр на дорогах;
1-7 влияние скорости на время торможения;
2-7 влияние температуры на время торможения;
4-7 влияние кол-ва соли на дороге на время торможения;
7-10 процент ДТП, произошедших по вине водителя.

Используются технологии uCoz