ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ В СТАТИСТИЧЕСКОМ
ИССЛЕДОВАНИИ МОРФОЛОГИИ ЯДЕР ИММУНОКОМПЕТЕНТНЫХ КЛЕТОК
Дейнека Э.А., Лукьянова Е.А., Проценко В.Д.
(Москва)
В работе представлена нейро-статистическая модель экспертной системы, позволяющей на примере злокачественной лимфомы кожи выявить значимые изменения морфологии ядер иммунокомпетентных клеток (лимфоцитов) до и после лечения по совокупности их количественных морфометрических параметров.
APPLICATION OF THE
NEURONAL NETWORKS TO THE STATISTICAL ANALYSIS OF MORPHOLOGY IN THE NUCLEI OF
IMMUNOCOMPETENT CELLS
Deineka E.A.,
Lukianova E.A., Protsenko V.D.
(Moscow)
The
neuro-statistical expert system is presented. On the example of malignant skin lymphoma
it allows to reveal significant morphological changes in the nuclei of
immunocompetent cells (lymphocytes) before and after the treatment, using the
total combination of their quantitative morphometrical parameters.
1. Введение
Ядро — одна из важнейших органелл живой клетки — претерпевает, в зависимости от текущего состояния организма, разнообразные морфологические изменения. Особое диагностическое значение в этом отношении приобретают ядра иммунокомпетентных клеток, в частности лимфоцитов, в связи с их повышенной мобильностью и выполняемыми в организме защитными функциями. Именно они первыми реагируют на нарушение иммунологического гомеостаза, проявлением чего зачастую является изменение морфометрических характеристик их ядер. Следовательно, установив соответствие между структурными изменениями ядер иммунокомпетентных клеток и клиникой патологического процесса, можно получить новый способ диагностики заболеваний, а также оценки эффективности проводимой терапии [1].
Целью настоящего исследования является построение нейро-статистической модели, позволяющей на примере злокачественной лимфомы кожи выявить значимые изменения морфологии ядер иммунокомпетентных клеток (лимфоцитов) до и после лечения по совокупности их количественных морфометрических параметров.
Формально задача сводится к тому, чтобы исходя из значений описывающих параметров, разделить лимфоциты каждой выборки на два класса – один, содержащий клетки с неизмененной ядерной морфологией, и второй – с измененными ядрами, а затем сравнить отношение измененных клеток к интактным между выборками до и после лечения.
Проблема разделения выборки клеток на классы относится к традиционным задачам классификации, решаемым, как правило, методами кластерного анализа (в частности методом k-средних). Вместе с тем, при работе с реальными объектами и процессами возникают ситуации, когда становится невозможным расклассифицировать элементы выборки, следуя четким алгоритмам. Например в тех случаях, если встречающиеся объекты имеют одинаковые признаки, но относятся к разным классам, т.е. когда требуется классифицировать не векторы свойств, а объекты, которые обладают этими свойствами. В таком случае нужно либо искать дополнительные признаки, либо прибегнуть к методам нечеткого разделения, эффективно реализуемым на искусственных нейронных сетях. [5] Одним из пунктов настоящего исследования и будет показать на упрощенном примере возможность и удобство применения нейросетевых систем для решения подобной задачи.
2. Материалы и методы
В работе использованы численные значения описывающих параметров ядер лимфоцитов, полученные в ходе морфологического мониторинга больных злокачественной лимфомой кожи посредством анализа изображений мазков крови из очагов опухолевого роста [2], функции которого позволяют получить геометрические (площадь, периметр, фактор формы и др.) и яркостные измерения (средняя и интегральная оптическая плотность), т.е. те описывающие параметры микрообъекта, на основании которых проводится количественный анализ его морфологии [3].
В исследовании используются три выборки лимфоцитов:
1) обучающая, для которой заранее известны правильные ответы (изменение структуры ядра может быть качественно определено специалистом-цитологом с точностью около 85%, 21 клетка); 2) выборка лимфоцитов больного лимфомой кожи до лечения (42 клетки) и 3) после лечения (50 клеток).
В качестве изучаемых параметров были выбраны два морфологических признака: площадь ядра клетки и фактор формы (показатель степени округлости ядра).
Применялись последовательно 2 метода исследования: нейросетевая обработка и статистический анализ, практическая реализация которых осуществлялась с использованием программных продуктов — конструктора нейронных сетей EasyNN 4.0 [4] и статистического пакета STATISTICA for Windows, Release 4.3.
3. Результаты
Нейросетевое моделирование включало три основных момента: 1)построение сети (задание количества входных и выходных нейронов, выбор архитектуры сети); 2) обучение сети с помощью тренировочной выборки, для которой заранее известны правильные ответы; 3) обработка экспериментальных выборок на обученной модели.
Для построения нейронной сети использовался простой в обращении нейроконструктор EasyNN 4.0, позволивший:
1. произвести автоматический табличный ввод данных путем конвертирования специальным образом подготовленного текстового файла;
2. моделировать архитектуру сети (произвести выбор числа входных, выходных и скрытых нейронов, а также количества нейронов в каждом слое, задаваемых произвольно. Вместе с тем, лимитирующим фактором структурного дизайна сети являлась ее обучаемость, т.е. целью архитектурных преобразований внутренних слоев нейросети было наискорейшее ее обучение при данном уровне значимости);
3. задать значение средней ошибки, на уровне которой сеть должна была обучиться. Признаком окончания обучения послужило достижение ошибки – получаемой на исходе последнего такта функционирования сети, – равной наперед заданному значению (pтеор.=0.05).
4. получить графические интерпретации: изображение схемы конструируемой нейронной сети; кривые, отражающие динамику приближения ошибки к заданному значению.
Архитектура нейросети включала 3 слоя — входных, выходных и внутренних нейронов. На два входных нейрона сети подавались значения площади ядра клетки и фактора формы (показатель степени округлости ядра) лимфоцитов обучающей выборки.
Количество скрытых нейронов принято наращивать, начиная с удвоенного числа входных нейронов [5]. Таким образом, следующий за входным слой состоял из четырех элементов. Выходной нейрон по окончании каждого такта функционирования принимал одно из двух возможных, заранее известных значений "0" или "1", в зависимости от степени измененности ядра лимфоцита.
Количество внутренних слоев и скрытых нейронов сети, как указывалось выше, определяется степенью ее обучаемости. Они могут наращиваться в процессе обучения сети по мере необходимости. В данном случае обучение завершилось успешно (с ошибкой, равной заданной) при исходном количестве элементов и слоев (рис.1).
Так называемое обучение сети производилось следующим образом: был создан файл в текстовом формате, содержавший три колонки значений: в первой — значения площади, во второй — значения фактора формы, в третьей — правильные ответы; затем данный файл конвертировался в формат tvq программы-конструктора и преобразовался в сетку значений, после чего происходило обучение.
При этом внутри нейросети совершались следующие преобразования:
1) из обучающей выборки брался текущий пример, каждый входной параметр подавался на соответствующий нейрон; 2) сеть производила заданное число тактов, при этом вектор входных сигналов распространялся по связям между нейронами; 3) на выходных нейронах измерялись полученные значения; 4) результат интерпретировался, вычислялась величина ошибки между полученным и заранее имеющимся ответами; 5) если ошибка не равнялась нулю, вычислялись поправочные коэффициенты для всех весов матрицы связей, веса подвергались коррекции; 6) сеть переходила к следующему примеру. На рис.2 отражена динамика приближения величины ошибки к заданному значению (pтеор.= 0.05).
Рис.1. Схема нейронной сети.
Рис.2. Динамика изменения величины
ошибки.
Для организации запросов были созданы два других файла (для выборок до и после лечения), содержавшие также по три столбца значений: первые два — площадь и фактор формы, а третий — знаки вопроса.
После этого файлы конвертировались и обрабатывались сетью. Результаты сохранялись также в текстовые файлы (рис.3 А и Б).
А
Б
Рис.3. Результаты нейросетевого анализа для выборок до (А) и после (Б) лечения.
Результаты нейросетевого анализа представлены в сводной таблице 1.
Таблица 1.
|
Входные данные |
Выходные данные |
|
|
кол-во клеток |
“0” |
“1” |
Обучающая выборка |
21 |
11 |
10 |
до лечения |
42 |
8 |
34 |
После лечения |
50 |
30 |
20 |
Материалом для статистического анализа служили ответы "0" и "1", снимаемые с выхода нейросетевой системы. На основании данных статобработки и производился окончательный вывод о значимости отличия выборок лимфоцитов до и после лечения.
В результате статистической обработки (критерий Пирсона-Фишера) данных нейросетевого анализа получено pэксп.= 0.0007 (при pтеор.= 0.05) (рис. 4).
Таким образом, целостная (по совокупности морфометрических параметров) и качественная (по направлению изменений – в сторону улучшения или ухудшения) оценка эффективности противоопухолевой терапии достигалась нейросетевым методом, тогда как статистический анализ определял значимость изменений, происходивших в клетках под влиянием проводимой терапии.
Необходимо отметить, что в ходе проведенного параллельно кластерного анализа объекты выборки до лечения распределились по классам в том же количественном соотношении (8 интактных и 34 измененных), а элементы выборки после лечения хотя и разделились в соотношении 25 к 25, дальнейший статистический анализ дал pэксп.= 0.002 (по сравнению с pэксп.= 0.0007 в случае нейросетевой обработки), что значимо не повлияло на окончательный вывод (при pтеор.= 0.05).
Рис.4. Соотношение групп измененных и интактных лимфоцитов до и после лечения.
4. Заключение
Построена нейро-статистическая модель, позволяющая на примере злокачественной лимфомы кожи выявить значимые изменения морфологии ядер иммунокомпетентных клеток (лимфоцитов) до и после лечения по совокупности их количественных морфометрических параметров.
С помощью обученной трехслойной нейронной сети, состоящей из 2 входных, 4 внутренних и 1 выходного нейрона, удалось разделить выборки лимфоцитов, полученных до и после лечения, на подгруппы клеток с измененными и интактными ядрами соответственно, используя исключительно численные значения морфометрических параметров их ядер.
Статистическая обработка данных нейросетевого анализа с применением критерия Пирсона-Фишера показала, что pэксп.= 0,0007 не превышает pтеор.= 0.05, и следовательно, гипотеза об отсутствии значимого различия двух несвязанных выборок (до лечения и после лечения) была отвергнута.
Таким образом, на основании полученных результатов нейро-статистического анализа был сделан вывод о заметном эффекте от проводимой терапии у данного больного.
5. Обсуждение
Построенная нейро-статистическая модель, занимает промежуточное место между чисто статистическими методами обработки данных и методами исключительно нейросетевого моделирования и может редуцироваться к одному из них в зависимости от каждой конкретно решаемой задачи.
Среди достоинств модели можно указать:
1. Удобство организации запросов как на анализ новых выборок, так и отдельных клеток, что представляет не столько клинический, сколько гистологический интерес.
2. Удобство, связанное с отсутствием необходимости возврата к исходному микроскопическому материалу для установления класса, содержащего интактные клетки.
Список литературы:
1. Deineka E., Loukianova E., Protsenko V. The Informational-statistical approach to analisis of Kernels’ structure of Lymfoid blood cells. // Математика, компьютер, образование. Вып. 7. Тезисы докладов седьмой международной конференции. – М.: «Прогресс-Традиции», 1999, с. 377.
2. Вавилов А.М., Проценко В.Д., Самсонов В.А., Васина Н.И., Лукьянова Е.А. Методика морфологического мониторинга с использованием мазков крови из очагов поражения у больных лимфопролиферативными заболеваниями кожи. М.: Вестник дерматологии и венерологии, №5, 1999, с. 7 – 11.
3.
Jean
E. Weber. Applications of Statistical Analysis in Diagnostic Hystopathology and
Cytology. Analytical and Quantitative Cytology and Histology. V.10, N 1, 1988,
p.73-86.
4.
Сайт в сети Интернет: http://www.simtel.net/ simtel.net/win95/neural.html.
5. Нейроинформатика. – Новосибирск: Наука. Сибирское предприятие РАН, 1998.