Глобальные (стратегические) проблемы практического применения сложных математико-статистических методов (хемометрики)

Карпухин О.Н.
Карпухин Олег Никифорович
д.х.н., заведующий лабораторией
Институт химической физики РАН, Москва, 119991, Косыгина 4
E-mail: kon@chph.ras.ru

Доклад на 4-ом международном симпозиуме "Современные методы анализа многомерных данных" (WSC-4). Черноголовка, 14-18 февраля, 2005

Комплекс конференций Дружбаметрик, а это уже 5-я или 6-я конференция этого комплекса, а не 4-я, как сказано в заглавии. Комплекс конференций Дружбаметрик и ряд других ему подобных конференций, возможно много более уважаемых, представляет собой своеобразное явление в Науке.

С одной стороны, не совсем понятно, к какой области Науки эти конференции относятся. На них обсуждаются не математические проблемы, не математике они посвящены. И даже не математическим приложениям, приложению достижений математики в какой-то конкретной области. Новые математические приложения здесь редкость. Иногда, не всегда, подробно обсуждаются некие новые математические приложения. Можно, например, вспомнить об Unscrambler. Но эти конференции обсуждали не сам Unscrambler, а фактически учились на нём работать, рассматривали его применения.

Несомненно, что это и не химия, не аналитическая химия, к которой иногда эти конференции пытаются отнести. Это в какой-то мере скрыто в часто упоминаемом, так сказать, стратегическом направлении, к которому относят свои работы участники, к хемометрике. Нет не химия здесь главное. Это и геология, и экология, и социология.

С другой стороны, что же за фундаментальная научная проблема, которая объединяет эти конференции. О чём самом главном, здесь идёт речь? Какова цель, объединяющая столь разнородных участников? Ведь не просто так, неизвестно зачем они здесь собрались, на некое собрание псевдомасонской ложи?

Вот тот вопрос, который я хочу обсудить. Высказать свою точку зрения и затронуть ряд вопросов с этим связанных.

Иногда говорят, что подобные хемометрические собрания направлены на обсуждение практического применения сложных математико-статистических методов неважно в каких областях знаний. Вроде бы это чисто техническое собрание для обмена опытом.

Мне представляется неверным такое скучное объяснение сути наших хемометрических (в широком понимании этого термина) проблем.

Несомненно, что такой технический аспект присутствует. Возможно он часто экономически помогает устроителям таких конференций. Но мне представляется, что существует другая глобальная, перспективная, романтическая, если угодно, проблема подспудно сознаваемая устроителями таких конференций.

Я хочу поделиться с Вами некими личными соображениями о стратегической цели хемометрики, которой посвящена Ваша конференция и к которой я почти всю мою научную жизнь приглядываюсь. Я хочу сказать не просто о некой, можно сказать, романтической цели. Особое внимание я хотел также обратить на существование возможно непреодолимых препятствий, которые преграждают путь к этой глобальной цели.

Заранее приношу извинения за субъективизм, некую поверхностность и нечёткость изложения. Это именно соображения, меня беспокоящие и возможно для большинства не столь уж значимые, а для многих совсем тривиальные, давно им известные. Соображения возможно не имеющие никакого практического значения:, но я чуть надеюсь, что у этих соображений может быть судьба рассуждений о квантовой механике и теории относительности на прошлой границе веков.

Представьте то время, тогда почти ровно 100 лет назад, перед самым открытием теории относительности, 100-летие которого в этом году отмечает весь мир, в этом году, названном ООН годом физики. Так вот то время, нет ещё никаких мыслей об атомной бомбе, ещё нет даже mc2, с которого ведь всё и началось. Нет даже орбитальной модели атома, знакомой теперь самому неуспевающему школьнику. Есть группа чудаков, делающих странные опыты с рассеянием электронов, говорящих о каких-то протонах. И они о чём-то зачем-то рассуждают. Думают о возможных приложениях их странной науки. Совсем не о тех приложениях, которые начнут вырисовываться совсем скоро.

Не кажется ли Вам, что это похоже на современную хемометрику. Если бы аналогия действительно продолжилась, то это была бы красивая оптимистическая картинка для будущего хемометрики. Но мы не знаем будущего, и они тогда 100 лет назад его не знали.

И вот у меня сумасшедшая идея. Мне кажется, что я это возможное будущее вижу, и в то же время не верю в то, что оно будет, что оно может быть. Вижу непреодолимые, на мой взгляд, преграды на пути к этой утопии. Но попробуем всё же пофантазировать.

Говорят, что научный доклад не должен быть похож на детектив. В самом начале надо сказать, чем дело кончится.

Поэтому прежде всех пояснений отчего и почему. Да и не будет сегодня этих пояснений, это лишь то сослагательное наклонение, которое неприменимо к прошлому, но господствует в будущем. Нарисуем конечную картинку. Что же может, в конце концов, построить хемометрика? Построить в самом благоприятном случае, при полном карт-бланш во всём, и в экономической поддержке, и в интеллектуальных успехах на этом научном направлении.

Этот глобальный успех хемометрики - качественно новое описание всей системы человеческих знаний. Хемометрика может создать новую Система знаний - Нечто похожее на современный Интернет.

Никто уже не будет знать, как эта гигантская сеть знаний по законам хемометрики устроена. Все локальные теории спрятаны где-то внутри и никому неинтересны, никому не нужны.

Ведь нам совсем неинтересно, каким образом осуществляются контакты через Интернет. В этом новом мире знаний старые теории, уравнения, параметры - это то же самое, что итернетные контакты, осуществляющие связь между пользователями, между пользователями и информационными системами. Почти живая структура, нарушилась связь по одному каналу, включился другой. Так и в новой системе знаний, на смену одной теории приходит другая, и никому нет дела до того, произошло это или нет, как и почему эти изменения произошли. Важно, что система знаний функционирует, отвечает на задаваемые вопросы, помогает исполнять конкретные проекты, выдаёт необходимую информацию даже тогда, когда её не спрашивают, возможно даже ведёт некую пропаганду с неясными для пользователя целями.

Представляется, что именно такой мир создаёт современная хемометрика.

В этом мире Знаний есть одна проблема, которая лично для меня представляется весьма важной. Это проблема самосовершенствования этой Системы знаний. Что в этой Системе делают учёные, научные работники, мы с вами?

Основой этой Системы должна быть обратная связь. Система знаний не только хранит и систематизирует информацию, она получает новую информацию и соответствующим образом перестраивает Систему знаний таким образом, чтобы она не противоречила ни новой только что полученной информации, ни старой, уже накопленной информации, ранее уже содержавшейся в системе.

Какова же роль научного работника, учёного в этой идеальной Системе знаний. Ведь уже исчезла проблема создания научных теорий, написания неких уравнений, составления математических описаний. Система справляется с этим без нашего участия.

А какова же роль учёного? Учёный должен быть катализатором самосовершенствования Системы.

Для того, чтобы была такая возможность, эта идеализированная Система должна быть способна сама обнаруживать в себе проблемные места. Места, т.е. некие области знаний, в которых имеются признаки противоречий между результатами измерений и теоретическими представлениями, созданными Системой.

Задача учёного выявлять такие места и целенаправленно получать информацию для их устранения.

Система же воспринимает каждое новое измерение. Измерение, сделанное целенаправленно или сделанное случайно.

Каждое новое измерение встраивается в сеть, Систему, и тут же вся сеть, Система, перестраивается в соответствии с этим новым результатом. Автоматически указываются все горячие точки, порождаемые этим измерением.

Точки разного знака.

Положительные, указывающие на торжество теорий, порождающих всю эту сеть, их уточнения, выявляющие новые узкие места, указывающие новые перспективные приложения и т.п.

Отрицательные, выявляющие возможные противоречия, требующие поиска альтернативных теорий, новых измерений, решающих некие скрытые Системой проблемы (экспериментум круцис).

Это и есть центральная задача учёных при такой "хемометрической" Системе знаний: искать необходимые наиважнейшие измерения и наиважнейшие изменения структуры Системы, порождающие наиважнейшие приложения.

Вообще говоря, ничего нового за исключением: исчезновения теоретика-исследователя и ненужности всей армады современных теоретических знаний.

Говорят, что современная наука родилась в 16-м веке вместе с Ньютоном. Для того, чтобы понять суть переворота в познании, произошедшего в то время, надо вспомнить не Ньютона, открывшего дифференциальное и интегральное исчисление. Это был уже расцвет научного переворота. Стоит вспомнить никому теперь неизвестных наверное арабских или индийских математиков, открывших всего лишь чуть более века до этого , в XIV-XV веке, привычные для прошлого 20-го века способы деления и умножения, умножение уголком и в столбик. В первой европейской монографии в 1494г (Лука Пачоли) эти методы подаются наряду с с 8-ю другими равнозначными давно забытыми методами. Умножение в столбик называется "маленьким замком", а деление углом, "золотым делением". Чем же были тогда плохи эти простые методы? Ведь тогда даже заучивание таблиц умножения было почти непреодолимой преградой. Вплоть до-16-го века таблица умножения была доступна только узким специалистам-математикам высшего класса. Её знание не предполагалось ни в одном европейском университете. Для древнего Рима проблемой было само умножение. Ведь тогда заучивались и таблицы сложения. А пять веков, вплоть до появления массового компьютера умножали в столбик и делили углом, так, как научились делать в 16-м веке.

Да, то был большой переворот. А современная вычислительная техника - это наверное аналог тех самых методы умножения и деления 16-го века. А аналог ньютоновской революции наверное ещё грядёт, и возможно он будет совершён теми "хемиметрическими" методами, которые здесь обсуждаются.

В том, что я рассказал нет почти ничего нового. Мне просто хотелось направить ваши мысли на некую романтическую перспективу. А в конце я хочу показать, что на протяжении всей своей жизни человек строит такую псевдохемометрическую Систему. Так почему бы Человечеству не построить нечто подобное.

На этой конференции в трёх основных лекциях, а может быть и в 4-х, в тезисах ничего не сказано о том, что нам хочет рассказать Грибов, говорится о разделении всех рассматриваемых моделей на черные и белые, на soft и hard, на огромную проблему всей Науки, как соотносятся между собой содержательные, научно обоснованные, модели и методы и эмпирические, чисто математические, методы.

Я несколько иначе предлагаю взглянуть на эту проблему.

Любая познающая мир система имеет дело с двумя принципиально разными типами измерений.

Прямое измерение. Измерение, несущее информацию о мгновенном состоянии Мира, объекта измерений.

И измерение неких зависимостей, неких взаимосвязей между прямыми измерениями, логических связей между ними. Я условно называю этот тип измерений кинетическим.

Здесь видна некая методологическая аналогия моего названия этого понятия с исповедуемым здесь понятием хемометрики. Так вот хемометрика - это не только про химию, а кинетическое измерение - не только про кинетику.

С момента своего зарождения любое сознание познает мир путем измерения. Самое первое измерение, которое оно должно осознать, это то, что существует нечто кроме его самого, нечто, посылающее ему сигналы. Вернее, поступает информация о том, что есть внешний мир. Какие это сигналы, внешнего или внутреннего мира, по-видимому, не столь уж важно. Важно именно появление неких сигналов, которые собственно и активизируют нарождающееся сознание, заставляют его анализировать их, а следовательно облекать их в некую понятную этому сознанию количественную форму. Это и есть первые прямые измерения.

Возникает необходимость измерять эти сигналы. Для того чтобы понять поступающую информацию, научиться ее использовать, необходимо ее как-то измерять. Надо научиться как-то отличать один сигнал от другого, сопоставлять их между собой. Создание удобной системы измерения получаемой информации, по-видимому, самая первая задача, которую решает мозг ребенка в самом начале своего функционирования. Да и ребенка ли только?

Возможно это то, с чего начинает любое нарождающееся сознание. Любое нечто, что способно реагировать на внешние раздражители.

Здесь не место для обсуждения, когда, на каком этапе развития и каким образом решается эта задача в природе, какие организмы обладают тем или иным уровнем способностей измерять. Хотелось бы лишь обратить внимание на то, что уже на этом самом раннем этапе, по-видимому, почти сразу осознается необходимость второго типа измерений, некой информации второго рода, информации об изменении этих сигналов в силу каких-то причин. Изменение результатов прямых измерений во времени, при изменении условий или вследствие чего-то другого, о чем нарождающемуся сознанию пока ничего неизвестно.

Объект, обладающий сознанием, - это нечто весьма сложное, трудно поддающееся определению. Существует почти научная легенда о сути сознания. Способность соответствующим образом реагировать на любое возможное воздействие на живой организм может быть заложена генетически в этом организме. У организма есть рецепторы, регистрирующие внешние воздействия и точная программа действий в зависимости от результата прямого измерения. Такому организму не нужно никакого сознания, он всегда точно знает, что ему делать в любых условиях, при любом результате прямых измерений. Если такой организм сталкивается с неожиданными результатами прямых измерений он реагирует на них случайным образом и, скорее всего, не лучшим образом, в силу хотя бы второго начала термодинамики. Если же таких неожиданных условий много, если генетическая программа реагирования на внешние воздействия слишком несовершенна, то такой организм может спасти только наличие сознания, способности к анализу ряда измерений, умению оценивать результат кинетического измерения.

Это два принципиально разных типа получаемой информации. Прямое измерение значительно проще для понимания. Относительно легко расклассифицировать измерения разных типов в зависимости, например, от органов чувств, через которые поступает информация из внешнего мира. Не так уж трудно наверно даже интуитивно выработать понятие меры для таких измерений разных типов. Можно сравнивать, например, размер разных предметов или их вес, вводя сначала понятия больше-меньше, а далее усложняя понимание сути результата.

Возможно, эти понятия у каждого человека формируются по-разному, но ещё до начала общения, живя в одном и том же Мире, наверно формируются сходные понятия о первых прямых измерениях.

Уже потом в результате общения и целенаправленного обучения эти понятия довольно строго унифицируются. Но, думаю, при этом сохраняются некие индивидуальные различия. Тем не менее вероятно можно говорить об объективности прямого измерения, любой разум понимает его результат одинаково.

Измерение второго типа значительно сложнее. Возможно, не любой живой организм вообще способен его освоить. Этот организм должен, по крайней мере, обладать памятью, чтобы сравнивать результаты нескольких однотипных прямых измерений, поступающих последовательно друг за другом или дискретно с какими-то более или менее большими перерывами. Это должна быть не совсем примитивная память, если результаты сравниваемых измерений поступают дискретно, через значительные промежутки времени, перемежаясь с результатами совсем других прямых же измерений. Еще сложнее сопоставлять результаты измерения не вполне идентичных объектов. Необходимо прежде отнести их к одному и тому же классу, т.е. создать некий классификатор. Нужно как-то установить, что два разных объекта чем-то похожи друг на друга и поэтому их следует сравнивать.

Анализ такого рода измерений требует, чтобы нарождающееся сознание обладало воображением, способностью к некому прогнозу, абстрактному мышлению. В первую очередь способностью к хотя бы примитивной интерполяции и экстраполяции. Для такого анализа необходимо введение какой-то меры не только на прямые измерения, но и на измерения второго рода. На первый взгляд часто трудно даже представить, о какого рода мере идет речь. Как, например, измерить изменение настроения соседнего живого объекта, обусловленное возникшим у него чувством голода или усталости.

Результат прямого измерения прост и ясен: изменилась форма или подвижность соседа, изменились звуки им издаваемые и т.п. Но что это означает, в чем суть этого изменения, этого измерения второго рода, какой мерой оценить их значимость. Сложность этой проблемы очевидна, но в то же время, очевидно, что массы не слишком высокоорганизованных организмов быстро осваивают этот тип измерений, субъективно выбирают разнообразные меры для оценки значимости результатов таких измерений второго рода. Именно субъективно, в противовес объективности результата прямого измерения. Результат измерения второго рода зависит, как от способностей и личного опыта измеряющего устройства, так и от целей, ради достижения которых делается такое измерение.

Возможно сложный живой организм генетически настроен на ответы на множество возможных сочетаний получаемых им результатов прямых измерений. В этом случае наверное нет необходимости поиска и формализации информации второго рода. Ответная реакция происходит автоматически, так сказать, за счёт накопленной организмом наследственной памяти. Откуда взялся необходимый ответ? Как попал в геном организма? Все эти вопросы далеко за пределами нашего рассмотрения.

Необходимо как-то формализовать проблему перехода от информации первого рода к информации второго рода. От прямого измерения к осознанию сути большого массива результатов таких измерений первого рода. Разных измерений: измерений разных показателей, разных объектов, в разных условиях. Во времени изменяются как условия, так и объекты. Изменяются самопроизвольно и коррелированно. Как из этого многообразия возникает некая живая картина мира.

Конечно, нет надежды разобраться в этом до конца, по-видимому, эта задача решаема в далёкой бесконечной асимптотике. Нет надежды сколь-нибудь близко подойти к этой асимптотике. Выбран путь похожий на ab initio, с самого начала. Поэтому нет шансов добраться до конца, но есть шансы понять суть происходящего, понять, так сказать, первый член разложения в ряд всей этой сложной проблемы.

В данном случае речь идёт о неком обобщенном ряде Тейлора, которым можно описать любую многомерную функцию. Первый член разложение в этот ряд несёт информацию о начальной скорости изменения этой функции. Это очень мало для того, чтобы понять, как поведёт себя функция в дальней асимптотике. Но это понятие весьма важно при сиюминутном использовании этой функции.

Задачей является попытка в какой-то мере понять эту ситуацию и формально описать её по возможности на количественном уровне. Не похоже ли это на обычную многомерную хемометрическую задачу. Большой многомерный массив данных в многомерном же разнообразии условий. Нужно его как-то систематизировать. Установить главные компоненты, ориентировать особым образом в пространстве условий, формализовать суть управляющих массивом понятий, применить для решения задачи белые, черные, серые подходы, построить Soft или Hard модели и т.д. и т.п.

Можно сказать, что информация второго рода содержит не только сиюминутную информацию об объекте, но и информацию основанную на прежнем опыте наблюдателя. При измерении скорости этот прежний опыт почти незаметен, это лишь данные о местоположении объекта в некоторый предыдущий момент времени. Но если информации больше, если она разнообразнее, то процедура её анализа быстро усложняется.

При этом решение зависит не только от рассматриваемого массива информации, она определяется предысторией измеряющего устройства, опытом и квалификацией пользователя.

Время - самый естественный (но не единственный) показатель, определяющий изменение свойств наблюдаемого объекта. Поэтому регистрация кинетики изменения показателей свойств объекта во времени - это самый естественный тип информации второго рода о наблюдаемом объекте. Могут быть совсем другие типы информации второго рода. Например, зависимости, определяющие изменения свойств объекта как функции показателей внешних условий. Изменение объема объекта при разных температурах. Зависимость плотности газа от внешнего давления. Изменение среднего дохода в зависимости от возраста, от места жительства, от специальности индивидуума - все это другие некинетические типы информации второго рода.

Но представляется удобным называть информацию второго рода кинетической. С одной стороны, это самый естественный тип информации второго рода, а с другой, ведь нужно же этот тип информации как-то назвать.

Поэтому я обращаю ваше внимание на то, что всю имеющуюся в нашем распоряжении информацию можно разделить

Формально она изменяется в зависимости от опыта познающей её Системы, изменяется по мере поступления новой первичной информации, изменяется по мере совершенствования самой Системы, системы анализа имеющейся информации.

Обычно в Вашем понимании оба типа информации - это белые модели. Но в отличие от прямых измерений измерения второго рода – это не объективно существующие параметры, а следствия наших теоретических представлений. Следствия неких содержательных, но субъективных моделей.

Так что они не совсем белые.

Настоящая белая модель – это редкость. Часто под белой моделью вы понимаете заведомо теоретически неверную модель, следствие неких упрощений.

Что это за уравнение Аррениуса для любой конденсированной среды? Что это за константа скорости, выписанная в терминах классической, так называемой, простой кинетики, это тоже упрощение такого же рода. Ведь забыты все релаксационные процессы, процессы переноса и вещества и энергии. А какое отношения к реальности имеют любые квантово-механические расчёты? Ведь они, например, никогда не учитывают взаимодействие рассматриваемого объекта со средой.

Поэтому, когда вы говорите о серых моделях, речь идёт также об отбеливании неясно в какой цвет окрашенной упрощённой модели. Здесь как-то интерферируют два процесса посерение, за счёт введения чёрной эмпирики, и отбеливание во спасение неверной идеализированной упрощённой модели. Вообще говоря, эти два разных подхода по-разному влияют на интерпретацию, понимание, дальнейшее использование модели.

А вот прямые измерения почти всегда описываются в рамках строго чёрных моделей. Есть, конечно, некие исключения, которые обсуждают в теории измерений, но это всё же редкость.

Возможно такая же редкость по-настоящему белые модели. Это законы механики, электротехники, распространения света. Но они белые только до тех пор, пока не появляется диссипация энергии в механике, трение, пока не учитываются причины возникновения сопротивления в электротехнике, пока не рассчитываются закономерности поглощения и рассеяния света – во всех этих случаях надо говорить о субъективно выбираемых моделях, которых великое множество.

Применение количественных математико-статистических методов для описания любых явлений всегда основано на количественной интерпретации каких-либо моделей.

Обычно говорят о двух основных типах таких моделей, эмпирических и содержательных.

Эмпирические модели строятся чисто математически, не заботясь о физической сути описываемого явления. Это чисто математические модели, применимые для описания любого массива измерений, в чём-то аналогичного данному.

Содержательные модели строятся иначе. В их основу кладётся физическая суть описываемого явления. Описание такой модели может быть нерациональным с точки зрения математики и может быть применимо только к объектам, обладающим рядом в чём-то аналогичных физических свойств.

Обычно при описании реального объекта присутствует некая смесь эмпирических и содержательных моделей. Эмпирическая составляющая модели призвана устранить некие неточности и нестрогости содержательной модели. Она учитывает наличие неконтролируемых примесей в исходном объекте, неточности задания его исходных свойств, неточности задания условий, в которых объект находится и т.п.

Эмпирические модели иногда называют чёрными, в отличие от белых содержательных моделей. Соответственно модель реального процесса или явления называется серой, содержащей элементы как содержательного, так и эмпирического подходов.

К сожалению, такая простая картина качественно отличается от действительной. Истинно белые модели - большая редкость.

Обычно неизвестны или количественно не могут быть охарактеризованы многие детали содержательной модели

Простейший пример из механики. Казалось бы законы механики точно известны, они полностью определяют поведение чисто механических систем, и поэтому модели поведения таких систем должны быть волне содержательными.

По-видимому, большинство законов классической механики истинны, т.е. они пригодны для содержательного описания некоторых объектов.

Но все эти законы характеризуют весьма идеализированные ситуации.

Вот пример самой простой механической системы, которую нельзя описать истинно белыми законами механики.

Плоский параллелепипед на наклонной плоскости.

Очевидны две силы, действующие на такое тело: вес тела и сила трения. Под действием первой силы тело должно скользить по наклонной плоскости. Вторая - тормозит это движение. Первая сила - это истинно белая составляющая модели такого движения. классическая механика. Но трение? Законы трения - это по истине чёрная модель. Весьма редко известны причины возникновения силы трения и поэтому законы, управляющие величиной силы трения, это чёрные, эмпирические модели. Соответственно даже такой самый простой процесс нельзя описать по истине содержательной моделью. Даже в этом случае модель наполовину черная, т.е весьма серая.

Однако такая простая чёрно-белая картина большая редкость. Чаще всего, так называемое, содержательное описание процесса или явления строится исходя из заведомо неверной содержательной модели.

Простейший Галилеев опыт. Тело падает с относительно большой высоты. Сопротивление воздуха - аналог силы трения в предыдущем примере. Но строго вертикальное падение тела это весьма идеализированная упрощённая модель. Есть множество заранее известных не учитываемых в простейшей ситуации факторов.

Вообще говоря многие из этих факторов поддаются содержательному расчёту. Они могут учтены при описании такого движения. Пример тому расчёты входа в атмосферу космических аппаратов. По сути это тот же Галилеев опыт.

Но в повседневной жизни мы применяем упрощённую модель, заранее зная, что она не вполне белая. Так какая же это модель? Конечно не серая, в ней нет никакой эмпирики.

Представляется, что такую модель следовало бы назвать розовой. Розовая мечта о красивом простом мире. Это не совсем случайный выбор названия. Ведь само название цвета идёт от розы, цветка, в названии которого согласно греческой легенде скрыта недосказанность, недосказанность того, ради чего эта розовая модель строилась .

Галилеев опыт - это самая простая и общепонятная ситуация с построением модели описания реального объекта. Можно привести множество других примеров, когда в качестве содержательной модели используется не истинно белая, часто слишком сложная модель, а некое её розовое упрощение, а иногда и сознательное искажение.

Например, при описании почти любых процессов, протекающих при разных температурах или при температурах, изменяющихся во времени, говорят о том, что скорость такого процесса или отдельных его стадий изменяется с температурой по закону Аррениуса. Но о каком законе Аррениуса может идти речь для любых достаточно медленных процессах, протекающих в любой конденсированной фазе. Закон Аррениуса это следствие Больцманова распределения частиц по энергиям в мгновенно релаксирующей среде.

Только в неких исключительных случаях, в разреженном газе, при не слишком больших скоростях изменения условий можно говорить о выполнении закона Аррениуса.

Другой пример. Закон действующих масс, скорость химического превращения пропорциональна концентрации реагентов, участвующих в элементарном акте. Этот общеизвестный и широко применяемый закон строго справедлив только для некоторых газофазных процессов в относительно узком диапазоне скоростей и концентраций реагентов. Он выведен применительно к относительно разреженной газовой среде, в которой мгновенно восстанавливается исходное распределение частиц в пространстве. Во всех других случаях - это лишь удобное розовое упрощение.

Точно то же самое можно сказать почти о любых фундаментальных законах, часто используемых при построении моделей поведения различных объектов:

К этому же можно добавить фундаментальные законы и из других наук: биологии, медицины, экономики или социологии.

Все они присутствуют в описании поведения реального объекта не для того, чтобы учесть все детали его поведение, а для того, чтобы понять суть этого поведения. Для описания, создания работоспособной модели они не пригодны. Они описывают не реальные объекты, а некоторые их идеализированные аналоги, упрощают реальную ситуацию.

Для того чтобы перейти от такого идеализированно-упрощённого описания к модели реального объекта, нужно обязательно добавить немного эмпирики. Перейти от розового упрощения к коричневатой реальности. И это совсем не такой переход как от белой модели идеального объекта к модели реального объекта с некими изъянами.

Эмпирика применяется не только для перехода от верной белой модели к серой модели реального объекта, искаженного в силу неких причин часто нам неизвестных.

Эмпирика спасает упрощённую розовую модель, исправляя не только искажения, вызванные неидеальностью объекта, но, скрывая наши ограниченные возможности, нашу неспособность построить или применить истинно белую модели, скрывая нашу мечту об идеальном, просто и красиво устроенном мире.

Дальше можно продолжить доклад путём формализации всего сказанного выше и придти в конце концов к понятным в данной аудитории хемометрическим понятиям и методам.

Но вывод напрашивается странный. Весь формализм современной науки, со всеми её, можно сказать, математико-филологическими особенностями становится не нужным, если удастся охватить весь массив известных знаний опираясь лишь на исповедуемый здесь хемометрический подход.

Но путь к такой чуть пугающей перспективе весьма сложен. Иногда мне кажется, что преграды на этом пути непреодолимы, но, к сожалению, (а может и к счастью), кажется, что ему нет альтернативы...: Правда, всё сильно зависит от того, что называть хемометрическими методами. Название данного доклада в какой-то мере позволяет уйти от этой дискуссии, оставить некий простой субъективный выход из неё. В названии хемометрия указана лишь в скобках, в названии указаны неопределённые "сложные математико статистические методы".

Оставим в стороне этот вопрос. Наверно нет возможности детализировать суть ожидаемой информационной революции.

Интереснее, в чём проблема её практической реализации.

Одна сложнейшая проблема традиционна - преодоление способов традиционного описания имеющейся научной информации.

Победы компьютерной техники на всех уровнях, от высокой науки до мышления простой домохозяйки, заставляет думать, что эта преграда преодолима. Возможно болезненнее, т.к. не столь очевидны мгновенные преимущества этой новой Системы знаний и достаточно трудны проблемы этой новой математики. (Также как массовое использование таблиц умножения казалось почти невозможным в 16-м веке)

И вот это последнее, неочевидность успехов этой Системы для обывателя - вот наверно главная проблема.

Как возможно внедрение этих методов в повседневную научную жизнь? С чего начать построение Системы?

Сейчас эти методы внедряются, вернее сказать, опробуются, на локальных объектах. Естественный путь, ориентированный на приложения, представляется малоперспективным. Успех может быть достигнут только в случае, если единой методологией будет охвачена более или менее крупная область знаний. Для реализации этой задачи необходимо иметь некое множество локальных проблем, решаемых на основе единой методологии. Но это должны быть не разрозненные проблемы, имеющие некое прикладное значение, кому-то нужные. Это должны быть проблемы жёстко между собою связанные, жёстко, с точки зрения возможного единого описания всего этого куста проблем. Только в этом случае имеется возможность охватить с единой точки зрения всю эту область знаний, сделать её одним из зародышей будущей всеобъемлющей Системы знаний.

Что имеется в виду под жесткой взаимосвязью локальных проблем?

Необходимо, чтобы для описания этих локальных проблем использовались бы хотя бы частично перекрывающиеся массивы параметров. Тогда всю эту область знаний можно было бы связать некой информационной сетью на основе, например, померанцевских методов байесова оценивания. А далее развивать и расширять этот зародыш, демонстрируя на его примере возможности нового подхода к познанию Мира.

Наиболее подготовлены для построения такого зародыша наверно наименее практически важные области - это некие разделы фундаментальной науки, физики, химии, возможно даже теоретической экономики или социологии. Однако мне представляется, что такой экономически бесперспективный (для ближайшего, в десятки лет, будущего) проект вряд ли где-либо реально реализуем. Ведь для реализации необходим союз высококвалифицированных учёных разных областей, выбранной области исследований и математиков, условно хемометриков. Причём выигрыш ожидает только хемометриков, специалисты же выбранной области должны быть истинными бессеребрянниками. Ведь от своих коллег они ничего не получат кроме шишек, ведь им предстоит строить альтернативу их собственной науке. (Возможно, конечно, что тут я сгущаю краски).

Как ни странно, но такие проблемы было можно решать в Советском Союзе. Например, 25-30 лет назад подобные проблемы обсуждались с академиком Эмануэлем, можно их обсуждать и сейчас с некими сильными мира сего в современной науке или в Академии наук. Но тогда почти под эту самую проблему, сформулированную поуже, применительно только к химической кинетике (была выбрана область!), была создана руководимая мною до сих пор лаборатория. Для решения этой же задачи создавалась группа Максимова, к сожалению, быстро прекратившая своё существования. Тот труд не совсем пропал даром, несмотря на все превратности прошедшей четверти века я надеюсь, что два организатора Дружбаметрик - Оксана Родионова и Алексей Померанцев, в значительной мере продукты тех разговоров с Николай Марковичем Эмануэлем, они имеют шанс реализовать формулировавшуюся тогда проблему.