Демон Максвелла реализован экспериментально

Существующий в русскоязычном интернете вариант, доносящий до простого народа идею проведённого в 2010 году физического эксперимента, симулирующего демона Максвелла, меня далеко не приводит в восторг. Видимо, новостные агентства не читали оригинала, а начали переводить научно-популярные статьи из зарубежных блогов. Бездумное перепащивание привело к смещению акцентов, что я данным кратким обзором попытаюсь исправить.

Венгерский физик Лео Силард в 1929 году изобрёл гипотетическое устройство, в котором некий разум («демон Максвелла») выкачивает тепло (наиболее быстро движущиеся частицы) из изотермической среды (в которой частицы движутся с разной скоростью, но в среднем температура одинакова в силу закона больших чисел). Это приводит к тому, что часть, куда демон «складывает» самые быстрые и «горячие» частицы, нагревается, а остальная среда охлаждается. При этом уменьшается энтропия. Кажущееся противоречие второму закону термодинамики было разрешено допущением возможности конвертирования информации в энергию. Однако экспериментально доказать это было довольно трудно. Проведённый японцами эксперимент стал первым в данной области. Имена героев: Shoichi Toyabe, Takahiro Sagawa, Masahito Ueda, Eiro Muneyuki, and Masaki Sano (попробую перевести на русский: Шоичи Тоябе, Такахиро Сагава, Масахито Уеда, Еиро Мунеюки, Масаки Сано — и пусть жапонофилы меня растерзают на клочки, ибо презираю я их поверхностность и придирчивость). Основная идея работы — манипулирование неравновесной реакцией, в которой броуновская частица взбирается вверх по лестнице из электрического поля, что и является силардовским превращением информации в энергию. Частица получает свободной энергии больше, чем над ней совершается работа. Это позволяет проверить уравнение Яжинского (Jarzynski): разница свободной энергии между состояниями $latex A$ и $latex B$ некоей системы связана с работой, совершаемой над этой системой.

\(\displaystyle e^{-\frac{\Delta F}{kT}} = \overline{e^{-\frac{W}{kt}}},\)

где $latex k$ — константа Больцмана, $latex T$ — температура системы в равновесии ($latex A$), или температура теплового резервуара, в котором содержалась система до начала процесса.

Рассмотрим модель устройства Силара. Представим очень мелкую частицу на потенциале в форме спиральной лестницы. Высоту каждого шага ступеньки обзначим $latex k_{\rm B}T$, где $latex k_{\rm B}$ — постоянная Больцмана, $latex T$ — температура. Из-за колебаний температуры частица будет стохастически скакать по ступенькам. При данном случайном процессе частица будет иногда подниматься вверх, но вниз спускаться по градиенту она будет чаще. Поэтому в среднем частица будет падать с лестницы, если её не подпихивать извне.

Рассмотрим демона Максвелла (контроллер процесса). Как только частица прыгает вверх, мы за ней помещаем барьер для предотвращения скатывания вниз. Если процесс повторять, то частица будет подниматься по лестнице. В идеале энергия, затрачиваемая на создание барьера, должна быть пренебрежимо малой. Частица получает свободную энергию из среды без каких-то прямых «инъекций» энергии. Что заставляет частицу подниматься по лестнице? Обобщение законов термодинамики гласит, что этим «чем» является информация, получаемая в результате измерения положения частицы.

В микроскопических системах тепло, работа и внутренняя энергия постоянно подвержены значимым колебаниям. Однако в среднем второй закон термодинамики выполняется:

\(\displaystyle\mathbb{E}(\Delta F-W)\leqslant0,\)

где $latex \Delta F$ — разница между свободной энергией двух состояний и $latex W$ — работа, совершаемая над системой.
Однако наблюдение и демоническое вмешательство с использованием информации позволит нам нарушить второй закон термодинамики: мы будем в полном соответствии с Силардом конвертировать 1 бит информации в $latex k_{\rm B}T \ln2$ свободной энергии. Обобщённый второй закон термодинамики тогда будет выглядеть так:

\(\mathbb{E}(\Delta F-W)\leqslant k_{\rm B}TI,\)

где $latex I$ — это полное количество информации, полученной из измерений. В таком случае тепловая сортировка путём управления системой позволит нам оценить и входную, и выходную энергию и соотнести их.

Димерная частица (полистирол) диаметром 287 нм прикрепляется связующей молекулой к стеклянной поверхности камеры, заполненной буферным раствором. Частица полистирола может вращаться под воздействием броуновского движения.

Четыре электрода-квадранта в нижней части стекла; подаётся мегагерцовое электрическое поле для одновременного создания периодических потенциалов и крутящего момента по направлению угла вращения. Частице создаётся наклонённый периодический потенциал синусоидальной формы (симуляция винтовой лестницы). На эту самую полистироловую бусину нацелен микроскоп и система обработки изображений. С периодом в 44 мс и задержкой реакции воздействия в 1,1 мс проводятся циклы демонического вмешательства. В момент $latex t=0$ измеряется угловое положение частицы. Если частица находится в одном из положений отрезка S (диапазон положений частицы после вращения в желаемом нами направлении), то в момент $t=\varepsilon$ потенциал ставится в противофазу. Если нет, то ничего не меняется. В момент $t=\tau$ начинается следующее измерение угла. Область $S$ — это область выигрыша в энергии: потенциальная энергия до переключения выше, чем после переключения потенциала. Если $\varepsilon$ достаточно мало, то ожидается, что частица будет покоиться в зоне S, а после этого момента попадёт в правую «яму» синусоиды переключённого потенциала после переключения. Если $latex \varepsilon$ велико, то с большой вероятностью частица попадёт левее ямы потенциала после переключения. Поэтому период $latex \varepsilon$ — это параметр, определяющий эффективность контроля. 44 мс — это больше периода релаксации (10 мс), но меньше времени прыжка в соседний колодец (1 с), а цикл регулировки — это переход из одного равновесия в другое.

[Дописать!]

Задача для детей школьного возраста

Давать её надо семиклассникам.

У меня есть две одинаковые бочки, которые до одного и того же уровня заполнены густой жидкостью: первая — дёгтем, вторая — мёдом. Я набираю полное ведро дёгтя и выливаю в бочку с мёдом, размешивая, чтобы смесь получилась однородной. Затем я набираю полное ведро получившейся смеси и выливаю её в бочку с дёгтем, помешивая.
Вопрос: количество чего теперь больше — дёгтя в первой бочке или мёда во второй бочке?

Если какие-то дети слишком хорошо знают цену мёду и вы не хотите травмировать их хозяйственную психику уничтожением продуктов, то можно заменить жидкости на кофе и сливки. Задача хорошо запутывает размышляющее над ней человеческое создание в том случае, когда в повседневной жизни принято добавлять одну жидкость в другую, но не наоборот. Для учащихся химических лицеев можно преподнести вариант с серной кислотой и водой (заодно запомнят, что куда надо лить).

Те, кто учится в технических лицеях, могут представить эту задачу так: имеются два металлических куба, равных по объёму. Один из них железный, другой золотой. С правого края железного куба отрезают ломоть-параллелепипед определённого объёма и притирают к краю золотого. Далее от верхнего (т. е. ставшего более широким) края полученной заготовки отрезают тот же объём металла (состоящий и из железа, и из золота) и возвращают к первому образцу. Следовательно, объём металла в обоих образцах устанавливается один и тот же. Где по объёму чего больше: железа в первом образце или золота во втором? Данная формулировка, на мой взгляд, более очевидна в плане решения.

Естественно, в данной задаче может быть не одна итерация переливания-перераспределения, а несколько. Конечно же, ответа это не изменит. Легче будет проиллюстрировать данную задачу схемами.

honey and tar

Изначально у нас есть две бочки, в первой плещется один объём дёгтя, в другой — такой же объём мёда.

honey with tar

Затем берётся доля \(x\) дёгтя и выливается в мёд.

Gruesome mixture

Значит, во второй бочке теперь есть 1 объём мёда и \(x\) объёмов дёгтя (естественно, \(0A fraction of honey and tar

Производится зачерпывание объёма \(x\), в котором мёд и дёготь соотносятся так же, как и во всей второй бочке. Заметим, что раз во второй бочке у нас между собой мёд и дёготь соотносились как \(\frac{1}{1+x}\) и \(\frac{x}{1+x}\), что в сумме давало единицу, то в зачерпнутой порции соотношение объёмов то же, только абсолютные величины отличаются в \(x\) раз, что даст нам соответственные количества \(x\cdot\frac{1}{1+x}\) и \(x\cdot \frac{x}{1+x}\). И такие порции мёда и дёгтя переносятся в первую бочку.

tar with honey

Итого имеется
— дёгтя в первой бочке: \(1-x+\frac{x^2}{1+x}=\frac{1+x}{1+x}-\frac{x+x^2}{1+x}+\frac{x^2}{1+x}=\frac{1}{1+x}\);
— мёда во второй бочке: \(1-\frac{x}{1+x}=\frac{1+x}{1+x}-\frac{x}{1+x}=\frac{1}{1+x}\).

honey and tar equal

P.S. Несмотря на идеологию свободы выбора и потребления, автор данной публикации является ярым противником уничтожения пригодных в пищу продуктов, так как сам периодически испытывает нехватку в оных, и приходит в бессильную ярость при виде томатных боёв, выбрасывания в окно обеденных порций, купания в тортовом креме и тому подобного непочтения к продуктам, которые можно и нужно есть, если у них не истёк срок годности. Подобный пронутриционный экстремизм не связан с какими-либо религиозными («Еду выбрасывать грешно!», «Хлеб есть тело Христа!» и прочие вопли) либо политическими («В войну наши деды ели крапивный хлеб с горелой мукой, а ты выбрасываешь кусок доброго хлеба и выливаешь в унитаз полмиски супа!») мотивами, так как автор является противником религиозных или политических крайностей. Здесь я, скорее, руководствуюсь какими-то соображениями оптимальности распределения (можно было бы принести несъеденный пончик домой и таким образом сэкономить на покупках), так как рядовому потребителишке свойственны экономическая близорукость и ограниченная рациональность. Было бы куда разумнее не выбрасывать еду, а отложить её на более поздний приём пищи или взять с собой, так как при наступлении внезапного голода за ту же еду потребитель готов отдать гораздо больше денег, чем при отсутствии голода (сравните цену охлаждённой бутылки газировки в магазине и в буфете: торговой наценкой никак не оправдать почти двухкратной разницы в ценах). Подобного провала рынка можно было бы избежать, если бы еда не выбрасывалась, а бралась с собой в бумажный пакет. Достаточно обратить внимание на растущую в странах Запада популярность фриганизма (freeganism): если продукт с малым сроком хранения («живое пиво», охлаждённое мясо, кремовые пирожные) подлежит утилизации на пятый день, в течение которого он был пригодным к употреблению, то почему бы его не съесть, если он по-прежнему аккуратно упакован, просто содержит на упаковке дату истечения срока годности, совпавшую со вчерашним днём? Производители всегда закладывают лишный запас прочности, чтобы продукты питания не стухли в упаковке, — дополнительные процентов пять от всего срока годности еду можно отправлять в эзофаг без опаски. Но и в сохранении еды стоит знать меру: лежалые остатки помидора действительно никого не привлекают и потенциально несут в себе больше вреда, чем пользы. То же можно сказать и более общо: забрать с собой слегка укушенный кем-то другим кусок кремового торта с деловой конференции, которую посещают исключительно состоятельные и следящие за здоровьем люди, или из чебуречной, где его более вероятно мог надкусить деклассированный элемент, способный оставить на еде образцы своей инфекции, — это две большие разницы, первую из которых я поощряю, вторую — нет.

Honey and tar: the end

Как прикинуть на глаз определитель матрицы

С определителем вообще песня та ещё. Народ не понимает, что это не абы какая функция от матрицы, которая что-то там считает через миноры посредством разложения, а показатель порядка великости самой матрицы и чисел, оную составляющих. Если матрица размера \)3\times3\) и числа однозначные, то, например, трудно получить что-то, что превысит (даже при самом плохом раскладе) \( 9\cdot(9\cdot9+9\cdot9)+9\cdot(9\cdot9+9\cdot9)+9\cdot(9\cdot9+9\cdot9) = 4\,374\) — и то я не уверен, что такое вообще возможно, надо тщательно просчитывать. Как примерно прикинуть, чему равен определитель? Надо взять из каждого столбца по самому большому (по модулю) элементу и всех их перемножить — порядок будет одним и тем же. Далее последуют два примера, взятые совершенно от балды, чтобы никто не сомневался, что они случайны.
\[ \begin{vmatrix} -7 & 6 & 5 \\ 9 & 1 & 0 \\ 2 & -8 & 4 \end{vmatrix} = -614,\quad 9\cdot(-8)\cdot5=-360 \]
— очень хорошо, порядок тот же, погрешность всего два раза.
\[ \begin{vmatrix} 3 & -9 & 1 \\ -6 & 5 & -2 \\ -1 & 1 & 3 \end{vmatrix} = -130,\quad -6\cdot(-9)\cdot3=162\]
— тоже очень хорошо, порядок тот же, погрешность ещё меньше.

Чтобы определить эффективность такого «бульварного» способа оценивания определителя, я поставил в MS Excel эксперимент. Генерируется 10 столбцов по 10000 случайных чисел. Это значит, что у нас есть почти 90 000 матриц 2×2, почти 80 матриц размерности 3×3 и т. д. Короче, 10 000 матриц 10×10. Я выполняю следующий эксперимент: сначала считаю определители всех матриц по науке, а затем оцениваю их кустарным методом перемножения максимальных компонент столбцов. Эксперимент асимптотический, далее посмотрим на распределение погрешностей (во сколько раз отличается истинное значение от оценённого). Так как мы рассматриваем отношение, то имеет смысл делить большее на меньшее, так как если просто поделить оценку на истинный определитель, то получится какой-то дальний родственнник \(\frac{1}{x}\), а от 0 до 1 будет практически продублирован в зеркальном отображении под 45° весь тот хвост, который простирается от 1 до +∞.

Смысл дальнейших изысканий таков: определитель может быть меньше своей грубой оценки во сколько угодно раз, а во сколько раз он может быть больше произведения максимумов по столбцам — это случайная величина, распределение которой я сейчас продемонстрирую.

Данные до логической обработки — соотношение истинного определителя матрицы и его оценки в качестве перемноженных максимальных элементов по столбцам, распределение для матриц размерности 5×5:
Unrefined distribution

Хорошо, теперь давайте элементы от 0 до 1 обратим, чтобы была определённость с точным количеством раз разницы. Итак, теперь область определения — \((-\infty;-1]\cup[1;+\infty)\). Качественно ничего почти не изменилось:
Distribution with (-1;1) inversed to the rest of the plane

Видим, что распределение симметрично. Возьмём модуль и построим, наконец, само распределение.

Теперь сделаем самую надёжную оценку. Я не стал сравнивать распределения обращённых элементов от 0 до 1, а просто соотнёс большее с меньшим и теперь оцениваю величину по модулю.
Distribution with (-1;1) inversed, absolute value

Построим функции плотности всех распределений, чтобы иметь возможность их сравнить.

Отличие оценок определителей матриц размерности 2, 3, 4, 5, раз:
Determinant estimate destribution, 2­­-5 dimensions

Отличие оценок определителей матриц размерности 6­–10, раз:
Determinant estimate destribution, 6-10 dimensions

Странный рост в начале связан с тем, что для удобочитаемости я применял kernel smoothing, а из-за того, что число наблюдений у меня где-то 90 000, а где-то всего 10 000 (и вариация сама по себе масштабнее и непредсказуемее), я применял спецификацию Epanechnikov с шириной окна от 0,1 до 0,3 — оттого и смещение слева, от которого график особо не страдает.

Теперь посмотрим на характеристики распределения, полученные в STATA:

    variable |      mean        sd       p50       p90       p95       p99
-------------+------------------------------------------------------------
       det22 |  2.969683   6.54334  1.376561  4.798915  9.114814  34.51908
       det33 |  3.944484  7.909387  1.728523   7.35587  13.75972  43.38153
       det44 |  4.382632  8.534545  1.955284  8.227311   15.5423   47.9921
       det55 |  4.423578  8.496063   2.08463  7.745087  15.14616  50.08404
       det66 |  4.237461   7.37583  2.251156  7.518971  12.72408  40.39537
       det77 |  4.395704  6.870661  2.538924  8.340541  12.34868  35.15758
       det88 |   5.23148   6.82887  3.111089  10.87696  15.73281  33.49964
       det99 |  7.410074  9.058479  4.291309   16.8345  23.88091  45.32733
     det1010 |  11.45932  13.39037   6.51681  27.97927  39.24973  65.45165
--------------------------------------------------------------------------

Интерпретация: если вы прикидываете, чему равен определитель матрицы 3×3, методом перемножения максимумов по столбцам, то с вероятностью 50 % ошибётесь не более чем в 1,73 раза, с вероятностью 90 % ошибётесь не более чем в 4,8 раза, с вероятностью 95 % (королева вероятностей) ошибётесь не более чем в 9 раз, с вероятностью 99 % ошибётесь не более чем в 34 раза. И так далее. А в среднем ошибётесь в 4 раза.

Мне кажется, что для величин порядка двух тысяч ошибка в 4 раза — это ещё хороший показатель. В этом-то несовершенном мире, попрошу заметить, который создавался не учёными, а природой, обезьянами, дикарями, племенами вояк, крестьянами и т. п., ошибка в 4 раза — это приемлемая точность. Необходимо разрушить мир и создать более научно измеримую систему, но пока у Меня нет на это времени.

P.S. Если кому-то не нравится масштаб наблюдений, пожалуйте отведать на десерт логарифмической оси ординат:
Determinant estimate destribution, 2-5 dimensions, log axis
Determinant estimate destribution, 6-10 dimensions, log axis

P.P.S. Для желающих провести эксперимент самостоятельно:

  1. Excel, генерация случайных чисел, функции МОПРЕД, ЕСЛИ.
  2. Wolfram Mathematica 8,
    det22 = SmoothKernelDistribution[Flatten[Import["C:/Users/admin/Desktop/det22.csv"]], 0.1, "Epanechnikov"]

    (вместо 0,1 можно задать другую ширину окна, вместо "Epanechnikov" можно задать другой метод наложения горба). Внимание, если задать ширину не явно, а, скажем, "SheatherJones", то система виснет при таком числе наблюдений!

  3. Там же:
    Plot[{PDF[det22, x], PDF[det33, x], PDF[det44, x], PDF[det55, x]}, {x, 1, 12}, PlotRange -> {0, 1}, PlotStyle -> {{Blue, Thick}, {Red, Thick}, { Brown, Thick}, { Black, Thick}}, PlotLegend -> {"2\[Times]2", "3\[Times]3", "4\[Times]4", "5\[Times]5"}, LegendShadow -> None, LegendPosition -> {.4, -.25} ]

    или что-то подобное для получения графика;

  4. STATA,
    tabstat det22 det33 det44 det55 det66 det77 det88 det99 det1010, statistics( mean sd p50 p90 p95 p99 ) columns(statistics)

    .

  5. Предлагайте сами!

Преподавателям линейной алгебры

Мне кажется, надо студентам наглядно показывать, что такое градиент и производная по направлению. Можно показать на примере гор. Вот лезет студент-скалолаз по горе, участвуя в состязании, кто выше залезет. Соответственно, градиент — это то направление для него в текущий момент, сдвинувшись по которому на небольшую величину по горизонтали, он получит наибольший выигрыш в высоте. Скажем, если он решит переместиться на метр на на северо-восток \((1; 1)\), то он прибавит в высоте три метра, а если строго на север \((0; 1)\), то только один.

Что такое производная по направлению? Если студент увидит где-то на склоне сбоку симпатичную студентку и стал карабкаться по направлению к ней, то производная по направлению — это как изменится высота, на которой находится в данный момент студент, если он сдвинется на небольшое расстояние в сторону студентки.

Первый курс перед зачётом вообще не представляет, что такое собственные векторы. Почему там всё бывает ортогонально, почему при решении уравнений так важны собственные значения. Если мы находим собственное значение, то начинаем понимать проблему изнутри. Почему в огромных матрицах с довольно сильно зависимыми переменными всю информацию несут несколько первых собственных векторов, где там видна ортогональность (можно показать им облако точек вытянутое, провести два собственных вектора).

Почему супруги должны консолидировать усилия на кухне

Последнее время слышится всё больше призывов к домохозяйкам: «Хватит быть рабыней!», «Перестаньте готовить мужу, пусть готовит сам!» и прочая. Мало ли на свете глупцов, несведущих в математической науке!

Польза приготовления человеком еды более чем на себя доказывается на конкретном примере. Производственная функция готовящего на кухне имеет свойство возрастающей отдачи от масштаба, т. е. \(f(kx,ky)>kf(x,y)\). Это означает, что, для того чтобы приготовить в два раза больше пищи, не нужно затрачивать вдвое больше времени (или иного ресурса). Поэтому с целью ублажения сумасшедших и безголовых феминисток я предложу вариант, который устроит всех без исключения: пусть жена с мужем готовят еду на обоих по очереди, так как, скажем, если на приготовление одной порции салата или супа уходит \(t\) единиц усилий и \(r\) единиц времени, то на приготовление двух порций придётся потратить лишь около \(1{,}8t\) усилий и \(1{,}5r\) времени. Это связано с тем, что утварь, кухонные приборы и прочие средства производства будут обслуживаться лишь один раз (достать, помыть), и поэтому для обработки двойного объёма ресурсов требуется ещё меньше времени, ведь суп может вариться в ёмкости большего объёма.

Имеем: при полном разделении труда и индивидуальности членов семьи и муж, и жена в сумме тратят \(2t+2r\) усилий и времени, в то время как вступившие во взаимодействие благоразумные их соседи — лишь \(1{,}8t+1{,}5r\), что позволяет им сэкономленные силы и время перераспределить с учётом переговорной силы сторон.

Где ваш рассудок, борчихи за права женщин?