Математический анализ: Введение в производные

10 мар 2019 в 0:31

Данная статья является переводом статьи Calculus: Building Intuition for the Derivative.


Автор оригинала: Kalid Azad, перевёл: Филипп Сорокин.


Цель статьи – объяснение производных простым языком. Статья рассчитана на студентов и всех тех, кто интересуется высшей математикой и хочет понять, что такое производная, какой смысл у производной, но испытывает трудности с пониманием сухого и скучного языка учебников. Чайникам тоже будет понятно.


Информация, изложенная ниже, помогает понять смысл и применение производных, но не учит решать практические примеры. Отличное практическое руководство по нахождению производных с примерами есть на сайте MathProfi.ru.




Введение


Какое объяснение производной вы бы хотели услышать? Вот мое объяснение.


Внимание! Производная является сердцем математического анализа, сокрытым внутри этого определения:


Математическое определение производной через предел

Но что это значит?


Допустим, я дал вам волшебную газету, в которой перечислены ежедневные изменения на фондовом рынке на несколько лет вперёд (+1% в понедельник, -2% во вторник). Что бы вы смогли с этим сделать?


Ну, зная все изменения одно за другим наперёд, вы бы предсказывали будущие цены и построили бы свою империю, покупая акции дешевле и продавая их дороже. Вы бы смогли даже перестать эксплуатировать обезьян, выбирающих случайные акции для вашего портфеля.


Как и в этой волшебной газете, производная – это хрустальный шар, объясняющий, как именно изменится курс. Зная это, вы можете строить планы прошлого, настоящего и будущего, находить минимумы и максимумы и, следовательно, принимать лучшие решения. Это намного интереснее, чем типичное определение «производная – это наклон функции».


Давайте отойдем от грубых уравнений. Существуют уравнения для передачи идей: понять идею, а не грамматику.


Производные создают идеальную модель изменения из несовершенного предположения.


Этот результат пришел за тысячи лет мышления, от Архимеда до Ньютона. Давайте посмотрим на аналогии позади него.




Мы все живем в чистейшем континууме


(Континуум – непрерывная, сплошная среда – прим. пер.).


Бесконечность – это постоянный источник парадоксов («головных болей»):

- Линия состоит из точек?
- Конечно.
- Значит, на линии бесконечное количество точек?
- Ага.
- Как пройти какое-либо расстояние, если оно состоит из бесконечного количества точек, которые нужно посетить? (вот это да, спасибо, Зенон).

И всё же, мы двигаемся. Моя интуиция в бесконечной борьбе с бесконечностью. Например, есть бесконечное число точек на расстоянии между 0 и 1. Но я двигаюсь две бесконечности точек в секунду (каким-то образом!) и пересекаю это расстояние за полсекунды.


В этом расстоянии бесконечность точек, но движение всё же возможно, потому что скорость движения измеряется в «бесконечностях точек в секунду».


Вместо того, чтобы думать о разнице («как далеко до следующего пункта?»), мы можем сравнивать скорость («как быстро мы двигаемся через этот континуум?»).


Это странно, но для скорости 10/5 можно представить такое объяснение: «Мне нужно пройти 10 «бесконечностей» за 5 единиц времени. Для этого я должен проходить по 2 «бесконечности» за каждую единицу времени».


Аналогия: представьте, что деление – это скорость движения через континуум точек.




Что следует сразу после нуля?


Еще один сложный вопрос: какое число следует сразу после нуля? 0.01? 0.0001?


Хм. Насколько бы малое число вы не назвали, я смогу назвать меньше (я просто разделю его на два!).


Даже если мы не можем назвать число, стоящее сразу после нуля, оно всё равно должно существовать, верно? Как демоны прошлого, это «число, которое не может быть названо, чтобы вы не были поражены».


Обозначим за dx расстояние до следующего числа. Я не знаю, насколько это расстояние велико, но оно существует!


Аналогия: dx (дельта икс, бесконечно малое число – прим. пер.) – это «сдвиг» до следующего числа в континууме.




Измерения зависят от прибора


Производная предсказывает изменения. Хорошо, как теперь нам измерить скорость (изменение расстояния)?

Инспектор ДПС: Вы знаете, как быстро вы ехали?
Водитель: Без понятия.
Инспектор ДПС: 150 километров в час.
Водитель: Но я не ехал уже час!

Нам точно не нужен «полный час» для измерения нашей скорости. Мы можем провести измерения до и после (скажем, за 1 секунду) и получить вашу мгновенную скорость. Если вы бы переместились на 42 метра за одну секунду, ваша скорость была бы ~150 километров в час. Просто, правда?


Не совсем. Представьте себе видеокамеру, направленную на Кларка Кента (альтер-эго Супермена), сидящего на стуле. Камера снимает со скоростью 24 кадра в секунду (один кадр раз в ~40 миллисекунд), Кларк остаётся в кадре. При покадровой разбивке видео кажется, что он не движется, и его скорость составляет 0 км/ч.


Но это не так! Между съёмкой каждого кадра, происходящей раз в 40 миллисекунд, Кларк перевоплощается в Супермена, успевает бороться с преступностью и возвращается обратно на стул для хорошего фото. Мы измерили, что его скорость составляла 0 км/ч, но на самом деле он двигался – он перемещался слишком быстро для наших приборов измерения.


Аналогия: как и камера, наблюдающая за Суперменом, скорость, которую мы измеряем, зависит от приборов измерения!




Бег на беговой дорожке


Мы приближаемся ко вкусному, слегка острому сердцу производной. Нам нужны измерения до и после, чтобы обнаружить изменения, но наши измерения могут быть ошибочными.


Представьте себе Деда Мороза без рубашки на беговой дорожке (постарайтесь, я пока подожду). Мы собираемся измерить его сердечный ритм в стресс-тесте: мы прикрепим к нему десятки тяжелых холодных электродов и заставим его бегать.


Дед Мороз злится и пыхтит, а его частота сердечных сокращений доходит до 190 ударов в минуту. Таков его нормальный сердечный ритм под нагрузкой, верно?


Нет. Видите ли, само присутствие строгих ученых и холодных электродов увеличило его сердечный ритм! Мы намерили 190 ударов в секунду, но мы не знаем, каков был бы его пульс, если бы к нему не были присоединены электроды! Но, конечно, если бы их не было, у нас не было бы измерения.


Как теперь быть? Посмотрите на систему:

Измерение = Фактическая величина + Эффект измерения

Ах. После множества исследований мы можем обнаружить, что «каждый электрод добавляет 10 ударов в минуту к сердечному ритму». Мы проводим измерение (несовершенное предположение о 190 ударах в минуту) и устраняем влияние электродов («идеальная оценка»).


Аналогия: избавьтесь от «эффекта электрода» после проведения измерений.


Кстати, «электродный эффект» появляется везде. Научные исследования подвержены Хоторнскому эффекту, при котором люди меняют свое поведение по причине самого факта их изучения. Похоже, что все, кого мы изучаем, придерживаются своей диеты (проявляют свою реакцию на изучение – прим. пер.)!




Понимание производной


Вооружившись этими знаниями, мы можем представить, каким образом изменяются модели производной:


Изменение модели производной

Начнём с некоторой функции для понимания, f(x):


1. Прибавим к x наименьшую возможную величину (dx).

2. Получим разницу между значением до и после прибавления dx: f(x+dx)-f(x).

3. Мы не знаем точно, насколько мал dx, но нам это и не нужно знать: мы получим скорость движения через континуум: (f(x+dx)-f(x)) / dx.

4. Хоть эта скорость и невелика, она имеет некоторую погрешность (наши камеры слишком медленные!). Попробуем предсказать, что произойдет, если измерения будут идеальными, если бы dx вообще не было.


Магия на заключительном этапе: как нам убрать электроды? У нас есть два подхода (перевод данной статьи будет позже – прим. пер.):

Пределы: что происходит, когда dx сжимается до пустоты, выходит за предел погрешности?
Бесконечно малые величины: что, если dx – крошечное число, не обнаруживаемое в нашей системе счисления?

Оба эти пути формируют понятие «как мы выбрасываем dx, когда это не нужно?».


Моя больная мозоль: пределы – это современный формализм, они не существовали во времена Ньютона. Они помогают dx «начисто» исчезнуть. Но изучать пределы до изучения производной – это как смотреть на руль без автомобиля! Этот инструмент, позволяющий производной работать, не следует учить, как что-то отдельное.




Пример: f(x) = x2


Давайте взглянем на пример. Как функция f(x) = x2 меняется по мере прохождения континуума?


Получение производной функции f(x)=x^2

Обратите внимание на различия между последними 2 уравнениями:


Одно из них содержит погрешность (dx).


Второе содержит «истинное» изменение, где dx=0 (то есть, где мы предполагаем, что наши измерения не влияют на результат).


Время для настоящих чисел. Вот результаты функции для f(x) = x2 с интервалами dx=1:

1, 4, 9, 16, 25, 36, 49, 64...

Абсолютное изменение между каждым результатом функции:

1, 3, 5, 7, 9, 11, 13, 15...

(Здесь абсолютным изменением является «скорость» прироста результата функции f(x) между каждым шагом c интервалом dx=1)


Пройдёмся по промежутку с x=2 по x=3 (32 - 22 = 5). Из чего состоит «5»?

Измеренная скорость = Фактическая скорость + Погрешность
5 = 2x + dx
5 = 2(2) + 1

Мы получили скорость «5 единиц в секунду», потому как прошли от 4 до 9 за интервал времени, равный 1 секунде. Но наши измерительные приборы нас обманули! Только 4 единицы скорости являются реальным изменением, а 1 единица возникла из-за погрешности приборов измерения (1.0 – большой интервал времени, нет?).


Если мы ограничимся целыми числами, то 5 – это идеальное измерение скорости от 4 до 9. В предположении нет «ошибочного» dx=1, потому как это истинный интервал между соседними точками.


Но в реальном мире измерения каждые 1.0 секунды слишком медленные. Что если бы наш dx был 0.1? Какую скорость мы намеряем при x=2?


Ну, мы рассмотрим изменение от x=2 до x=2.1:

2.12 - 22 = 0.41

Обратите внимание, 0.41 – это то, что мы изменили на интервале 0.1 (одной десятой от единицы времени – прим. пер.). Наша скорость за полную единицу времени составляет 0.41 / 0.1 = 4.1. И снова у нас есть:

Измеренная скорость = Фактическая скорость + Погрешность
4.1 = 2x + dx

Интересно. С dx=0.1, измеренная и фактическая скорости близки (4,1 и 4, погрешность 2.5%). При dx=1 разница была намного заметнее (5 и 4, погрешность 25%).


Следуя нашим схемам, мы можем видеть, что выбрасывание электродов (уменьшение dx до 0) приводит нас к истинной скорости 2x.


Простым языком: мы проанализировали, как изменяется f(x)=x2, нашли «несовершенное» измерение 2x + dx и вывели из него совершенную модель, а именно 2x.




Производная, как «непрерывное деление»


Я рассматриваю интеграл, как способ «лучшего умножения», с помощью которого можно воссоздать изменение результата функции.


(Нахождение интеграла – операция, обратная нахождению производной, то есть дифференцированию – прим. пер.)


Производная – это «лучший способ деления», с помощью которого определяется скорость через континуум в каждый момент времени. Например, 10/5=2 означает, что «у нас есть постоянная скорость через континуум, равная 2».


Если ваша скорость меняется, то вы должны описывать её в каждый момент времени. Это производная.


Если вы применяете эту изменяющуюся скорость к каждому мгновению (определяете интеграл производной), вы воссоздаете первоначальное поведение, так же, как и при использовании ежедневных изменений на фондовом рынке для воссоздания полной истории цен. Но это большая тема, которую мы оставим на другой день.




Подвохи: Различные определения «производной»


Вы можете встретиться с «производной» в разном контексте:


- Производная от x2 равняется 2x. Это означает, что в каждой точке пути скорость меняется на 2x (на значение х-позиции точки, умноженное на 2). (Общая формула изменений).

- Производная, равная 44, означает, что в нашем текущем местоположении наша скорость изменения равна 44.

- Производная, равная dx, может означать крошечный, гипотетический прыжок к следующей позиции. Технически, dx это «дифференциал», но термины перемешиваются. Бывает, люди говорят «производная от x», имея в виду dx.



Подвохи: Наши модели могут быть несовершенными


Мы нашли «идеальную» модель, сделав измерение и улучшив его. Иногда этого недостаточно – мы пытаемся предсказать, что было бы, если бы dx не было, но при этом добавляем dx для получения нашего первоначального предположения!


Некоторые функции плохо себя ведут и бросают вызов прогнозам: есть разница между удалением dx в пределах и тем, что на самом деле происходит в этот момент. Такие функции называются «разрывными», так как, по существу, они «не могут быть смоделированы с помощью пределов». Как вы могли догадаться, производная с ними не работает, потому как мы не можем предсказать их поведение.


Разрывные функции редко встречаются на практике, но часто в тестах с подвохом («Ох, вы попытались взять производную от разрывной функции, вы провалили тест»). Поймите сперва теоретические ограничения производных, после чего их практическую пользу в измерении различных естественных явлений. Почти каждая функция, которую вы встретите (синус, косинус, e, многочлены и т.д.), является непрерывной.




Подвохи: Интегрирование не существует в реальности


Связь между производными (дифференцированием), интегралами и анти-производными (анти-дифференцированием) держится на множестве нюансов (и изначально я неправильно это понимал). Вот метафора. Возьмём обычную тарелку и рассмотрим на её примере действие функций:


- Дифференцирование разбивает тарелку на осколки. Существует определенная процедура: получаем разницу, находим скорость изменения, а затем делаем предположение, что dx вообще нет.


- Интегрирование взвешивает осколки: ваша первоначальная функция «весила» вот столько. Существует процедура, которая называется «кумулятивное дополнение», но она не говорит нам, как выглядела тарелка до разбиения.


- Анти-дифференцирование – это построение оригинальной формы тарелки из кучи осколков.


Нет такого алгоритма, который позволил бы найти анти-производную; мы должны угадывать. Мы строим таблицу поиска с кучей известных производных (оригинальная тарелка => куча осколков), пытаемся сложить паззл и проверяем, получается ли что-то, похожее на тарелку. «Давайте найдем интеграл 10x. Мы знаем, что 2x – это производная от x2. Так... каракули, каракули... 10x – производная от 5x2».


Нахождение производных – это механика; нахождение производных – это искусство. Иногда мы застреваем: берем изменения, применяем их по частям и механически восстанавливаем паззл. Возможно, это не «настоящая» оригинальная тарелка, но она достаточно похожа на неё.


Другая тонкость: не является ли интеграл и анти-производная одним и тем же? (Изначально я так и считал.)


Да, но это неочевидно: это фундаментальная теорема математического анализа! (Это то же самое, что сказать: «Разве a2+b2 и c2 не одинаковы? Одинаковы, но это неочевидно: это теорема Пифагора!»). Спасибо Джошуа Цукеру, который помог мне разобраться.




Чтение математики


Математика – это язык, и я хочу «читать» математический анализ (а не «трактовать», как мы можем, например, трактовать средневековые немецкие гимны). Мне нужна суть, стоящая за определениями.


Моим самым большим «ага!» стало осознание роли dx: он делает измерение, и извлекается для того, чтобы сделать совершенную модель. Пределы и бесконечно малые числа – это формализмы, мы не должны в них вовлекаться. Ньютон, казалось, справлялся без них. Вооружившись этими аналогиями, становятся интересны и другие математические вопросы:


- Как мы измеряем различные размеры бесконечности? (В некотором смысле все они «бесконечны», в других смыслах диапазон (0,…,1) меньше (0,…,2)).

- Каковы настоящие правила удаления dx? (Как бесконечно малые числа и пределы по-настоящему работают?)

- Как мы объясняем числа, не записывая их? «Следующее число после 0» – это начало анализа (которое я хочу изучить).


Основы интересны тогда, когда вы понимаете, почему они существуют. Счастливой математики!




Статьи из серии про мат. анализ от Kalid Azad:




Комментарии

Данная страница не является рекламой