Правила производных: Частное, экспонента и логарифмы

2 мая 2019 в 23:59

Данная статья является переводом статьи How To Understand Derivatives: The Quotient Rule, Exponents, and Logarithms.


Автор оригинала: Kalid Azad, перевёл: Филипп Сорокин.




Введение


В прошлый раз мы рассматривали производные на примере механизмов. Функции – это механизмы с рычагами на входе (x) и выходе (y). Производная, dy/dx, – это то, как много «движения на выходе» мы получаем, когда тянем за рычаг на входе.


Схема функции f(x) с входящим значением x и исходящим значением y

Теперь мы умеем строить большие механизмы из нескольких маленьких (h = f + g, h = f * g и т.д.). Правила дифференцирования (сложения, произведения) дают нам «общий сдвиг» с точки зрения составных частей системы. Цепное правило – особое: мы можем «зайти внутрь» производной и переписать её с точки зрения других входящих данных (вроде перевода «миль в час» в «мили в минуту» – мы преобразуем «вид времени» на входе).


Резюмируя полученные ранее знания, давайте продолжим тренировку нашей интуиции на более продвинутых правилах дифференцирования. Вперёд!




Деление (правило частного)


Правило частного – то, которое никто не может вспомнить. Возможно, вы запомнили его с помощью песни «Лоу ди хай, хай ди лоу…» (песенка, помогающая запомнить формулу на английском языке: «(Low (Dee High) - High (Dee Low)) / Below2» – прим. пер.), но это не то же самое, что понимать!


Пришло время визуализировать правило частного. Ключ к пониманию в том, чтобы рассмотреть деление, как частный случай умножения:


h = f/g = f * 1/g
Схема площади h = f * (1/g)

У нас есть прямоугольник и его площадь, а также стороны, равные «f» и «1/g». Входящий «x» изменяется где-то в сторонке (по dx), так что f и g тоже меняются (по df и dg)… но как ведёт себя 1/g?


Цепное правило приходит к нам на помощь! Мы можем обернуть 1/g в хорошую, чистую переменную, затем «войти в неё» и убедиться, что деление работает изолированно внутри.


Итак, предположим, что 1/g – отдельная функция m. Внутри функция m содержит дробь, но давайте на минутку об этом забудем. Мы просто хотим объединить два вклада с каждой точки зрения:


- f изменяется по df, площадь вклада df * m = df * (1 / g)

- m изменяется по dm, площадь вклада dm * f = ?


Мы превратили m в 1/g легко. Хорошо. Но каков dm (насколько изменился 1/g) с точки зрения dg (насколько изменился g)?


Нам нужна разница между соседними значениями 1/g: 1/g и 1/(g + dg). Например:


- Какая разница между 1/4 и 1/3? 1/12

- Что насчёт 1/5 и 1/4? 1/20

- Что насчёт 1/6 и 1/5? 1/30


Как происходит подсчёт разницы? Мы находим общий знаменатель: для 1/3 и 1/4 это 1/12. И разница между «соседними» значениями (например, между 1/3 и 1/4) будет 1 / общий знаменатель, он же 1 / (x * (x + 1)). Посмотрим, вышло ли у вас понять!


1/(x+1) - 1/x = -1/x*(x+1)

Если мы сделаем нашу модель производной идеальной и предположим, что нет никакой разницы между соседними значениями, то +1 исключается, а мы получим:


-1/x*(x+1) ~ -1/x^2

(Просто интересный факт: Изменение от 1/100 до 1/101 = приблизительно одна десятитысячная)


Разница отрицательная, потому что новое значение (1/4) меньше исходного (1/3). Так какое же настоящее изменение?


- g изменяется на dg, так что 1/g будет 1/(g + dg)

- Мгновенная скорость изменения -1/g2 [как мы видели ранее]

- Общее изменение = dg * скорость, или dg * (-1/g2)


Несколько возможных вопросов:


- Почему производная отрицательная? По мере увеличения dg знаменатель становится больше, а значение в результате – меньше, мы фактически сжимаем результат (с 1/3 до 1/4 – это сокращение на 1/12).


- Почему у нас -1/g2 * dg, почему не просто -1/g2? (Сначала это меня смущало). Помните, что -1/g2 – это коэффициент цепного правила между величинами g и 1/g (типа как сказать 1 час = 60 минут). Хорошо. Нам по-прежнему нужно умножить на то, как далеко мы отошли от значения «g», а именно на dg! Час может состоять из 60 минут, но как много мы хотим преобразовать?


- Причём тут dm? m – всего лишь другое имя для 1/g. dm представляет собой общее изменение в 1/g, которое, как мы ранее установили, -1/g2 * dg. Этот трюк с подстановкой часто используется в математическом анализе для разделения сложных вычислений. «О, похоже, что делаем прямое умножение. Упс, мы заглянули в микроскоп и заметили, что одна из переменных на самом деле скрывает в себе операцию деления – посмотрим с точки зрения внутренней переменной и умножим на коэффициент».


Ух. Чтобы преобразовать наш сдвиг «dg» в «dm», мы делаем вот что:


dm = -1/g^2 * dg

И получаем:


dh = (df * m) + (f * dm); dh = (df * 1/g) + (f * -1/g^2 * dg)
Схема площади h = f * 1/g с учётом изменений по f и 1/g

Ура! В вашем учебнике может встретиться упрощённая запись:


dh = (df*g - f*dg) / g^2

Это «упрощение» скрывает в себе, что правило частного – это просто вариация правила произведения. Помните, что здесь по-прежнему есть 2 части площади, которые нужно объединить:


- Часть «f» (числитель) растёт, как и ожидается

- Часть «g» (знаменатель) отрицательна (по мере увеличения g площадь становится меньше)


Используя свою интуицию, вы можете заметить, что именно рост знаменателя способствует изменениям в сторону уменьшения.




Экспонента (ex)


e – моё любимое число. Оно имеет любопытное свойство:


d/dx e^x = e^x

которое означает, что «e меняется на 100% своего текущего значения» (читать больше) (перевод обеих статей по ссылкам будет позже – прим. пер.).


«Текущее значение» предполагает x в качестве показателя степени, и мы хотим получить изменения с точки зрения x. Что если u(x)=x2 – показатель степени, но нам всё ещё нужны изменения с точки зрения x?


u = x^2; df/dx e^u = ?

Мы опять столкнулись с цепным правилом – мы хотим зайти внутрь u, добраться до x и посмотреть, как смещение на dx меняет всю систему:


- x смещается на dx

- u смещается на du/dx, или d(x2)/dx = 2x

- Как изменяется eu?


Теперь запомните, что eu не знает, что мы хотим получить изменения с точки зрения x. e знает только о том, что его производная составляет 100% от его текущего значения, которое является степенным показателем u:


d(e^u)/du = e^u

Общее изменение по x будет:


d(e^u)/dx = du/dx * e^u = 2x * e^u = 2x * e^(x^2)

Сначала это меня смутило. Сперва я думал, что производная требует избавиться от «u». Но нет – производная от efoo – это efoo. И всё тут.


Но если foo контролируется чем-либо ещё, нам нужно умножить скорость изменения на коэффициент (d(foo)/dx), когда мы заходим с внутренней точки зрения.




Натуральный логарифм


Производная ln(x) равняется 1/x. Обычно это преподносится, как нечто само собой разумеющееся.


Моя интуиция подсказывает мне, что нужно взглянуть на ln(x), как на время роста до значения x.


ln(10) – это время роста от 1 до 10, предполагается 100% непрерывный рост

Ок, хорошо. Сколько времени нужно, чтобы вырасти до «следующего» значения, например, до 11? (x + dx, где dx = 1)


При x = 10 мы растём экспоненциально со скоростью 10 единиц в секунду. Для перехода к следующему значению требуется примерно 1/10 секунды (1/x). И когда мы находимся на x=11, требуется 1/11 секунды, чтобы добраться до 12. И так далее: время до следующего значения равно 1/x.


Производную


d/dx ln(x) = 1/x

обычно просто предлагается запомнить, но это лучше делать с пониманием её смысла, как «времени, необходимого для роста».




Хвостатый пример: xx


Самое время проверить нашу интуицию: какова производная от xx?


d/dx x^x = ?

Что за чудо-юдо. Есть два подхода:



Подход 1: Переписать всё с точки зрения e.


Как же изумительно выглядит e:


h(x) = x^x = [e^ln(x)]^x = e^(ln(x)*x)

Любой показатель степени (ab) – это просто e в другом представлении: [eln(a)]b. Нам нужна просто производная от efoo, где foo = ln(x) * x.


Но подождите-ка! Так как мы хотим производную с точки зрения «x», а не foo, нам нужно перейти к точке зрения x и умножить на d(foo)/dx:


d/dx ln(x) * x = x * 1/x + ln(x) * 1 = 1 + ln(x)

Производная от «ln(x) * x» – это просто применение правила произведения на скорую руку. Если h=xx, конечный результат будет:


h'(x) = (1 + ln(x)) * e^(ln(x)*x) = (1 + ln(x)) * x^x

Мы расписали e[ln(x)*x] в его первоначальной записи xx. Ура! Интуиция подсказывала «расписать с точки зрения e и следуя цепному правилу».



Подход 2: Независимые точки зрения.


Запомните, в производных предполагается, что каждая часть системы работает независимо. Вместо того чтобы рассматривать xx, как гигантский ком, предположим, что он сделан из двух взаимодействующих функций: uv. Затем мы можем сложить их вклады, которые каждая из функций вносит индивидуально. Мы поступим хитро и, хотя u и v одинаковы (u = v = x), мы не дадим им об этом знать!


С точки зрения u, v – это просто статический показатель степени (т.е. если v=3, то система будет u3), поэтому мы имеем:


d/du u^v = v * u^(v-1)

А с точки зрения v, u – это просто статическое основание (если u=5, система будет 5v). Перепишем основание с точки зрения e, получим:


d/dv u^v = d/dv [e^ln(u)]^v = d/dv e^(ln(u)*v) = ln(u) * e^(ln(u)*v)

Мы складываем каждую точку зрения и получаем общее изменение:


ln(u) * e^(ln(u)*v) + v * u^(v-1)

Теперь раскроем: u = v = x! Для текущей точки зрения нет коэффициентов преобразования (du/dx = dv/dx = dx/dx = 1), и у нас есть:


h' = ln(x) * e^(ln(x)*x) + x * x^(x-1) = ln(x) * x^x + x^(x-1+1) = ln(x) * x^x + x^x = (1 + ln(x)) * x^x

Всё также, как было раньше! Я был очень рад взглянуть на xx под другим углом.


Кстати, вы можете использовать Wolfram Alpha (пример) для проверки своих решений на производные (можно посмотреть шаги, нажав на «Step-by-step solution»).



Вопрос: Если бы u был более сложным, где бы мы использовали du/dx?


Представьте, что u – более сложная функция, например, u = x2 + 3: где мы должны умножить на du/dx?


Давайте подумаем об этом: du/dx вступает в игру только с точки зрения u (когда v меняется, u является статическим значением, и неважно, что u может быть дополнительно разложен на x). Вклад u таков:


d/du u^v = v * u^(v-1)

Если мы хотим получить точку зрения «dx», нужно добавить в качестве множителя du/dx:


d/du du/dx u^v = v * u^(v-1) du/dx

Мы умножаем на коэффициент преобразования «du/dx», чтобы получить вклад с точки зрения x. Аналогично, если бы v был более сложной функцией, у нас возник бы dv/dx с точки зрения v.


Посмотрим, что мы сделали – мы вычислили общий вклад d/du и при необходимости смогли его преобразовать в более конкретный d/dx.




С бесконечно малыми проще


Отделение dy от dx в dy/dx «противоречит правилам» пределов, но с бесконечно малыми числами это работает отлично. Мы сможете понять правила дифференцирования очень быстро:


Правило произведения:


(fg)' = (f + df) * (g + dg) - fg = [fg + fdg + gdf + dfdg] - fg = fdg + gdf + dfdg

Мы переводим «df *dg» в ноль, когда покидаем мир бесконечно малых и возвращаемся к нашей привычной системе счисления.


Подумайте в ключе «Как сильно меняется g? Как сильно меняется f?» и с производными всё встанет на свои места гораздо легче. «Разделите» на dx в конце.




Резюме: Попробуйте увидеть механизм


Наша цель – понимать математический анализ интуитивно, без зазубривания. Мне нужно привести несколько аналогий для правильного мышления:


- Функции – это механизмы, производные – «шевеление»

- Правила дифференцирования позволяют найти «общее шевеление» с точки зрения шевеления каждой части

- Цепное правило позволяет рассмотреть точку зрения под увеличительным стеклом (часы => минуты)

- Правило произведения добавляет вклады в площадь

- Правило частного также добавляет вклады в площадь (но один из вкладов отрицательный)

- e изменяет на 100% от текущего значения (d/dx ex = 100% * ex)

- Натуральный логарифм – это время, за которое ex достигает следующего значения (x единиц/секунд означают 1/x до следующего значения)


С практикой приходит понимание этих идей. Не стоит беспокоиться, если вы пока путаетесь – я всё ещё злоупотребляю цепным правилом при работе со степенями. Обучение – это процесс!


Счастливой математики!




Приложение: Частные производные


Допустим, наша функция зависит от двух входящих значений:


f(x,y)

Производную от f можно рассмотреть с точки зрения x (как изменится f при сдвиге x?) или с точки зрения y (как изменится f при сдвиге y?). Это одна и та же мысль: у нас есть две «независимые» точки зрения, мы их объединяем для получения общего поведения системы (это похоже на объединение точек зрения двух Солипсистов, которые думают, что только они «настоящие» люди во всей вселенной).


Если x и y зависят от одной и той же переменной (например, от t, времени), мы можем написать следующее:


df/dt = df/dx * dx/dt + df/dy * dy/dt

Это часть цепного правила – мы объединяем две точки зрения, и для каждой точки зрения мы погружаемся в её первопричину (время).


Иначе, если x и y независимы, мы можем представить производную по каждой оси вектора:


(df/dx, df/dy)

Это градиент (перевод этой статьи будет позже – прим. пер.), способ представить «изменение при перемещении в направлении x или y, начиная с этой точки». Мы объединили наши 1-мерные «точки зрения» для того, чтобы понять всю 2D-систему. На сегодня хватит.




Статьи из серии про мат. анализ от Kalid Azad:




Комментарии

Данная страница не является рекламой