Теорема о среднем значении - Mean value theorem

Для любой функции, непрерывной на и дифференцируемых на существует некоторая в интервал таким образом, что секущая , соединяющая концы отрезка параллельно касательной в точке .

В математике теорема о среднем значении утверждает, грубо говоря, что для данной плоской дуги между двумя конечными точками существует по крайней мере одна точка, в которой касательная к дуге параллельна секущей через ее конечные точки. Это один из самых важных результатов реального анализа . Эта теорема используется для доказательства утверждений о функции на интервале, исходя из локальных гипотез о производных в точках интервала.

Точнее, теорема утверждает, что если - непрерывная функция на отрезке и дифференцируемая на открытом отрезке , то существует точка в такой, что касательная в параллельна секущей линии, проходящей через концы, и , то есть,

История

Частный случай этой теоремы был впервые описан Парамешварой (1370–1460) из Керальской школы астрономии и математики в Индии в его комментариях к Говиндасвами и Бхаскаре II . Ограниченная форма теоремы была доказана Мишелем Роллем в 1691 году; Результатом стало то, что теперь известно как теорема Ролля , и она была доказана только для многочленов без использования методов исчисления. Теорема о среднем значении в ее современной форме была сформулирована и доказана Огюстэном Луи Коши в 1823 году. С тех пор было доказано множество вариантов этой теоремы.

Официальное заявление

Функция достигает наклона секущей между и как производная в точке .
Также возможно, что есть несколько касательных, параллельных секущей.

Пусть будет непрерывная функция на замкнутом интервале , и дифференцируема на открытом интервале , где . Тогда существует некоторые в таких , что

Теорема о среднем значении является обобщением теоремы Ролля , которая предполагает , что правая часть выше равна нулю.

Теорема о среднем значении все еще верна в несколько более общем контексте. Нужно только предположить , что это непрерывная на , и что для каждого в на пределе

существует как конечное число или равно или . Если конечно, этот предел равен . Примером, в котором применяется эта версия теоремы, является отображение действительной функции кубического корня , производная которого стремится к бесконечности в начале координат.

Обратите внимание, что утвержденная теорема неверна, если дифференцируемая функция является комплексной, а не действительной. Например, определить для всех реально . Затем

пока по любому реально .

Эти формальные утверждения также известны как теорема Лагранжа о среднем значении.

Доказательство

Выражение дает наклон линии, соединяющей точки и , которая является хордой графика , а дает наклон касательной к кривой в точке . Таким образом, теорема о среднем значении говорит, что для любой хорды гладкой кривой мы можем найти точку на кривой, лежащую между концами хорды, такую, что касательная к кривой в этой точке параллельна хорде. Следующее доказательство иллюстрирует эту идею.

Определите , где - константа. Так как непрерывно на и дифференцируемо на , то же верно и для . Теперь мы хотим выбрать так, чтобы он удовлетворял условиям теоремы Ролля . А именно

По теореме Ролля , поскольку дифференцируема и существует некоторое в, для которого , а из равенства следует, что

Подразумеваемое

Теорема 1. Предположим, что f - непрерывная вещественнозначная функция, определенная на произвольном интервале I вещественной прямой. Если производная F в каждой внутренней точке интервала I существует и равен нулю, то F является постоянным в интерьере.

Доказательство. Предположим, что производная f в каждой внутренней точке интервала I существует и равна нулю. Пусть ( , б ) произвольный открытый интервал I . По теореме о среднем значении существует точка c в ( a , b ) такая, что

Отсюда следует, что f ( a ) = f ( b ) . Таким образом, f постоянна внутри I и, следовательно, постоянна на I по непрерывности. (См. Ниже многовариантную версию этого результата.)

Примечания:

Теорема 2: Если f ' ( x ) = g' ( x ) для всех x в интервале ( a , b ) области определения этих функций, то f - g константа или f = g + c, где c - константа на ( а , б ).

Доказательство: Пусть F = f - g , тогда F '= f' - g '= 0 на интервале ( a , b ), поэтому приведенная выше теорема 1 говорит, что F = f - g является константой c или f = g + c .

Теорема 3: Если F - первообразная f на интервале I , то наиболее общая первообразная f на I - это F (x) + c, где c - константа.

Доказательство: оно непосредственно выводится из приведенной выше теоремы 2.

Теорема Коши о среднем значении

Теорема Коши о среднем значении , также известная как расширенная теорема о среднем значении , является обобщением теоремы о среднем значении. В нем говорится: если функции и обе непрерывны на отрезке и дифференцируемы на открытом отрезке , то существуют такие, что

Геометрический смысл теоремы Коши

Конечно, если и , это эквивалентно:

Геометрически это означает, что есть касательная к графику кривой

которая параллельна линии, определяемой точками и . Однако теорема Коши не утверждает существования такой касательной во всех случаях, когда и являются различными точками, поскольку она может быть удовлетворена только для некоторого значения с , другими словами, значения, для которого упомянутая кривая является стационарной ; в таких точках, скорее всего, вообще не будет определяться касательная к кривой. Примером такой ситуации является кривая, представленная

который на интервале идет от точки к , но никогда не имеет горизонтальной касательной; однако у него есть стационарная точка (фактически, куспид ) в точке .

Теорема Коши о среднем значении может использоваться для доказательства правила Лопиталя . Теорема о среднем значении является частным случаем теоремы Коши о среднем значении, когда .

Доказательство теоремы Коши о среднем значении

Доказательство теоремы Коши о среднем значении основано на той же идее, что и доказательство теоремы о среднем значении.

  • Допустим . Определите , где зафиксировано таким образом, чтобы , а именно
    Так как и непрерывны на и дифференцируемы на , то же верно и для . В общем, удовлетворяет условиям теоремы Ролля : следовательно, есть некоторые в течение которых . Теперь, используя определение, мы имеем:
    Следовательно:
    откуда и следует результат.
  • Если тогда, применяя теорему Ролля к , следует, что существует в для которого . Используя этот выбор , теорема Коши о среднем значении (тривиально) верна.

Обобщение для детерминант

Предположим, что и - дифференцируемые функции на , непрерывные на . Определять

Существует такое , что .

Заметь

а если разместить , то получим теорему Коши о среднем значении. Если разместить и получим теорему Лагранжа о среднем значении .

Доказательство обобщения довольно просто: каждый из и является определителем с двумя идентичными строками, следовательно . Из теоремы Ролля следует, что существует такое, что .

Теорема о среднем значении нескольких переменных

Теорема о среднем значении обобщается на реальные функции нескольких переменных. Уловка состоит в том, чтобы использовать параметризацию для создания реальной функции одной переменной, а затем применить теорему об одной переменной.

Позвольте быть открытое выпуклое подмножество , и позвольте быть дифференцируемой функцией. Зафиксируйте точки и определите . Поскольку функция является дифференцируемой от одной переменной, теорема о среднем значении дает:

для некоторых от 0 до 1. Но поскольку и , вычисляя явно, мы имеем:

где обозначает градиент и на скалярное произведение . Заметим , что это является точным аналогом теоремы в одной переменной (в случае этого является теорема одной переменной). По неравенству Коши – Шварца уравнение дает оценку:

В частности, когда частные производные ограничены, является липшицевым (и, следовательно, равномерно непрерывным ).

В качестве приложения вышеизложенного мы докажем, что это константа, если открыто и связно, и каждая частная производная от равна 0. Выберите некоторую точку , и пусть . Мы хотим показать каждому . Для этого пусть . Тогда E замкнуто и непусто. Он тоже открыт: для всех ,

для каждого в некотором районе . (Здесь очень важно, чтобы и были достаточно близки друг к другу.) Поскольку связан, мы заключаем .

Вышеупомянутые аргументы сделаны безкоординатным способом; следовательно, они обобщаются на случай, когда является подмножеством банахова пространства.

Теорема о среднем значении для векторных функций

Точного аналога теоремы о среднем для векторных функций не существует.

В Принципах математического анализа Рудин дает неравенство, которое может применяться ко многим из тех же ситуаций, к которым применима теорема о среднем значении в одномерном случае:

Теорема  -  Для непрерывной вектор-функции дифференцируемы на , существует такое , что .

Жан Дьедонне в своем классическом трактате « Основы современного анализа» отвергает теорему о среднем значении и заменяет ее неравенством среднего значения, поскольку доказательство неконструктивно, и нельзя найти среднее значение, а в приложениях требуется только неравенство среднего значения. Серж Лэнг в « Анализе I» использует теорему о среднем значении в интегральной форме как мгновенный рефлекс, но это использование требует непрерывности производной. Если использовать интеграл Хенстока – Курцвейла, можно получить теорему о среднем значении в интегральной форме без дополнительного предположения, что производная должна быть непрерывной, поскольку каждая производная интегрируема по Хенстоку – Курцвейлу. Грубо говоря, проблема заключается в следующем: если f  : UR m - дифференцируемая функция (где UR n открыто) и если x + th , x , hR n , t ∈ [0, 1] - рассматриваемого отрезка прямой (лежащего внутри U ), то можно применить описанную выше процедуру параметризации к каждой из составляющих функций f i ( i = 1,…, m ) функции f (в приведенных выше обозначениях множество y = x + h ). При этом на отрезке прямой находят точки x + t i h, удовлетворяющие

Но, как правило, на отрезке прямой, удовлетворяющем требованиям, не будет ни одной точки x + t * h

для всех i одновременно . Например, определите:

Тогда , но и никогда одновременно не равны нулю, так как диапазоны превышают .

Однако определенный тип обобщения теоремы о среднем на вектор-функции получается следующим образом: пусть f - непрерывно дифференцируемая вещественнозначная функция, определенная на открытом интервале I , и пусть x, а также x + h - точки Я . Теорема о среднем значении одной переменной говорит нам, что существует некоторое t * между 0 и 1, такое что

С другой стороны, согласно основной теореме исчисления с последующей заменой переменных,

Таким образом, значение f ′ ( x + t * h ) в конкретной точке t * было заменено средним значением

Эту последнюю версию можно обобщить на векторные функции:

Лемму 1  -  Пусть UR п быть открытым, F  : UR м непрерывно дифференцируема, и хU , чR п векторов , таких , что отрезок х + е , 0 ≤ т ≤ 1 остается в U . Тогда у нас есть:

где Df обозначает матрицу Якоби функции f, а интеграл матрицы следует понимать покомпонентно.

Доказательство. Обозначим через f 1 ,…, f m компоненты f и определим:

Тогда у нас есть

Утверждение следует из того, что Df - матрица, состоящая из компонентов .

Лемма 2  -  Пусть v  : [ , Ь ] → R м непрерывная функция , определенная на отрезке [ с , Ь ] ⊂ R . Тогда у нас есть

Доказательство. Обозначим через u в R m значение интеграла

Теперь имеем (используя неравенство Коши – Шварца ):

Теперь сокращение нормы u с обоих концов дает нам желаемое неравенство.

Неравенство среднего значения  -  если норма Df ( x + th ) ограничена некоторой константой M для t в [0, 1] , то

Доказательство. Из леммы 1 и 2 следует, что

Теоремы о среднем значении для определенных интегралов

Первая теорема о среднем значении для определенных интегралов

Геометрически: интерпретируя f (c) как высоту прямоугольника и b - a как ширину, этот прямоугольник имеет ту же площадь, что и область под кривой от a до b.

Пусть f  : [ a , b ] → R - непрерывная функция. Тогда существует c в [ a , b ] такое, что

Поскольку среднее значение f на [ a , b ] определяется как

мы можем интерпретировать вывод как f достигает своего среднего значения при некотором c в ( a , b ).

В общем случае, если f  : [ a , b ] → R непрерывна и g - интегрируемая функция, не меняющая знака на [ a , b ], то существует c в ( a , b ) такое, что

Доказательство первой теоремы о среднем для определенных интегралов

Предположим, что f  : [ a , b ] → R непрерывна, а g - неотрицательная интегрируемая функция на [ a , b ]. По теореме об экстремальном значении существуют такие m и M , что для каждого x из [ a , b ] и . Поскольку g неотрицательна,

Теперь позвольте

Если мы закончили, так как

означает

так что для любого c в ( a , b ),

Если I ≠ 0, то

По теореме промежуточного значения , F достигает каждое значение интервала [ т , М ], так что в течение некоторого с в [ , Ь ]

это,

Наконец, если g отрицательна на [ a , b ], то

и мы по-прежнему получаем тот же результат, что и выше.

QED

Вторая теорема о среднем значении для определенных интегралов

Существуют несколько различных теорем, которые называются второй теоремой о среднем значении для определенных интегралов . Обычно встречается следующая версия:

Если G  : [ a , b ] → R - положительная монотонно убывающая функция, а φ: [ a , b ] → R - интегрируемая функция, то существует число x в ( a , b ] такое, что

Здесь означает , наличие которого следует из условий. Обратите внимание, что очень важно, чтобы интервал ( a , b ] содержал b . Вариант, не имеющий этого требования:

Если G  : [ a , b ] → R - монотонная (не обязательно убывающая и положительная) функция, а φ  : [ a , b ] → R - интегрируемая функция, то существует такое число x в ( a , b ), что

Теорема о среднем значении для интегрирования не работает для векторных функций

Если функция возвращает многомерный вектор, то MVT для интегрирования неверен, даже если область значений также является многомерной.

Например, рассмотрим следующую двумерную функцию, определенную на -мерном кубе:

Тогда по симметрии легко увидеть, что среднее значение по области его определения равно (0,0):

Однако нет никакого смысла , потому что везде.

Вероятностный аналог теоремы о среднем значении

Пусть X и Y - неотрицательные случайные величины такие, что E [ X ] <E [ Y ] <∞ и (т.е. X меньше Y в обычном стохастическом порядке ). Тогда существует абсолютно непрерывная неотрицательная случайная величина Z, имеющая функцию плотности вероятности

Пусть g - измеримая и дифференцируемая функция такая, что E [ g ( X )], E [ g ( Y )] <∞, и пусть ее производная g ′ измерима и интегрируема по Риману на интервале [ x , y ] для всех yx ≥ 0. Тогда E [ g ′ ( Z )] конечно и

Обобщение в комплексном анализе

Как отмечалось выше, теорема не верна для дифференцируемых комплекснозначных функций. Вместо этого формулируется такое обобщение теоремы:

Пусть f  : Ω → C - голоморфная функция на открытом выпуклом множестве Ω, и пусть a и b - различные точки в Ω. Тогда существуют точки u , v на L ab (отрезок от a до b ) такие, что

Где Re () - действительная часть, а Im () - мнимая часть комплексной функции.

Смотрите также

Примечания

внешние ссылки