Подтип - Subtyping

В программировании теории языка , подтипов (также подтип полиморфизм или включение полиморфизм ) является формой типа полиморфизма , в которых подтип является типом данных , который связан с другим типом данных ( супертип ) некоторым понятием взаимозаменяемости , а это означает , что элементы программы, обычно подпрограммы или функции, написанные для работы с элементами супертипа, также могут работать с элементами подтипа. Если S является подтипом T, отношение подтипа часто записывается S <: T, что означает, что любой термин типа S может безопасно использоваться в контексте, где ожидается термин типа T. Точная семантика подтипов в решающей степени зависит от деталей того, что означает «безопасно использовать в контексте, где» в данном языке программирования . Система типов языка программирования по существу определяет свое собственное отношение подтипов, которое вполне может быть тривиальным , если язык не поддерживает (или очень мало) механизмов преобразования.

Из-за отношения подтипов термин может принадлежать более чем к одному типу. Таким образом, выделение подтипов - это форма полиморфизма типов. В объектно-ориентированном программировании термин «полиморфизм» обычно используется для обозначения только этого подтипа полиморфизма , в то время как методы параметрического полиморфизма будут считаться универсальным программированием .

Функциональные языки программирования часто позволяют разбивать записи на подтипы . Следовательно, просто типизированное лямбда-исчисление, расширенное с помощью типов записей, является, пожалуй, самой простой теоретической установкой, в которой может быть определено и изучено полезное понятие подтипов. Поскольку итоговое исчисление позволяет членам иметь более одного типа, это больше не «простая» теория типов . Поскольку языки функционального программирования по определению поддерживают функциональные литералы , которые также могут храниться в записях, типы записей с подтипами предоставляют некоторые возможности объектно-ориентированного программирования. Обычно языки функционального программирования также предоставляют некоторую, обычно ограниченную, форму параметрического полиморфизма. В теоретической обстановке желательно изучить взаимодействие двух функций; общая теоретическая установка системы F _<: . Различные конкременты , которые пытаются захватить теоретические свойства объектно-ориентированного программирования могут быть получены из системы F _<: .

Понятие подтипов связано с лингвистическими понятиями гипонимии и холонимии . Это также связано с концепцией ограниченной количественной оценки в математической логике (см. Логика с сортировкой по порядку ). Подтипирование не следует путать с понятием наследования (класса или объекта) от объектно-ориентированных языков; подтипирование - это отношение между типами (интерфейсы в объектно-ориентированном языке), тогда как наследование - это отношение между реализациями, вытекающими из языковой особенности, которая позволяет создавать новые объекты из существующих. В ряде объектно-ориентированных языков создание подтипов называется наследованием интерфейса , а наследование - наследованием реализации .

Происхождение

Понятие подтипов в языках программирования восходит к 1960-м годам; он был введен в производные от Simula . Первые формальные трактовки подтипов были даны Джоном К. Рейнольдсом в 1980 году, который использовал теорию категорий для формализации неявных преобразований , и Лукой Карделли (1985).

Концепция подтипов приобрела видимость (и стала синонимом полиморфизма в некоторых кругах) с широким распространением объектно-ориентированного программирования. В этом контексте принцип безопасной подстановки часто называют принципом подстановки Лискова в честь Барбары Лисков, которая популяризировала его в своем программном докладе на конференции по объектно-ориентированному программированию в 1987 году. Поскольку он должен учитывать изменяемые объекты, идеальное понятие подтипов определенное Лисковым и Жаннетт Винг , называемое поведенческим подтипом , значительно сильнее, чем то, что может быть реализовано в средстве проверки типов . (Подробнее см. § Типы функций ниже.)

Примеры

Пример подтипов: где птица - это супертип, а все остальные - подтипы, как обозначено стрелкой в нотации UML.

Простой практический пример подтипов показан на схеме справа. Тип «птица» имеет три подтипа «утка», «кукушка» и «страус». Концептуально каждая из них представляет собой разновидность «птицы» основного типа, которая наследует многие «птичьи» характеристики, но имеет некоторые специфические отличия. На этой диаграмме используется нотация UML со стрелками с открытым концом, показывающими направление и тип связи между супертипом и его подтипами.

В качестве более практичного примера язык может разрешить использование целочисленных значений везде, где ожидаются значения с плавающей запятой ( Integer<:) Float, или он может определять общий типЧислокак общий супертип целых и действительных чисел. Во втором случае у нас есть только Integer<: Numberи Float<:, Numberно Integerи Floatне являются подтипами друг друга.

Программисты могут воспользоваться подтипами для написания кода более абстрактным образом, чем это было бы возможно без него. Рассмотрим следующий пример:

function max (x as Number, y as Number) is
    if x < y then
        return y
    else
        return x
end

Если integer и real являются подтипами Numberи для обоих типов определен оператор сравнения с произвольным Number, то в эту функцию могут быть переданы значения любого типа. Однако сама возможность реализации такого оператора сильно ограничивает тип Number (например, нельзя сравнивать целое число с комплексным числом), и на самом деле имеет смысл сравнивать только целые числа с целыми числами, а действительные числа с действительными числами. Чтобы переписать эту функцию так, чтобы она принимала только «x» и «y» одного типа, требуется ограниченный полиморфизм .

Потребление

В теории типа понятие категоризации используется , чтобы определить или оценить тип ли S является подтипом типа T .

Тип - это набор значений. Набор может быть описан расширенно , перечислив все значения, или он может быть описан интенсионально , указав принадлежность набору с помощью предиката в области возможных значений. В общих языках программирования типы перечисления определяются расширенно путем перечисления значений. Определяемые пользователем типы, такие как записи (структуры, интерфейсы) или классы, определяются по существу явным объявлением типа или использованием существующего значения, которое кодирует информацию о типе, в качестве прототипа, который нужно скопировать или расширить.

При обсуждении концепции категоризации, множество значений типа обозначаются запись его имени в математическом курсиве: $T$ . Типа, рассматривается как предикат над областью, указывается записью его имени жирным шрифтом: Т . Обычный символ <: означает «является подтипом», а :> означает «является надтипом».

A тип T вбирает S , если множество значений $Т$ , которые он определяет, является подмножеством множества $S$ , так что каждый член $S$ также является членом $T$ .
Тип может быть включен в категории более чем одного типа: супертипы S пересекаются в $S$ .
Если S <: Т (и , следовательно , $S \subseteq Т$ ), то Т , предикат , который ограничивает множество $Т$ , должны быть частью предиката S (над одной и той же области) , который определяет $S$ .
Если S включает T , а T включает S , то два типа равны (хотя они могут быть не одного и того же типа, если система типов различает типы по имени).

Практическое правило: подтип, вероятно, будет «больше / шире / глубже» (его значения содержат больше информации) и «меньше / меньше» (набор значений меньше), чем один из его супертипов (который имеет более ограниченные информация, и набор значений которой является надмножеством значений подтипа).

В контексте подчинения определения типов могут быть выражены с помощью нотации Set-builder , которая использует предикат для определения множества. Предикаты могут быть определены над областью (множество возможных значений) $D$ . Предикаты - это частичные функции, которые сравнивают значения с критериями выбора. Например: «целое число больше или равно 100 и меньше 200?». Если значение соответствует критериям, функция возвращает значение. В противном случае значение не выбирается и ничего не возвращается. (Составление списков - это форма этого шаблона, используемого во многих языках программирования.)

Если есть два предиката, которые применяют критерии выбора для типа T и которые применяют дополнительные критерии для типа S , тогда могут быть определены наборы для этих двух типов: ${\ Displaystyle P_ {T}}$ ${\ Displaystyle P_ {s}}$

{\ Displaystyle T = \ {v \ in D \ mid \ P_ {T} (v) \}}

{\ Displaystyle S = \ {v \ in D \ mid \ P_ {T} (v) {\ text {и}} P_ {s} (v) \}}

Предикат применяются вместе как часть составного предиката S определение $S$ . Два предиката соединены , поэтому оба должны быть истинными, чтобы значение было выбрано. Предикат вбирает предикат T , так что S <: T . ${\ Displaystyle \ mathbf {T} = P_ {T}}$ ${\ Displaystyle P_ {s}}$ ${\ Displaystyle \ mathbf {S} = \ mathbf {T} \ land P_ {s} = P_ {T} \ land P_ {s}}$

Например: существует подсемейство видов кошек под названием Felinae , которое является частью семейства Felidae . Род Felis , к которому принадлежит вид домашних кошек Felis catus , является частью этого подсемейства.

{\ displaystyle {\ mathit {Felinae = \ {кошка \ in Felidae \ mid \ ofSubfamily (кошка, felinaeSubfamilyName) \}}}}

{\ displaystyle {\ mathit {Felis = \ {кошка \ in Felinae \ mid \ ofGenus (кошка, felisGenusName) \}}}}

Соединение предикатов здесь выражено посредством применения второго предиката к области значений, соответствующих первому предикату. Рассматриваемые как типы, Felis <: Felinae <: Felidae .

Если T включает в себя S ( T:> S ), то процедура, функция или выражение, которым задано значение в качестве операнда (входной аргумент или термин), следовательно, смогут оперировать этим значением как одним из типа T , потому что . В приведенном выше примере мы могли ожидать, что функция Subfamily будет применима к значениям всех трех типов Felidae , Felinae и Felis . ${\ displaystyle s \ in S}$ ${\ displaystyle s \ in T}$

Схемы подтипов

Теоретики типов проводят различие между номинальным подтипом , в котором только типы, объявленные определенным образом, могут быть подтипами друг друга, и структурным подтипом , в котором структура двух типов определяет, является ли один подтипом другого. Описанное выше объектно-ориентированное подтипирование на основе классов является номинальным; правило структурного подтипа для объектно-ориентированного языка может сказать, что если объекты типа A могут обрабатывать все сообщения, которые могут обрабатывать объекты типа B (то есть, если они определяют все те же методы ), то A является подтипом B независимо от того, наследуется ли один от другого. Эта так называемая утиная типизация распространена в объектно-ориентированных языках с динамической типизацией. Хорошие правила структурного подтипирования для типов, отличных от типов объектов, также хорошо известны.

Реализации языков программирования с подтипами делятся на два общих класса: инклюзивные реализации, в которых представление любого значения типа A также представляет то же значение в типе B, если A <: B , и принудительные реализации, в которых значение типа A может быть автоматически преобразован в один из типа B . Подтипирование, вызванное созданием подклассов в объектно-ориентированном языке, обычно является инклюзивным; отношения подтипов, которые связывают целые числа и числа с плавающей запятой, которые представлены по-разному, обычно являются принудительными.

Почти во всех системах типов, которые определяют отношение подтипов, оно рефлексивно (что означает A <: A для любого типа A ) и транзитивно (что означает, что если A <: B и B <: C, то A <: C ). Это делает его предварительным заказом на типы.

Типы записей

Подтип ширины и глубины

Типы записей порождают концепции подтипов по ширине и глубине . Они выражают два разных способа получения нового типа записи, который позволяет выполнять те же операции, что и исходный тип записи.

Напомним, что запись - это набор (именованных) полей. Поскольку подтип - это тип, который разрешает все операции, разрешенные с исходным типом, подтип записи должен поддерживать те же операции с полями, что и исходный тип.

Один из способов достижения такой поддержки, называемый подтипом ширины , добавляет в запись больше полей. Более формально каждое (именованное) поле, появляющееся в супертипе ширины, будет отображаться в подтипе ширины. Таким образом, любая операция, выполнимая над супертипом, будет поддерживаться подтипом.

Второй метод, называемый подтипом глубины , заменяет различные поля их подтипами. То есть поля подтипа являются подтипами полей супертипа. Поскольку любая операция, поддерживаемая для поля в супертипе, поддерживается для его подтипа, любая операция, выполнимая с супертипом записи, поддерживается подтипом записи. Подтип глубины имеет смысл только для неизменяемых записей: например, вы можете назначить 1,5 полю 'x' реальной точки (запись с двумя реальными полями), но вы не можете сделать то же самое для поля 'x' целая точка (которая, однако, является глубоким подтипом типа реальной точки), потому что 1.5 не является целым числом (см. Дисперсия ).

Создание подтипов записей может быть определено в системе F _<:, которая сочетает в себе параметрический полиморфизм с подтипами типов записей и является теоретической основой для многих языков функционального программирования , поддерживающих обе функции.

Некоторые системы также поддерживают выделение подтипов помеченных непересекающихся типов объединения (например, алгебраических типов данных ). Правило для подтипа ширины обратное: каждый тег, появляющийся в подтипе ширины, должен появляться в супертипе ширины.

Типы функций

Если T ₁ → T ₂ является типом функции, то его подтипом является любой тип функции S ₁ → S ₂ со свойством T ₁ <: S ₁ и S ₂ <: T ₂ . Это можно резюмировать с помощью следующего правила набора текста :

${\ displaystyle T_ {1} \ leq: S_ {1} \ quad S_ {2} \ leq: T_ {2} \ over S_ {1} \ rightarrow S_ {2} \ leq: T_ {1} \ rightarrow T_ { 2}}$

Тип аргумента S ₁ → S ₂ называется контравариантным, потому что отношение подтипов для него обратное, в то время как возвращаемый тип является ковариантным . Неформально это изменение происходит потому, что уточненный тип «более либерален» в отношении типов, которые он принимает, и «более консервативен» в типе, который он возвращает. Именно это и работает в Scala : n -арная функция является внутренне классом, наследующим признак (который можно рассматривать как общий интерфейс в Java- подобных языках), где - типы параметров, а B - его возвращаемый тип; Знак « - » перед типом означает, что тип контравариантен, а знак « + » означает ковариантность. ${\ displaystyle {\ mathtt {Function_ {N} (- A_ {1}, - A_ {2}, \ dots, -A_ {n}, + B)}}}$ ${\ displaystyle {\ mathtt {A_ {1}, A_ {2}, \ dots A_ {n}}}}$

В языках, допускающих побочные эффекты, как и в большинстве объектно-ориентированных языков, подтипов обычно недостаточно, чтобы гарантировать безопасное использование функции в контексте другой. Работа Лискова в этой области была сосредоточена на поведенческом подтипах , которое помимо безопасности системы типов, обсуждаемой в этой статье, также требует, чтобы подтипы сохраняли все инварианты, гарантированные супертипами в каком-либо контракте . Это определение подтипов, как правило, неразрешимо , поэтому оно не может быть проверено средством проверки типов .

Выделение подтипов изменяемых ссылок аналогично обработке аргументов функции и возвращаемых значений. Ссылки (или приемники ) только для записи контравариантны, как и аргументы функции; Ссылки (или источники ) только для чтения ковариантны, как и возвращаемые значения. Изменяемые ссылки, которые действуют как источники и приемники, инвариантны.

Отношение к наследству

Подтипирование и наследование являются независимыми (ортогональными) отношениями. Они могут совпадать, но ни один из них не является частным случаем другого. Другими словами, между двумя типами S и T возможны все комбинации подтипов и наследования:

S не является ни подтипом, ни производным типом T
S является подтипом, но не производным типом T
S не является подтипом, но является производным от T
S является как подтипом, так и производным типом T

Первый случай иллюстрируется независимыми типами, такими как Booleanи Float.

Второй случай можно проиллюстрировать соотношением между Int32и Int64. В большинстве объектно-ориентированных языков программирования Int64не связаны наследованием с Int32. Однако Int32его можно рассматривать как подтип, Int64поскольку любое 32-битное целочисленное значение может быть преобразовано в 64-битное целочисленное значение.

Третий случай является следствием контравариантности входных подтипов функций . Предположим, что суперкласс типа T имеет метод m, возвращающий объект того же типа ( то есть тип m равен T → T , также обратите внимание, что первый аргумент m - this / self) и производный тип класса S из T . По наследству, тип м в S является S → S . Для того , чтобы S , чтобы быть подтипом T типа м в S должен быть подтипом типа м в Т , другими словами: S → S ≤: T → T . При применении правила подтипов функций снизу вверх это означает: S ≤: T и T ≤: S , что возможно только в том случае, если S и T одинаковы. Поскольку наследование является иррефлексивным отношением, S не может быть подтипом T .

Подтипы и наследование совместимы, когда все унаследованные поля и методы производного типа имеют типы, которые являются подтипами соответствующих полей и методов унаследованного типа.

Принуждение

В системах принудительного выделения подтипов подтипы определяются функциями неявного преобразования типа из подтипа в супертип. Для каждого отношения подтипирования ( S <: Т ), функция принуждения принуждать : S → T обеспечивается, и любой объект , с типом S рассматриваются как объект принуждать _{S → T} ( ы ) типа Т . Функция принуждения может быть определена композицией: если S <: T и T <: U, то s может рассматриваться как объект типа u при составном принуждении ( принуждение _{T → U} ∘ принуждение _{S → T} ). Приведение типа от типа к самому себе принуждение _{T → T} - это тождественная функция id _T

Функции принуждения для записей и подтипов непересекающихся объединений могут быть определены покомпонентно; в случае записей с расширенной шириной приведение типа просто отбрасывает любые компоненты, которые не определены в супертипе. Приведение типов для функциональных типов может быть задано как f ' ( s ) = coerce _{S ₂ → T ₂} ( f ( coerce _{T ₁ → S ₁} ( t ))), что отражает контравариантность аргументов функции и ковариацию возвращаемых значений.

Функция принуждения однозначно определяется с учетом подтипа и супертипа . Таким образом, когда определены множественные отношения подтипов, нужно быть осторожным, чтобы гарантировать, что все приведенные типы являются согласованными. Например, если целое число , такое , как 2: INT может быть принужден в число с плавающей точкой (скажем, 2,0: флоат ), то это не допустимо , чтобы принудить 2.1: поплавковый до 2: Int , поскольку соединение принуждения принуждать _{поплавка → поплавка} заданный coerce _{int → float} ∘ coerce _{float → int} , тогда будет отличаться от идентификатора принуждения идентификатора _float .

Смотрите также

Ковариация и контравариантность
Проблема круг-эллипс (для опасностей выделения подтипов переменных-типов на том же основании, что и типов-значений)
Программирование на основе классов
Тип верха
Тип уточнения
Подтип поведения

Примечания

использованная литература

Учебники

Бенджамин С. Пирс, Типы и языки программирования , MIT Press, 2002, ISBN 0-262-16209-1 , глава 15 (выделение подтипов типов записей), 19,3 (номинальные и структурные типы и подтипы) и 23,2 (разновидности полиморфизма) )
К. Шиперски, Д. Грунц, С. Мурер, Компонентное программное обеспечение: за пределами объектно-ориентированного программирования , 2-е изд., Pearson Education, 2002, ISBN 0-201-74572-0 , стр. 93–95 (презентация высокого уровня ориентированы на пользователей языков программирования)

Статьи

Кук, Уильям Р.; Хилл, Уолтер; Каннинг, Питер С. (1990). Наследование - это не подтип . Proc. 17-я конференция ACM SIGPLAN-SIGACT. по принципам языков программирования (POPL). С. 125–135. CiteSeerX 10.1.1.102.8635 . DOI : 10.1145 / 96709.96721 . ISBN 0-89791-343-4.

Рейнольдс, Джон С. Использование теории категорий для разработки неявных преобразований и универсальных операторов. В ND Jones, редактор, Proceedings of the Aarhus Workshop on Semantics-Directed Compiler Generation, номер 94 в Lecture Notes in Computer Science. Springer-Verlag, январь 1980 г. Также в: Карл А. Гюнтер и Джон С. Митчелл, редакторы, «Теоретические аспекты объектно-ориентированного программирования: типы, семантика и дизайн языка» (MIT Press, 1994).

дальнейшее чтение

Джон С. Рейнольдс , Теории языков программирования , Cambridge University Press, 1998, ISBN 0-521-59414-6 , глава 16.
Мартин Абади , Лука Карделли , Теория объектов , Springer, 1996, ISBN 0-387-94775-2 . Раздел 8.6 противопоставляет подтипы записей и объектов.

Languages

In other projects