Кеннет Н. Стивенс - Kenneth N. Stevens

Кеннет Ноубл Стивенс
Кеннет Ноубл Стивенс
Родился	24 марта 1924 г.; Торонто , Онтарио
Умер	19 августа 2013 г. (89 лет); Клакамас, Орегон
Национальность	Канада
Гражданство	нас
Альма-матер	Массачусетский технологический институт , Университет Торонто
Награды	Национальная медаль науки (1999)
	Научная карьера
Поля	Электротехника , Акустическая фонетика
Учреждения	Массачусетский технологический институт
Докторант	Лев Беранек
Другие научные консультанты	JCR Licklider , Уолтер А. Розенблит
Докторанты	Джеймс Л. Фланаган ; Кэрол Эспи-Уилсон ; Лоуренс Р. Рабинер ; Виктор Зу

Кеннет Нобл Стивенс (24 марта 1924 - 19 августа 2013) был профессором электротехники и компьютерных наук Кларенса Дж. ЛеБеля и профессором медицинских наук и технологий в исследовательской лаборатории электроники Массачусетского технологического института . Стивенс возглавлял группу речевой коммуникации в Исследовательской лаборатории электроники Массачусетского технологического института (RLE) и был одним из ведущих ученых в области акустической фонетики .

Он был награжден Национальной медалью науки от президента Билла Клинтона в 1999 году и премией IEEE Джеймса Л. Фланагана за речь и обработку звука в 2004 году.

Он умер в 2013 году от осложнения болезни Альцгеймера .

Образование

Раннее образование

Кен Стивенс родился в Торонто 23 марта 1924 года. Его старший брат Пит родился в Англии; Кен родился четыре года спустя, вскоре после того, как семья эмигрировала в Канаду. Его детские амбиции заключались в том, чтобы стать врачом, потому что он восхищался дядей, который был врачом. Он учился в средней школе при Департаменте образования Университета Торонто .

Стивенс учился в колледже Инженерной школы Университета Торонто на полную стипендию. Он жил дома все свои студенческие годы. Хотя сам Стивенс не мог сражаться во Второй мировой войне из-за нарушения зрения, его брат отсутствовал всю войну; его родители каждую ночь следили за новостями BBC. Стивенс специализировался на инженерной физике в университете, охватывая темы от проектирования моторизованных машин до основ физики, которые преподавались на физическом факультете. Летом он работал в оборонной промышленности, в том числе одно лето в компании, которая занималась разработкой радаров. Он получил степени SB и SM в 1945 году.

Стивенс был учителем со студенческих лет, когда читал лекции по экономике дома, которые касались некоторых аспектов физики. После получения степени магистра он остался в Университете Торонто в качестве инструктора, проводя курсы для молодых людей, вернувшихся с войны, включая своего старшего брата. Он был сотрудником Фонда Онтарио с 1945 по 1946 год, затем работал инструктором в Университете Торонто до 1948 года.

Во время магистерской работы Стивенс заинтересовался теорией управления и прошел курсы факультета прикладной математики, где один из его профессоров рекомендовал ему подать заявление в Массачусетский технологический институт для получения докторской степени.

Докторантура

Вскоре после того, как Стивенс был принят в Массачусетский технологический институт, новый профессор по имени Лео Беранек заметил, что Стивенс занимался акустикой. Беранек связался со Стивенсом в Торонто, чтобы узнать, будет ли он ассистентом преподавателя нового курса акустики Беранека, и Стивенс согласился. Вскоре после этого Беранек снова связался со Стивенсом, чтобы предложить ему должность исследователя в новом речевом проекте, который Стивенс также принял. Радиационной лаборатории в Массачусетском технологическом институте (строение 20) превращали после войны, в научно - исследовательской лаборатории электроники (RLE); Среди других лабораторий RLE организовала новую акустическую лабораторию Беранека.

В ноябре 1949 года офис рядом с офисом Кена был передан приезжему докторанту из Швеции по имени Гуннар Фант , с которым он установил дружбу и сотрудничество, которые продлились более полувека. Стивенс сосредоточился на изучении гласных во время своей докторской диссертации; в 1950 году он опубликовал небольшую статью, в которой утверждал, что автокорреляция может использоваться для различения гласных, в то время как его докторская диссертация 1952 года сообщала о результатах восприятия гласных, синтезированных с помощью набора электронных резонаторов. Фант убедил Стивенса, что модель речевого тракта с использованием линии передачи была более гибкой, чем модель резонатора, и они вместе опубликовали эту работу в 1953 году.

Кен считает, что Фэнту было тесно в сотрудничестве между отделом лингвистики и исследовательской лабораторией электроники Массачусетского технологического института. Роман Якобсон , фонолог из Гарварда , имел офис в Массачусетском технологическом институте к 1957 году, в то время как Моррис Халле присоединился к отделу лингвистики Массачусетского технологического института и перешел в RLE в 1951 году. Сотрудничество Стивенса с Галле началось с акустики, но в дальнейшем сосредоточилось на том, как акустика. и артикуляция организуют звуковые системы языка.

Стивенс защитил докторскую диссертацию в 1952 году; в его докторский комитет входили его советник Лео Беранек , а также JCR Licklider и Уолтер А. Розенблит . После получения докторской степени Стивенс перешел на работу в компанию Bolt, Beranek and Newman (ныне BBN Technologies ) на Гарвард-сквер. В начале 1950-х Беранек решил уйти с факультета Массачусетского технологического института, чтобы работать в BBN на полную ставку. Он знал, что Стивенс любит преподавать, поэтому посоветовал Стивенсу подать заявку на должность на факультете Массачусетского технологического института. Стивенс поступил так и поступил на факультет в 1954 году.

Исследования, обучение и сервис

Научный вклад

Стивенс является самым известным за его вклад в области фонологии , восприятие речи и речеобразование . Самая известная книга Стивенса «Акустическая фонетика» построена в соответствии с отличительными чертами фонологической системы Стивенса.

Вклад в фонологию

Стивенс, возможно, наиболее известен своим предложением теории, которая отвечает на вопрос: почему звуки языков мира (их фонемы или сегменты) так похожи друг на друга? При первом изучении иностранного языка поражаешься значительным различиям, которые могут существовать между звуковой системой одного языка и звуковой системой любого другого. Стивенс перевернул восприятие студента с ног на голову: вместо того, чтобы спрашивать, почему языки разные, он спросил, если звуковая система каждого языка полностью произвольна, почему языки так похожи? Его ответ - квантовая теория речи . Квантовая теория поддерживается теорией изменения языка, разработанной в сотрудничестве с Сэмюэлем Джеем Кейзером , которая постулирует существование избыточных или улучшающих функций.

Методология Стивенса в исследовании звуков речи состоит из трех этапов. Первый шаг - использовать физику (в основном модели трубок) для моделирования формы артикуляторов (например, формы передней и задней полости, округления или неокругления губ и т. Д.). На основе моделей шарнирных трубок можно рассчитать резонансные частоты, которые являются частотами формант. После расчета резонансных частот речевые данные собираются и анализируются для сравнения с теоретическими расчетами. Этот второй этап является в основном экспериментальным, когда интересующие нас токены обычно записываются либо изолированно, либо встраиваются в контролируемую несущую фразу, на которой обычно говорят несколько носителей языка как женского, так и мужского пола. Ключ к сбору данных - это контроль как можно большего числа факторов, чтобы представляющие интерес акустические свидетельства могли быть исследованы с минимальным количеством артефактов. Последним этапом исследования является сравнение результатов данных с теоретическими предсказаниями и учет возникающих различий. Иногда различия можно объяснить тем фактом, что модели ламп обычно упрощены, чтобы не учитывать потери из-за мягкости стенок голоса (хотя к теоретической модели можно добавить резисторы). Подглоточная система также может влиять на продуктивную систему голосового тракта, когда голосовая щель большая (см. Исследование влияния речи на подсвязочный резонанс). Прогнозы теоретической модели могут дать общие прогнозы относительно того, что можно ожидать найти в реальной речи, а доказательства из реальной речи также могут помочь уточнить исходную модель и лучше понять создание звуков речи.

Квантовая теория стремится элегантно описать (используя физику) и организовать все акустические свойства всех возможных звуков в матрицу. (См. Пятую главу книги «Акустическая фонетика»). Конечным ограничением всех звуков речи является сама физическая артикуляционная система, что подтверждает утверждение о том, что среди языков может быть только конечный набор звуков. Причина того, что набор речевых звуков является конечным, заключается в том, что, хотя движение артикуляторов является непрерывным, только определенные конфигурации имеют тенденцию быть артикуляторно и / или акустически стабильными, что приводит к фиксированным частотам для формант, которые формируют звуки, которые являются относительно универсальными для всех. языки (т. е. гласные и согласные). Таким образом, каждый акустический звук можно описать несколькими определяющими характеристиками (обычно двоичными). Например, округление губ (включено или выключено) - это особенность. Еще одна особенность - высота языка (высокий или низкий). В дополнение к этим определяющим характеристикам, которые служат основным описанием акустических звуков, существуют также улучшающие функции, которые помогают сделать звуки более узнаваемыми. Для каждой из этих функций можно применить методологию Стивенса, чтобы сначала использовать модель трубки для моделирования артикуляторов и прогнозирования резонансных частот, затем собрать данные для изучения акустических свойств этой функции и, наконец, согласовать с теоретической моделью и резюмируйте акустические свойства этой особенности.

Чтобы познакомиться с миром речевой науки, сначала можно прочитать книгу Денеса П. и Пинсона Э. «Речевая цепочка», в которой дается широкий обзор создания и передачи речи. Один знакомится со спектрограммами и частотами формант , которые являются основным акустическим описанием звуковых сегментов.

голосовая щель

Когда голосовые связки вибрируют, потоки воздуха проталкиваются (фильтруются) голосовым трактом, производя звук. Этот источник звука моделируется как источник тока в цепи, моделирующей производство звука. Изменения в речевом тракте могут вызвать изменение производимого звука. Частота вибрации женских голосовых связок, как правило, выше, чем у мужских, что дает женским голосам более высокую высоту, чем мужские голоса.

Исследования (Hanson, HM 1997) показали, что существует разница между тем, как женщины и мужчины вибрируют голосовыми связками; женская голосовая щель более распространена, чем мужские голоса.

подсвязочная система

Под голосовой системой понимается система, которая находится ниже голосовой щели в организме человека. Он включает трахею , бронхи и легкие . По сути, это фиксированная система, поэтому она не меняется для каждого отдельного динамика. Результаты исследований показали, что во время открытой фазы голосового цикла (когда голосовая щель открыта) за счет подсвязочной системы возникает связь, которая акустически проявляется в виде пар полюс / ноль в частотной области. Предполагается, что эти пары полюс / ноль, введенные соединительной службой, служат в качестве запрещенных или нестабильных областей в спектрах, служа естественными границами для функций гласных, таких как + передний или + задний.

У взрослых мужчин резонансные частоты их подсвязочной системы составляют 600, 1550 и 2200 Гц. (Акустическая фотоэнтика, стр. 197). Одним из неинвазивных способов измерения этих пиков является использование акселерометра, расположенного над вырезом на грудины (Henke), для регистрации ускорения кожи во время фонации. Вибрация будет захватывать резонансные частоты ниже голосовой щели (подсвязочной системы).

голосовой тракт

Голосовой тракт - это проход над голосовой щелью, вплоть до раскрытия губ. Модель с двумя трубками обычно используется для моделирования речевого тракта, одна из которых отражает размер (площадь поперечного сечения и длину) задней полости, а другая моделирует переднюю полость. Резонансные частоты, рассчитанные по модели трубки, являются частотами формант. Для воспроизведения гласного шва / ə / голосовой тракт относительно открыт на всем пути от голосовой щели до рта, поэтому модель трубки можно рассматривать как относительно однородную открытую трубку, равномерно разделяющую резонансные частоты (или форманты). . Излучение во рту привело бы к снижению этих резонансных частот примерно на пять процентов. (Acoustics Phonetics, стр. 139) Женские речевые тракты (в среднем 14,1 см) в среднем короче мужских речевых трактов (в среднем 17,7 см), поэтому они имеют более высокие формантные частоты, чем мужские.

Поскольку стенки речевого тракта мягкие, в речевом тракте теряется энергия, что увеличивает пропускную способность формант.

носовая полость

Когда небно-глоточный порт открывается во время воспроизведения определенных звуков, таких как / n / и / m /, возникает связь из-за морской полости, что придает звуку носовой оттенок.

Вклад в восприятие речи

Квантовая теория предполагает, что фонологический инвентарь языка определяется в первую очередь акустическими характеристиками каждого сегмента с границами, определяемыми акустико-артикуляторным отображением. Подразумевается, что фонологические сегменты должны обладать некоторой акустической инвариантностью. Блюмштейн и Стивенс продемонстрировали то, что казалось инвариантным соотношением между акустическим спектром и воспринимаемым звуком: добавляя энергию к спектру всплеска «па» на определенной частоте, можно превратить его в «та» или «ка». соответственно в зависимости от частоты. Наличие лишней энергии вызывает восприятие языкового согласного; его отсутствие вызывает восприятие губных.

Недавняя работа Стивенса преобразовала теорию акустической инвариантности в неглубокую иерархическую модель восприятия, модель акустических ориентиров и отличительных черт .

Вклад в производство речи

Во время творческого отпуска в KTH в Швеции в 1962 году Стивенс вызвался участвовать в экспериментах по кинорадиографии , проводимых Свеном Оманом. Кинорадиографические фильмы Стивенса - одни из самых распространенных; копии существуют на лазерных дисках, а некоторые доступны в Интернете.

Вернувшись в Массачусетский технологический институт, Стивенс согласился руководить исследованиями студента стоматологии по имени Джозеф С. Перкелл. Знания Перкелла в области анатомии полости рта позволили ему отследить рентгеновские снимки Стивенса на бумаге и опубликовать результаты.

Другие вклады в изучение производства речи включают модель, с помощью которой можно предсказать спектральную форму турбулентного речевого возбуждения (в зависимости от размеров турбулентной струи) и работу, связанную с конфигурациями голосовых складок, которые приводят к различным режимам фонирования.

Стивенс как наставник

Стивенс присоединился к Массачусетскому технологическому институту в качестве доцента в 1954 году. Он стал адъюнкт-профессором в 1957 году, полным профессором в 1963 году и был назначен председателем профессора Кларенса Дж. Лебеля в 1977 году. Один из его давних сотрудников, Деннис Клатт (который написал DECtalk во время работы в лаборатории Стивенса), сказал, что «Как руководитель, Кен известен своей преданностью студентам и своей чудесной способностью управлять загруженной лабораторией, при этом, кажется, руководствуется принципом доброжелательной анархии».

Первой докторской диссертацией, подписанной Стивенсом в Массачусетском технологическом институте, был его сокурсник Джеймс Л. Фланаган в 1955 году. Фланаган поступил в аспирантуру Массачусетского технологического института в том же году, что и Стивенс, но без предварительной степени магистра; он получил степень магистра в 1950 году под руководством Беранека, затем защитил докторскую диссертацию под руководством Стивенса в 1955 году.

По оценкам Стивенса в 2001 году, он руководил примерно сорока докторами наук. кандидаты.

По случаю получения им золотой медали Американского акустического общества в 1995 году коллеги написали о Speech Group Стивенса, что «за почти четыре десятилетия своего существования» она «выдалась за поддержку, которую оказывала. женщины-исследователи, многие из которых заняли высшие эшелоны исследовательских лабораторий по всему миру ». Лаборатория Стивенса была названа коллегами «национальным достоянием».

Профессиональное обслуживание

Стивенс был активным членом Акустического общества Америки с тех пор, как был аспирантом. Он был членом исполнительного совета с 1963 по 1966 год, вице-президентом с 1971 по 2002 год и президентом Общества с 1976 по 2007 год. Он является членом ASA. В 1983 году он получил серебряную медаль в области речевой коммуникации, а в 1995 году получил золотую медаль общества.

Стивенс также был активен в IEEE , где он имел звание IEEE Life Fellow. В 2004 году Кен Стивенс и Гуннар Фант стали совместными первыми победителями премии IEEE James L. Flanagan Speech and Audio Processing Award .

Стивенс был членом Американской академии искусств и наук , членом Национальной инженерной академии , членом Национальной академии наук и обладателем Национальной медали науки США в 1999 году .

использованная литература

внешние ссылки

Биография Стивенса в RLE / MIT

Languages

In other projects