Лексика (лингвистика) - Lexis (linguistics)

В лингвистике термин лексика (от древнегреческого : λέξις / слово) обозначает полный набор всех возможных слов в языке или определенное подмножество слов, сгруппированных по определенным лингвистическим критериям. Например, общий термин английская лексика относится ко всем словам английского языка , в то время как более конкретный термин английская религиозная лексика относится к определенному подмножеству в английской лексике, охватывая только слова, которые семантически связаны с религиозной сферой жизни.

В системной функциональной лингвистике , лексика или лексический элемент является способ Называют конкретную вещь или тип явления. Поскольку лексика с системно-функциональной точки зрения является способом вызова, она может быть реализована с помощью нескольких грамматических слов, таких как «Белый дом», «Нью-Йорк» или «сердечный приступ». Более того, поскольку лексика - это способ вызова, разные слова, такие как ребенок , дети , ребенок и дети, могут представлять один и тот же лексический элемент.

Лексические группы

Лексическая группировка может быть:

  • Формульный: основан на частично фиксированных выражениях и весьма вероятных словосочетаниях.
  • Идиоматический : он следует соглашениям и шаблонам для использования
  • Метафора : такие понятия, как время и деньги , бизнес и секс , системы и вода , имеют большую часть одного и того же словаря.
  • Грамматический : использует правила, основанные на выборке лексического корпуса.
  • Зависит от регистра: одно и то же слово используется по-разному и / или реже в разных контекстах.

Основная область исследований, психолингвистика и нейролингвистика , включает вопрос о том, как слова извлекаются из ментального лексического корпуса при онлайн-обработке и производстве языков. Например, когортная модель пытается описать лексический поиск в терминах посегментной активации конкурирующих лексических статей.

Формульный язык

В последние годы составление языковых баз данных с использованием реальных образцов речи и письма позволило исследователям по-новому взглянуть на состав языков. Среди прочего, статистические методы исследования позволяют получить надежное представление о том, как взаимодействуют слова. Наиболее интересные открытия были сделаны в дихотомии между использованием языка (как используется язык) и использованием языка (как язык может быть использован).

Использование языка показывает, какие вхождения слов и их партнеров наиболее вероятны. Главный вывод этого исследования заключается в том, что пользователи языка в очень большой степени полагаются на готовые языковые « лексические блоки », которые можно легко комбинировать в предложения. Это избавляет говорящего от необходимости грамматически анализировать каждое предложение, но эффективно справляется с ситуацией. Типичные примеры включают «Я понимаю, что вы имеете в виду» или «Не могли бы вы передать мне ...» или «Недавние исследования показывают, что ...»

С другой стороны, использование языка - это то, что происходит, когда готовые куски не удовлетворяют насущным потребностям говорящего; Другими словами, вот-вот будет сформировано новое предложение, и его нужно проанализировать на правильность. Носители языка усвоили правила грамматики, что позволяет им определять жизнеспособность новых предложений. Использование языка можно определить как запасной вариант, когда все другие варианты исчерпаны.

Контекст и сопутствующий текст

При статистическом анализе структуры языка полезно начать с часто встречающихся контекстных слов или так называемых ключевых слов в контексте (KWIC). После того, как миллионы образцов устной и письменной речи были сохранены в базе данных, эти KWIC могут быть отсортированы и проанализированы на предмет их совместного текста или слов, которые обычно встречаются вместе с ними. Ценные принципы, с помощью которых можно анализировать KWIC, включают:

  • Словосочетание : слова и их совместное употребление (примеры включают «удовлетворить потребности» и «отступить»).
  • Семантическая просодия : коннотационные слова несут («обратите внимание» может быть нейтральным или возражающим, например, когда учитель говорит ученику: «Обратите внимание!»
  • Сопоставление : грамматика, которую используют слова (в то время как «я надеюсь, что это вам подходит» звучит естественно, «я надеюсь, что это вам подходит» - нет).
  • Регистр : стиль текста, в котором используется слово («Президент клянется поддерживать союзников», скорее всего, встречается в заголовках новостей, тогда как «клятвы» в речи, скорее всего, относятся к «бракам»; в письменной форме глагол «клятва» используется скорее всего используется как «обещание»).

После того, как данные собраны, их можно отсортировать, чтобы определить вероятность одновременного появления. Один из распространенных и хорошо известных способов - согласование : KWIC центрирован и показан с десятками примеров его использования, как в примере для «возможности» ниже.

Соответствие возможности

   То, что тебя наденут, выглядит реальной возможностью. Теперь, когда Бенн больше не
   Хиетт, говорит, что это остается реальной возможностью: как часть ООП, PLF
            - добавил Грэм. Это тоже возможно, - признал Уитлок.
          Всегда была возможна сильная боль. В начале века оба
  что, когда это возможно, любая другая возможность, включая выступления сторонних
    что мы можем, что мы используем любую возможность, включая любую возможность
  можно было сдавать отдельно. Другая возможность - "конструктивный вандализм".
  люди отвергают насилие, и возможность насилия может
 французы голосуют и теперь имеют возможность выиграть два места в
       немедленно расследовать возможность уголовного обвинения и что ее
   Источники из Шри-Ланки говорят, что возможность переговоров с тамильскими
 У шейхов тоже может быть возможность разжигания агитации.
   двенадцать государств-членов о возможности их угрозы
 Мари уже рассматривала возможность убедить [f]
 функция зависимости, но возможность капиталистического развития,
      были почти беззащитны. Возможность вторжения была очевидна
   как ни странно и беспокоит возможность употребления наркотиков, так сказать. Скажи им
 был впервые созван, чтобы обсудить возможность государственного переворота, чтобы вернуть
        в линии mi5 и в возможности использования состояния для размазывания
   Причиной этого шага была возможность появления нового рынка. Дешевые терминалы
    оцениваться индивидуально. Возможность генетического тестирования дает
   учитывая привилегию. Другая возможность, конечно, заключается в том, что прогулка
           Все это подрывает возможность экономических реформ и требует
    получать. (Знание об отсутствии возможности попытки коитуса требует
  который открыто цинично относился к возможности достижения социализма 5
     чтобы они могли осознать возможность быть гражданами, занятыми
    отравление и пожар, столкнувшись с возможностью собственной смерти, чтобы просто быть
        услышав вчера, что возможность использования агентства для сбора
  в 1903 году, и я не предвижу возможности его замены. Автомобиль мы
  здесь работает генетический фактор, и эта возможность поддерживается, по крайней мере, несколькими
     отказался даже допускать возможность того, что кто-либо из народов
  имеет долгую историю, есть вероятность, что недавний всплеск
      Полиция расследует возможность того, что ее видели непродолжительное время.
  любые врачи, которые думают, что есть вероятность, что они могли быть инфицированы
   в магазине, велика вероятность, что вы используете увлажняющий крем
          жить надо. Вероятность того, что молодой человек будет
 он завершил свой рассказ о возможности контрабанды наркотиков
 была посвящена изучению возможности того, что так называемые древние народы

После создания такого соответствия можно проанализировать совпадение других слов с KWIC. Это делается с помощью t-показателя . Если мы возьмем, например, слово «незнакомец» (сравнительное прилагательное и существительное), анализ t-балла предоставит нам такую ​​информацию, как частота слов в корпусе: такие слова, как «нет» и «кому», не удивительно часто встречаются. ; такого слова как «полемика» гораздо меньше. Затем он вычисляет вхождения этого слова вместе с KWIC (« совместная частота »), чтобы определить, является ли эта комбинация необычно распространенной, другими словами, встречается ли комбинация слов значительно чаще, чем можно было бы ожидать по одной только ее частоте. В таком случае это словосочетание считается сильным, и на него стоит обратить более пристальное внимание.

В этом примере «не чужой» - очень частое словосочетание; то же самое можно сказать о таких словах, как «таинственный», «красивый» и «темный». Это неудивительно. Однако более интересным является «полемика не привыкать». Однако, пожалуй, самый интересный пример - это идиоматический «совершенный незнакомец». Такое словосочетание невозможно предугадать само по себе, поскольку оно не означает «совершенный незнакомец», как нам следовало бы ожидать. Его необычно высокая частота показывает, что два слова сильно сочетаются друг с другом и как выражение очень идиоматичны.

Как показано выше, изучение корпусной лингвистики дает нам много информации о реальной природе языка. По сути, лексический корпус, кажется, построен на той предпосылке, что использование языка лучше всего рассматривать как процесс сборки , когда мозг связывает вместе готовые куски. Интуитивно это имеет смысл: это естественный способ облегчить бремя необходимости «заново изобретать колесо» каждый раз, когда мы говорим. Кроме того, использование хорошо известных выражений быстро передает массу информации, так как слушателю не нужно разбивать высказывание на составные части. В книге «Слова и правила» Стивен Пинкер показывает этот процесс в действии с правильными и неправильными глаголами: мы собираем первые, которые предоставляют нам правила, которые мы можем применить к неизвестным словам (например, окончание «‑ed» для глаголов прошедшего времени позволяет нам отклонить неологизм «погуглить» на «погуглить»). Другие шаблоны, неправильные глаголы, мы храним отдельно как уникальные элементы, которые нужно запомнить.

Метафора как организационный принцип лексики

Другой метод эффективного языкового хранения в лексическом корпусе включает использование метафоры как принципа хранения. («Хранилище» и «файлы» - хорошие примеры того, как человеческая память и память компьютера были связаны с одним и тем же словарем; так было не всегда). Работу Джорджа Лакоффа обычно называют краеугольным камнем в изучении метафор в языке. Один довольно распространенный пример: «время - деньги». Мы можем экономить, тратить и тратить зря время и деньги. Другой интересный пример связан с бизнесом и сексом: компании проникают на рынок, привлекают клиентов и обсуждают «управление взаимоотношениями». Бизнес - это тоже война: запустить рекламную кампанию, закрепиться на рынке (уже ставшая метафорой восхождения в военной сфере), понести убытки. Системы же - это вода: поток информации, переполненный людьми, поток транспорта. Теория лексического усвоения NOA утверждает, что фильтр метафорической сортировки помогает упростить языковое хранение и избежать перегрузки.

Грамматика

Компьютерные исследования показали, что от грамматики, в смысле ее способности создавать совершенно новый язык, по возможности избегают. Бибер и его команда, работающая в Университете Аризоны над Cobuild GSWE, отметили необычно высокую частоту связок слов, которые сами по себе лишены смысла. Но образец одного или двух быстро подсказывает их функцию: их можно вставить как грамматический клей без какого-либо предварительного анализа формы. Даже беглое наблюдение за примерами показывает, насколько они обычны во всех формах использования языка, но мы вряд ли осознаем их существование. Исследования показывают, что язык сильно изобилует такими связками во всех регистрах; два примера включают «вы хотите, чтобы я?», обычно встречающееся в устной речи, или «не было никакого существенного» в академических журналах. Собранные вместе в речи, они могут составить понятные предложения, такие как «Я не уверен» + «если они» + «они собираются» сформировать «Я не уверен, что они собираются». Такое предложение облегчает нагрузку на лексические элементы, поскольку не требует никакого грамматического анализа.

регистр

Британский лингвист Майкл К. Халлидей предлагает полезную дихотомию устной и письменной речи, которая на самом деле влечет за собой сдвиг парадигмы: в то время как лингвистическая теория постулирует превосходство разговорного языка над письменным (поскольку первый является источником, приходит естественным образом и, таким образом, предшествует первому языку). письменный язык) или письменный поверх устной (по тем же причинам: письменный язык является высшей формой рудиментарной речи), Халлидей утверждает, что это две совершенно разные сущности.

Он утверждает, что речь сложна с грамматической точки зрения, а письмо - лексически плотным. Другими словами, предложение вроде «мой двоюродный брат, тот, о котором я говорил на днях - тот, который живет в Хьюстоне, а не тот, что в Далласе - позвонил мне вчера, чтобы рассказать мне ту же самую историю о Мэри, которая ... "чаще всего встречается в разговоре, а не в заголовке газеты. «Премьер-министр клянется примирением», с другой стороны, было бы типичным заголовком новостей. Один более коммуникативный (разговорный), другой - более записывающий (письменный).

Работа Хэллидея предполагает нечто совершенно иное: язык ведет себя в регистрах . Biber et al. работая над LGSWE работал с четырьмя (они не являются исчерпывающими, просто примерными): беседа , литература , новости , академический . Эти четыре регистра четко выделяют различия в использовании языка, которые не будут ясны при "грамматическом" подходе. Неудивительно, что каждый регистр поддерживает использование разных слов и структур: в то время как, например, заголовки новостей грамматически просты, разговорные анекдоты полны лексических повторов. Однако лексика новостей может быть довольно плотной, так же как грамматика речи может быть невероятно сложной.

Смотрите также

использованная литература

Источники