Утау - Utau

UTAU
Utau-interface.png
Автор (ы) оригинала Амея / Аяме
Разработчики) Амея / Аяме
Первый выпуск Март 2008 г . ; 13 лет назад ( 2008-03 )
Стабильный выпуск
0.4.18 (e) (Windows); 1.0.0 b18 (Mac) / 5 сентября 2013 г . ; 8 лет назад ( 2013-09-05 )
Написано в VB6
Операционная система Windows 2000 / XP / Vista / 7/8/10
Mac OS X
Платформа Windows, Mac OS X
Доступно в Японский и английский (и другие языки через файлы исправлений)
Тип Приложение для музыкального синтезатора
(музыкальный секвенсор)
Лицензия Условно-бесплатная (пожертвования)
Веб-сайт здесь

UTAU - это приложение для японского певческого синтезатора, созданное Амейей / Аяме (飴 屋 / 菖蒲). Эта программа похожа на программное обеспечение VOCALOID , с той разницей, что она является условно-бесплатной, а не лицензируется третьей стороной.

Обзор

В марте 2008 года Ameya / Ayame выпустила UTAU, бесплатное условно-бесплатное программное обеспечение с расширенными инструментами поддержки, которое можно было бесплатно загрузить с основного веб-сайта. UTAU (歌 う), что в переводе с японского означает «петь», берет свое начало в деятельности «Jinriki Bōkaroido» (人力 ボ ー カ ロ イ ド, «Ручной вокалоид») , где люди редактируют существующую вокальную дорожку, извлекают фонемы, регулируют высоту тона и собирают их заново. создать певческий голос в стиле вокалоида . UTAU был первоначально создан, чтобы помочь этому процессу с использованием конкатенативного синтеза . UTAU может использовать файлы WAV, предоставленные пользователем, так что певческий голос может быть синтезирован путем введения текста песни и мелодии. Он поставляется с синтезатором голоса AQUEST « AquesTalk » для синтеза голосовых образцов голосового банка по умолчанию, Utane Uta (также по прозвищу Defoko ( Defoko, что на японском означает « Девушка по умолчанию» )) при первоначальном запуске UTAU, после чего генератор удаляется. Голоса, сделанные для программы UTAU, также официально называются "UTAU", хотя в просторечии они известны как "UTAUloids", отсылка к VOCALOID. В Японии их также называют «голосовыми банками» (более распространенными в англоязычных регионах) и «(голосовыми) библиотеками». Несметное количество голосовых банков было разработано независимыми пользователями. Эти голосовые банки обычно распространяются напрямую от их создателей через Интернет, но некоторые из них продаются как часть коммерческих проектов.

UTAU - это в основном японская программа, поэтому многие ее голоса созданы специально для японского языка. Однако количество доступных языков было расширено пользователями. Английский язык является обычным языком для пения UTAU. Хотя существует большое количество двуязычных UTAU, есть также многоязычные UTAU, которые могут петь на трех или более языках. Часто формат X-SAMPA используется для английских голосовых банков. Независимо от языка голоса, компьютер пользователя должен иметь японский язык или использовать AppLocale для запуска программного обеспечения. Большая часть документации на японском языке, но руководство пользователя переведено на английский. Интерфейс программы был переведен на английский компанией Ameya, другие переводы еще не завершены. Однако программе по-прежнему требуется поддержка японского текста.

Файлы проекта UTAU сохраняются с расширением ".ust" (Utau Sequence Text). Эти файлы могут свободно распространяться, что позволяет разным UTAU исполнять одно и то же произведение. Важно отметить рекомендации создателя UST в отношении распространения и использования .ust. Производители разработали несколько методов создания своих звуковых банков, и из-за этого результаты для голосовых банков различаются. UTAU также поддерживает формат MIDI и формат .vsq.

Амейя / Аяме добавили поддержку Unicode в неизданную новую версию UTAU, согласно скриншотам, опубликованным в Twitter. Соответствующий фиксированный регион хвостовой поддержки серверной части, а также несколько других кодировок аудио уже выпущены, в то время как поддержка внешнего интерфейса еще не выпущена по состоянию на сентябрь 2020 года. Ameya также обновила UTAU для обеспечения совместимости с 64-битными системами.

Конфигурация

Редактор может размещать ноты, вводить фонемы, а также изменять высоту и громкость пианино . В UTAU можно создать только одну дорожку, а ноты нельзя размещать друг на друге. По умолчанию на пианино отображаются только ноты, но настройки дисплея можно изменить, чтобы отображать кривую высоты тона, интенсивность громкости, огибающую и флаги. UTAU использует флаги для изменения аспектов голоса, таких как фильтры нижних и верхних частот, а также для уменьшения или добавления дыхания. Эти флаги различаются в зависимости от используемого ресамплера. Информация о партитуре и данные в голосовом банке обрабатываются ресэмплером и wavtool на основе оценки, созданной с помощью редактора. В одном файле .ust можно использовать только один ресамплер. Формантовый фильтр используется для управления изменениями качества голоса, который можно отключить.

Чтобы найти загружаемый аудиофайл, нужно сопоставить символы в заметке с именем аудиофайла в голосовой библиотеке. Однако файл prefix.map может изменить подпапку, из которой взят образец. Высота синтезированного голоса регулируется в соответствии с разницей между исходным звуковым файлом и высотой ноты в редакторе. UTAU использует формантные фильтры для предотвращения резких изменений качества голоса, которые можно отключить. Пакетная обработка используется для одновременного создания нескольких заметок. Во время этого процесса создаются файлы кеша. В зависимости от ресамплера количество файлов кэша может увеличиваться. В меню есть настройки для удаления файлов кеша при закрытии программы или по прошествии определенного времени.

Существуют встроенные плагины, которые могут автоматически объединять гласные, и настройки «Omakase / A la carte», которые могут добавлять автоматическую высоту тона и вибрато ко всему файлу. В программное обеспечение могут быть добавлены другие плагины, созданные пользователями, которые выполняют различные функции. Цвета редактора также можно изменить в файле setting.ini.

Голоса

Как упоминалось выше, файлы WAV можно переносить в UTAU. В одном голосовом банке могут быть сотни, а в некоторых случаях и тысячи таких файлов. Голоса можно установить, поместив их в папку «voice» или перетащив их на значок UTAU. Эти библиотеки также поставляются с файлом oto.ini, который определяет время и конфигурацию каждого семпла. При выводе звука из данных партитуры в редакторе программа использует файл oto.ini для установки времени и произношения. Файлы Oto.ini могут быть созданы с использованием графического интерфейса пользователя UTAU или стороннего программного обеспечения, созданного пользователями, наиболее известной из этих сторонних программ является SetParam. Таблицы частот (файлы .frq) используются для обработки сигнала при изменении высоты звука в редакторе. Некоторые ресамплеры используют другие типы файлов вместо .frq. Голоса также могут поставляться с файлами изображений, чаще всего в формате .bmp, и автономными голосовыми диалогами, как это делают некоторые вокалоиды . Они также часто включают файлы readme, которые содержат информацию о программном обеспечении и условия использования. Также часто включаются файлы с информацией о персонажах, обычно обозначаемые как character.txt, которые содержат информацию, которую можно просмотреть в разделе «Предварительный просмотр голоса» графического интерфейса пользователя, который помечает автора голосового банка, имя, образец файла, который будет воспроизводиться при нажатии кнопки "образец" и изображения Voicebank. Он также может содержать другие параметры, указанные создателем, например "жанр".

Некоторые голосовые группы являются односложными , что в совокупности называется «CV» (согласный-гласный), в то время как в других используются трифоны для получения более плавного звука. Эти трифонетические голосовые банки вместе именуются «VCV» (гласный-согласный-гласный). Это требует значительно больше времени и усилий (примерно в 7 раз больше, чем голосовой банк CV, с точки зрения строк в файле oto.ini), но дает более естественный результат.

Позже голоса UTAU будут включать фонемы, состоящие из гласных + согласных (VC), чтобы приспособиться к языкам, отличным от японского. Этот метод называется "CVVC", в котором фонема VC помещается между двумя фонемами CV. Два более редких метода записи голоса - это CVC, где одна фонема состоит из согласного-гласного-согласного и разделяется в программе с помощью oto.ini, и метод, называемый «рентан-дзюцу (れ ん た ん じ ゅ つ)», в который ряд слогов CV записывается в несколько файлов wav, чтобы создать более плавный результат, не прибегая к полному VCV.

Поскольку аудиофайлы являются независимыми файлами, их можно использовать в другом программном обеспечении, таком как DAW.

Разработка

Разработка UTAU началась, когда Ameya начала использовать Audacity для рекомбинации сэмплов других певцов и Melodyne для коррекции сэмплов и их наложения на музыку. Это действие называлось «ВОКАЛОИД, приводимый в движение человеком». LOLI.COM, музыкант, который отправил свою рэп-музыку Нико Нико Дуге, использовал свой собственный голос для вокалоида, работающего от человека, и выпустил программное обеспечение для редактирования аудио, которое могло помочь пользователям делать то же самое. Поскольку процесс создания «вокалоида с человеческим приводом» вручную потребовал значительного количества времени и усилий, Ameya начала разрабатывать новый инструмент, который помог бы в этом процессе.

Инструмент был анонсирован на Nico Nico Douga 11 января 2008 года. В то время можно было регулировать синхронизацию звука, изменять конверт ноты и генерировать пакетные файлы. 5 февраля 2008 года было выпущено видео, демонстрирующее графический интерфейс. Здесь можно было синхронизировать сэмплы, создавать файлы oto.ini и настраивать изменения высоты звука нот. 5 марта 2008 года видео, объясняющее спецификации программы, было выпущено на Нико Нико Дуга, а 15 марта 2008 года инструмент был переименован в UTAU.

Создатель был программистом по профессии, а не специалистом по вокальному синтезу, но использовал предыдущие знания для создания UTAU. После его выпуска Ameya продолжила улучшать UTAU и начала разрабатывать его в сотрудничестве с другими разработчиками преобразования текста в речь.

В июне 2008 года Ameya отказался от названия "Jinriki Bōkaroido" (人力 ボ ー カ ロ イ ド, Manual Vocaloid) для UTAU, назвав его программным обеспечением для синтеза голоса.

Аудио файлы и авторские права

Поскольку UTAU может создавать певческий голос, используя любые файлы WAV, можно взять голос существующего человека и использовать его в качестве данных. Часто у актеров, певцов и знаменитостей есть клипы с голосами, предназначенные для использования в UTAU. Создатель, Амея, однажды создал голос, используя данные с компакт-диска актера озвучивания.

В мае 2008 года Амея решила временно прекратить использование аудиоданных без разрешения, если только голосовой актер не разрешил это.

Культурное влияние

Хотя программное обеспечение очень популярно в Японии, его происхождение и культурное влияние обязаны уже установившейся популярности программного обеспечения Vocaloid. Сам UTAU был впервые прославлен, когда создатель Kasane Teto выпустил персонажа, изображающего из себя персонажа Vocaloid, как часть первоапрельской шутки. Влияние программного обеспечения Vocaloid также привело к тому, что обе программы обычно используются бок о бок. Часто популярные талисманы UTAU, такие как Kasane Teto, появляются в средствах массовой информации на основе вокалоидов, таких как Maker Hikōshiki Hatsune Mix или Hatsune Miku: Project DIVA .

Позже программное обеспечение UTAU будет иметь собственное влияние на Vocaloid и другие вокальные синтезаторы, причем ряд вокальных партий либо ссылается на UTAU, либо создается для движка с самого начала. Например, на Megurine Luka V4x повлиял вокал UTAU "Gahata Meiji". Уот из Crypton Future Media также поговорил с кем-то, хорошо знакомым с UTAU, и сказал, что беседа была «очень интересной». Макне Нана из серии Macne позже станет голосом UTAU и вокалоидом. Голосовой провайдер English Vocaloid Ruby , Миша, ранее выпустил японоязычный UTAU под названием Makune Hachi (MAKU 音 ハ チ). Кроме того, вокалистка Dex, Kenji-B, создала Kenji Baionoto (倍 音 音 ケ ン ジ) для UTAU, а AkiGlancy, вокалистка за партнершей Dex, Daina, дала свой голос UTAU под названием Namida (ナ ミ ダ) . Кикуко Иноуэ , озвучивающая Macne Coco White and Black (Mac 音 コ コ 白 ・ 黒) (см. Серию Macne ), озвучила продукт Vocaloid5 под именем Харуно Сора (桜 乃 そ ら). Продукт поставлялся с двумя голосовыми банками: «Естественный» и «Классный». После выпуска вокала Vocaloid 3 Tohoku Zunko , две ее сестры Tohoku Itako и Tohoku Kiritan получили вокал UTAU. Позже Киритан проведет краудфандинговую кампанию, чтобы она стала голосероидом .

Его главная привлекательность заключается не только в том, что он свободно распространяется в Интернете, но и в том, что он позволяет пользователю вставлять свой собственный голос в базу данных для использования в музыке, открывая пользователям двери для дальнейшего развития своей собственной музыки. UTAU обязана своей растущей популярностью своей способности предоставлять бесплатный метод создания голосов для использования в музыке и создала множество музыкальных продюсеров, работающих с программным обеспечением на таких сайтах, как Nico Nico Douga и YouTube . Пользователи также видят в нем альтернативу программному обеспечению Vocaloid, которое предлагает только более ограниченный набор голосов по дорогой цене и может не предлагать типы голоса, которые они ищут для музыки, поскольку большая база данных голосов часто имеет гораздо больше шансов. предложить голос, который они ищут. Однако, несмотря на количество предлагаемых голосовых банков, в целом с программным обеспечением работает гораздо меньше продюсеров, чем с Vocaloid.

Радиостанция установила часовую программу, в которой не было ничего, кроме Vocaloid и музыки на основе UTAU.

Кроме того, с 19.07.2012 регулярно проводилось мероприятие под названием «The UTAU M @ STER». Мероприятие представляло собой основное собрание групп или кружков и проходило по аналогии с мероприятием, связанным с вокалоидом "THE VOC @ LOID M @ STER", которое существовало с 2007 года.

Связанное программное обеспечение

В отличие от Vocaloid, файлы UTAU не являются ограничивающими, поскольку это не проприетарная лицензия. Следовательно, с программным обеспечением UTAU можно использовать лицензионные продукты с открытым исходным кодом, такие как продукты, выпущенные для серии Macne ( Mac 音 シ リ ー ズ) , выпущенные для программ Reason 4 и GarageBand . Эти продукты были проданы Act2 и, преобразовав их формат файлов, могли также работать с программой UTAU. Позже пакеты Macne Whisper ☆ Angel Sasayaki, Macne Nana 2S и Macne Petit 2S поставлялись с предварительно созданными голосовыми банками UTAU.

Голосовой банк по умолчанию «Defoko» (Uta Utane) заимствует ее голос из программного обеспечения AquesTalk, в частности голос «AquesTalk Female-1», созданный A-quest. Было дано разрешение на ее бесплатное распространение с программным обеспечением. Коэ Утане, «сестра» Уты, также позаимствовала свой голос из программного обеспечения AquesTalk. Namine Ritsu (波音 リ ツ), вокал, изначально созданный для UTAU, позже был добавлен в другое программное обеспечение под названием " Sinsy " как " Namine Ritsu S". Другой вокал, изначально разработанный для программного обеспечения UTAU, Yamine Renri (闇 音 レ ン リ), также позже был добавлен в другое программное обеспечение под названием « Synthesizer V ».

Из-за собственного соглашения об авторских правах на программное обеспечение, программное обеспечение с закрытой лицензией, такое как VOCALOID, не разрешается импортировать в программное обеспечение UTAU.

Пользователи программного обеспечения также разработали ряд подключаемых модулей для программного обеспечения, которые добавляют и улучшают вокал программного обеспечения.

Программное обеспечение "Sugarcape" , основанное на том же бесплатном программном обеспечении, что и UTAU, уже вошло в стадию бета-тестирования. 27 мая 2011 года была выпущена официальная версия UTAU для Mac под названием UTAU-Synth. Он имеет примерно те же функции, что и версия для Windows. Версия UTAU-Synth может импортировать как голоса, так и песни, созданные с помощью версии для Windows, но ее файлы проекта и конфигурации голосового банка не полностью совместимы с версией для Windows.

В конце 2017 года было упомянуто, что у Plogue Art et Technologie, Inc. есть работающая адаптация перенаправления, которая заставит вокал UTAU появиться в его движке Alter / Ego .

Использование в музыке

Лицензионные песни с альбома Graduation from Lie с участием Тето Касане были выпущены для скачивания с Karen-T под Crypton Future Media в качестве специального выпуска. Это первый лицензионный выпуск любого UTAU. Касане Тето известен исполнением «Ochame Kinou», песни, известной своей запоминающейся и бессмысленной лирикой. Момо Момоне также известна тем, что исполнила песню «Nyanyanyanyanyanyanya!», Изначально написанную daniwellP и исполненную вокалоидом Хацунэ Мику . Эта песня стала популярной благодаря видео на YouTube " Nyan Cat ".

Смотрите также

использованная литература

внешние ссылки