Как создавалась виртуальная певица Алёна?

Недавно была выпущена песня «Навстречу счастью шагай!», совместно исполняемая китайскими и российскими виртуальными певцами. В песне российская виртуальная певица Алёна привлекла внимание многих посетителей Интернета своей внешностью, певческим голосом и обаятельной осанкой и танцевальными движениями.

Алёна разработана китайскими и российскими технологическими компаниями с использованием Искусственного Интеллекта, захвата движения, синтеза речи и ряда других передовых технологий.

Команда дизайнеров из российской технологической компании Маливар, ответственная за дизайн изображений и создание моделей Алёны, создала несколько эскизов с разными вариантами внешности и в последствии длительных обсуждений был выбран наиболее подходящий образ. «Её светло-русые волосы выдают славянское происхождение. Распахнутые глаза — открытость миру, а острые черты лица — знак интеллигентности и интеллекта. Алёна сдержанна, но, как молодая девушка, она рада новым людям и всегда готова к интересным приключениям», — сказал Валерий Шарипов, президент российской технологической компании Маливар.

Реалистичное изображение Алёны — это высокоточный (многополигональный) персонаж смоделированный в 3D, что требовало от команды дизайнеров стремиться к совершенству в каждом аспекте и основательно подходить к каждой детали. «Создание фотореалистичных героев — это сложный процесс: нужно создавать много корректирующих блендшейпов, например, отрисовывать состояния кистей рук, мимику лица и многое другое; прорабатывать текстуры кожи и другие небольшие, но отличительные, детали во внешности», — отметил Валерий Шарипов.

Алёна не только имеет внешность, неотличимую от реального человека, но и имеет собственный уникальный голос, который создан с помощью мощной интеллектуальной голосовой технологии. Китайская компания iFlytek отвечала за синтез голоса и создание голосовой базы виртуального персонажа. Генеральный директор iFlytek в сфере Consumer BG Гао Цзинвэнь сказала, что голосовая база Алёны имеет очень высокую эффективность. После ввода текста он может преобразоваться в голос Алёны в режиме реального времени. «Мы достигли впечатляющих результатов. Мы собрали лишь полчаса исходных звуковых данных Алёны. Используя голос Алёны в течение 30 минут, мы создали её голосовую базу. Такая технология значительно умешивает сложность формирования голосовой базы в будущем», — сказала Гао Цзинвэнь.

Говоря о многоязычной звуковой базе Алёны, Гао Цзинвэнь добавила, что в дополнение к русскому языку Алёна может говорить на китайском и английском языках. «На этот раз компания iFlytek разработала новую многоязычную унифицированную модель для Алёны, т. е. унифицировала систему многоязычных функций на входной стороне, реализовала обучение многоязычных данных внутри модели, в результате звуки на китайском, русском и других языках можно компоновать». Алёна не только может не просто говорить на многих языках. Её эмоции и тон весьма естественны. Это также связано с некоторыми исследованиями и улучшениями, внесёнными в формирование её звуковой базы.

Другие новости